Page 21 - BP_202312
P. 21

在过去的20年里,随着“机                 们他们想听的方向上出错。                          然而,如果低质量的内容成
                   器学习”逐渐取代基于规则的系                        LLM也无法区分原创作品和                 倍增加,它可能会从高质量的内
                   统 , 该 领 域 经 历了 一 场 重 大 变          抄袭作品,而且经常写本身就是                    容中拉走一些点击量,从而导致
                   革。在这个新范式中,机器表现                    抄袭的文字(自己并不知情)。                    整个行业的预算削减和裁员。
                   得像是微型大脑模型(或者简单                        最后,这些模型缺乏独创能                      最后,虽然这些模型在处理
                   的“模型”)。模型可以通过摄                    力。它们输出的所有内容都是它                    文字方面很出色,但它们对解决
                   取数据并从中找到模式,学习执                    们过去遇到的某种文字版本,经                    恐怖谷问题无能为力——看起来
                   行某些任务。                            过微调使人们喜欢这些作品。                     几乎(但不完全)像人类的机器
                       这种方法类似于儿童的学习                                                    人实际上不如真正的人类或像机
                   方式,例如,给孩子足够多的猫                    LLM将如何用于新闻业                       器人一样的机器人有吸引力。
                   和狗的照片,儿童(和一个计算                        LLM对新闻业的影响已经显                     换句话说,新闻主播——我
                   机视觉模型)可以学习如何区分                    而易见,而且还将与日俱增。                     们在看新闻时实际看到的人——
                   狗和猫。                                  大多数情况下,我们看到它                  可能在未来几十年都是安全的。
                       最近,我们在机器学习的一                  们以三种方式使用:
                   个狭窄领域——自然语言处理,                        ●   取代背景调查(节省时间)              总结
                   看到了巨大的进步。首先是转换                        ●   在文章中填写不要求独创性                  A I的最新进展带来的最大
                   器模型的出现,现在是大型语言                    的特定段落/部分(例如,涉及过                   威胁是它们能够生成低质量的内
                   模型(LLM)的建立。                       去事件的历史)                           容 , 这 可 能 会 让 整 个互 联 网 看
                       大型语言模型(如GPT4)是                    ●    撰写不要求原创或真实的低             起来像你电子邮件帐户中的垃圾
                   在非常大的数据集(本质上是整                    质量内容——点击诱饵、廉价娱乐                   邮件文件夹。我们可能会看到争
                   个互联网)上训练的。他们能够                    新闻、哗众取宠的八卦新闻等等                    逐越来越少的点击量的垃圾内容
                   通过遵循在学习阶段摄入的(人                        第三个用例是我想重点关注                  越来越多,这将导致各级内容创
                   类书写的)文本中出现的模式,                    的,原因是它很可能在未来五年                    作(包括新闻业)的预算大幅削
                   生成看起来很自然的文本。                      内改变整个行业的进程。由于大                    减。
                       将G P T4大型语言模型吸收               多数内容都是通过广告变现的,                        低质量内容的创造者将会
                   入 聊 天 机 器 人 中, 我 们 得 到 了          而且大多数广告都是按点击或按                    受到影响,因为他们能够创造更
                   ChatGPT。                          观看付费的,因此点击诱饵及其                    多内容的能力意味着不需要太多
                                                     它形式的垃圾内容已经占据了互                    的人;高质量内容的创造者将受
                   LLM的优势和劣势                         联网的大部分。                           到影响,因为越来越少的人能够
                       LLM的训练方式使它们非常                     在这一过程中引入LLM将大                 在垃圾海洋中找到他们想要的内
                   擅长完成某些任务。它们能背诵                    大降低制作低质量内容的成本。                    容。
                   从莎士比亚到粒子物理杂志的所                    因此,我们可能会看到更多的垃                        我个人认为,减轻这种风险
                   有内容,并能释义、总结、解释                    圾内容被产生出来,与此同时,                    的唯一方法是开发基于AI的过滤
                   和说明整个人类知识库,这只有                    创造各种内容的人的工作机会减                    器,让读者过滤掉垃圾、标题党
                   世界级的专家才能做到。                       少了。                               及其它形式的低质量内容。这样
                       但是,这些模型无法区分                                                     的过滤器将有益于读者,也将有
                   真 正 的 知 识 和 完 全 无意 义 的 字          新闻业务的哪些部分是安全的                     益于那些想要创造读者真正能找
                   句,除非通过反馈过程教它们人                    (目前而言)                            到的高质量内容的记者。
                   们喜欢什么(以及什么是不真实                        真正的新闻工作需要调查、                      这就是为什么我个人致力于
                   的)。结果是,这些模型产生了                    思考、与他人互动以及写原创新                    开发这样一种系统,并成立了一
                   很多幻觉——而且通常在告诉人                    闻。ChatGPT不能做这些事情。                 个公益性公司,将其商业化。


                                                                                               《传播与制作》2023 年第 11/12 期  21
   16   17   18   19   20   21   22   23   24   25   26