原创:辛束同学(公众号:一只辛束)
ChatGPT吸引了全世界的注意力,包括我。
近期向ChatGPT抛出了各类奇怪的问题,着实为它所产出的规范且标准的文本所折服,同时这个工具的使用又极其简单,让人不得不开始思考未来它将会如何影响我们的学习、工作、生活乃至社会的变革。
ChatGPT原理是什么?
关于ChatGPT的原理,《纽约客》上有一篇文章解释得很通俗,作者Ted Chiang用压缩算法来类比:假如你有一天要永远离开互联网了,你打算将互联网上的文本都复制一份压缩版,并将其存储在私人服务器上。但你的私人服务器上只剩下1%的空间,所以你无法使用无损压缩(lossless compression),那么你可以写一个有损压缩(lossy compression)的算法来将那些文本以特定的文件形式存储起来。这样一来,就此断网也显得没那么可怕。不过,问题在于,因为文本是被高度压缩的,你检索时将难以实现精准匹配,毕竟文字已不再是它们存储前的样子了。为解决这个问题,你创建了一个可以接受询问的问答平台来获取你想要的信息[2]。这也就类似于大语言模型的原理。
然而,需要注意的是,由于ChatGPT使用的是“有损文本压缩算法(lossy text-compression algorithms)”,我们通过其获得的并不是精确的原创文本序列,而是某种符合语法规则的近似值文本[2]。也就是说,ChatGPT更像是文本序列重组的游戏,它所产出的内容并非都是无可争议的事实。
图|ChatGPT
ChatGPT有什么厉害之处?
语言是人类最神秘又独特的现象之一,而如今ChatGPT竟对此驾轻就熟,让人既惊喜又忐忑。
ChatGPT对语言的熟练在于给人制造了一种交流感,正如OpenAI所称,“对话模式使得ChatGPT可以回答后续问题、承认错误、质疑不正确的前提、拒绝不恰当的请求[3]。”它以简单的对话框形式让无数人可以参与这场技术的狂欢。
一些人认为ChatGPT从根本上动摇了搜索引擎的机制。传统搜索引擎下,用户无法用自然语言的指令来执行相关需求,但ChatGPT却可以消化大段大段的话。当然,尽管这个机器人所呈现的回答里包含着我们想要的信息,但也有着太多的似是而非与含混不清,如何验证ChatGPT产出内容的准确性是值得关注的问题。
另外,我们也要意识到,ChatGPT并不是真的在聊天,它是一个一本正经的胡说八道的、有交互性的数据处理机器。因为它在改写而非引用原始文本信息,让我们恍惚间误以为它懂得自己在说什么,Ted Chiang对此现象解释为,“因为在人类教育里,死记硬背并不是拥有真才实学的表现,所以ChatGPT未能精确引用反倒让我们误以为它理解了学习内容[2]。”
ChatGPT有什么可能的影响?
-论文-
基于ChatGPT对自然语言的掌握,内容生成的诸多工作或许将消耗更少的劳动力,譬如广告文案、技术写作等等。
其中尤为受到冲击的是学校的论文作业。毕竟,这款工具实在是太适合代写论文了。我想如果我还没有毕业的话,大概率会在为论文抓耳挠腮的深夜,将那些素材丢给AI机器人来帮我处理。
关于检测ChatGPT的代写情况,Turnitin负责人工智能的副总裁说,“人工智能会用非常平均(average) 的方式写作,但人类都会或多或少偏离平均水平。所以,我们能够制造检测工具来寻找整篇文章都非常平均化的情况[4]。”
作为暂时不再写论文的局外人,我倾向于复旦大学一位老师的“打不过就加入”的态度。这位老师主张将ChatGPT作为教学工具之一,并且更关注学生的提问能力,“我无法辨别文章是机器写的还是人写的时候,说明这些文章已经没有存在的价值了[5]。”
技术发展所带来的颠覆未必全是悲观的,也可能是某种转变的契机。
-工作-
ChatGPT出现后,看到很多人感慨,“幸好ChatGPT不能背锅,否则要失业了。”的确,ChatGPT强大的内容生产力不免让相关行业的从业者感到了被威胁。一些工作在未来是否对人类有全然不同的意味,我们不得而知。
《大西洋月刊》上的一篇文章里有一个有趣的观点,“某个新发明会帮助人们节约劳动和提高效率,但人们也会花更多时间来为那项技术工作。”诸多发明都可以为此点提供论据支持:电子邮箱让人与人之间的沟通更加便捷,但我们也花费了更多时间来处理电子邮件;线上会议工具让人们可以在任何地方开会,而这也带来了更多会议。因此,虽然我们难以预测ChatGPT未来将在多大程度上解放劳动力,但它或许会让我们增加针对这项工具的新的管理制度,例如,作者在文中就提到了很重要的一点,“ChatGPT的出现会让人们来花时间来区分哪些工作是AI生产的,哪些是人类创造的[1]。”
-写作-
前文提到,AI机器人会采用非常平均的方式来写作,当其运用到写代码或写报告上有很大用处,但它是否会更利于人类创作原创作品呢?
Ted Chiang对这一点全然持反对态度,且认为拿ChatGPT产出的内容来作为创作起点并不是一个好办法。关于写作,Ted Chiang在原文中有一些令我非常动容的表述:”如果你是一位作者,在你写原创的东西之前,你其实会写大量的非原创内容。在非原创作品上的花费时间和精力并不能称之为浪费,相反,我认为这样更能让你最终创造出某种原创的东西来。““大语言模型的产出和人类作者的初稿不同,这只是一种表面的不相似。你写下的初稿并不是清晰表达的非原创想法,而是表达方式欠缺的原创想法,并伴随着你的无从安放的不满、对你写下的和你想写的差距的意识。这是指导你重写的东西,这也是你用AI来生成最初的文本所欠缺的东西[2]。”
某次我选取自己的一条微博放在ChatGPT上,并让它仿写。不出意外,它某种程度上写得比我好多了,同义替换的运用、自发补充为三段式的结构,十分精妙。然而,我觉得写作本身固然关乎语言的准确、严谨、优美,但也关乎灵感、温情。那些最动人的篇章从来都不是一蹴而就,有时是脑海里突然闪现的灵感,有时是面向特定人群自然流露的真情。或许这也是写作的真正魅力。
一篇文章全是金句反而令人觉得有些枯燥,恰恰因为不是绝对正确和绝对完美,我们才愈加珍视局限所带来的琐碎与踏实。我想,这也是人与AI的分野,是人之所以为人的脆弱和张力。
图|ChatGPT
Reference
[1] Bogost, I. (2023). ChatGPT Is about to Dump More Work on Everyone.
[2] Chiang, T. (2023). ChatGPT Is a Blurry JPEG of the Web.
[3] The Guardian. (2023). AI bot ChatGPT stuns academics with essay-writing skills and usability.
[4] VOA NEWS. (2023). Schools Ban ChatGPT amid Fears of Artificial Intelligence-Assisted Cheating.
[5] 《人物》. (2023). 「打不过,就加入」,我和ChatGPT的故事。.