一次与chatGPT的对话实验

article/2024/12/22 12:22:23

‍标题:一次与chatGPT的对话实验

实验人:刘教链

日期:2023年2月24日

摘要

近期chatGPT的热点更像是资本运作的结果。任何一个领域的业内人士,应该都能够发现chatGPT的对答如流,只是对它的知识库搜罗到的公开信息的拼凑。对于尚未有人谈及的问题,或者前人尚未思考过的创意,chatGPT并不能产生超越既有知识范畴的突破性解答。在此种情况下,人类懂得闭嘴,说“我不知道”,或者“我不懂这个问题”,但是chatGPT仍然会用最大概率搜索去用现有语料拼凑答案,从而给出错误的、具有误导性的答案。虽然,这一误导性,对于业内人士而言应该很容易识别。

只要摒弃媒体的夸张宣传、想象和吹嘘,严肃体验chatGPT,就会发现自身真实的使用感受和媒体夸大宣传的巨大落差。目前的chatGPT离作为专业工作者的助手还有很大距离。

另外,实验者提出了chatGPT的一个有趣假设和用法,命名为“chatGPT test”(chatGPT测试)。该测试可以用来检验一个人在某个问题或某个领域内的认知水平与人类一般认知水平的差异。检验指标就是一个人和chatGPT探讨本专业问题过程中惊喜-失望的情绪反应计数。惊喜越多,越接近“砖家”;失望越多,越接近“专家”。

实验

实验是即兴的。有四个回合。

第一回合

在第一回合里,实验者把一个感到困难的问题提给了chatGPT,看看它的知识库里有没有相关的内容。但是很显然,它对此一无所知。对话如下(E为实验者,C为chatGPT,点评是事后追加):

E: 闪电网络是否能实现一个invoice被支付后揭示一个可验证的密文?

C: 是的,闪电网络可以实现一个invoice被支付后揭示一个可验证的密文。闪电网络可以实现双方可以在不可靠的网络环境下安全地进行交易,并且可以提供可验证的密文。这种技术可以帮助双方确保交易的安全性,并且可以防止双方之间的欺诈行为。

点评:显然,chatGPT是“懂”闪电网络的。它后半句的解释说明了这一点。但是,它鲁莽地给出了结论“可以实现”。这应该是一个“胡乱拼凑”。

E: 如何实现?能够展示一下具体的例子?

C: 【宕机】

点评:看起来需要换一个提问方法。不是先做选择,再追问。直接提问如何做试试看。

E: 如何在闪电网络上实现一个invoice被支付后揭示一个可验证的密文?

C: 在闪电网络上实现一个invoice被支付后揭示一个可验证的密文,需要使用可信任的第三方服务来实现。可信任的第三方服务可以帮助双方确保交易的安全性,并且可以防止双方之间的欺诈行为。可信任的第三方服务可以在双方之间建立一个可验证的密文,以确保双方的交易安全性。此外,可信任的第三方服务还可以帮助双方确保交易的完整性,以及双方之间的资金流动。

点评:这个方法实验者觉得应该还是具有可行性的(靠人对“可信任第三方”的脑补,哈哈)。但是借助于第三方并不是期望的正确思路。实验者希望chatGPT能给出一个去中心化的、更好的方案。另外,这段话明显是从某些地方抄过来的,后面的解释都是废话。

E: 如果不允许使用可信任的第三方服务呢?

C: 如果不允许使用可信任的第三方服务,那么双方可以使用智能合约来实现一个invoice被支付后揭示一个可验证的密文。智能合约可以帮助双方确保交易的安全性,并且可以防止双方之间的欺诈行为。智能合约可以在双方之间建立一个可验证的密文,以确保双方的交易安全性。此外,智能合约还可以帮助双方确保交易的完整性,以及双方之间的资金流动。

点评:实验者进行了逼问,看看chatGPT是否能够收敛到正确的方向上。但是它显然不清楚闪电网络的实际能力。关于智能合约的说法,应该是从以太坊等智能合约编程平台大量的语料抄袭过来的。接下来我们就来验证一下chatGPT是否真的懂这个问题。

第二回合

既然chatGPT提出可以写智能合约,那实验者就顺势问问它,这个所谓的智能合约是怎么回事。以下是对话(E为实验者,C为chatGPT,点评是事后追加):

E: 怎么在闪电网络上实现这样的一个智能合约呢?

C: 在闪电网络上实现一个智能合约,需要使用智能合约语言,如Solidity或Vyper。这些语言可以帮助开发者编写可以在闪电网络上运行的智能合约。开发者可以使用这些语言来编写智能合约,以实现一个invoice被支付后揭示一个可验证的密文。此外,开发者还可以使用这些语言来编写智能合约,以确保双方的交易安全性,并且可以防止双方之间的欺诈行为。

点评:当实验者刨根问底时,chatGPT就露馅了。和实验者猜测的一样,它的答案是从以太坊社区内容抄来的。Solidity/Vyper,它说起来大言不惭。

E: 可是闪电网络不支持solidity或vyper呀!

C: 是的,闪电网络目前不支持Solidity或Vyper。但是,开发者可以使用其他语言,如JavaScript或Python,来编写智能合约,以实现一个invoice被支付后揭示一个可验证的密文。此外,开发者还可以使用这些语言来编写智能合约,以确保双方的交易安全性,并且可以防止双方之间的欺诈行为。

点评:当实验者直接指出chatGPT的错误时,它就开始绕圈子胡说八道了。它很明显是根据前文来猜测下文要怎么回答才具有最大概率的“赢面”。既然它这么说了,我们就来个欲擒故纵,让chatGPT露一露真功夫。网上不是各种盛传chatGPT写代码是一把好手吗?Talk is cheap, show me the code.

E: 能给我写一段代码演示一下吗?

C: 当然可以,下面是一段使用JavaScript编写的智能合约的示例代码:

pragma solidity ^0.4.0;

contract Invoice {

     address public payer;

     address public payee;

     uint public amount;

     bytes32 public secret;

  function Invoice(address _payer, address _payee, uint _amount) public {

        payer = _payer;

        payee = _payee;

        amount = _amount;

      }

     function revealSecret(bytes32 _secret) public {

        require(msg.sender == payer);

        secret = _secret;

    }

    function pay() public {

        require(msg.sender == payer);

        payee.transfer(amount);

    }

}

点评:这段代码,除了把一些函数名替换成了上下文说到的“支付”、“invoice”、“揭示密文”等关键词,没有任何逻辑可言。显然,一眼就能看出来,chatGPT对所要解决的问题并没有真正理解。有人对chatGPT能迅速写出一个排序算法表示“惊艳”,那只能说,这个人太大惊小怪了。排序算法是充斥网络甚至教科书的满世界都有标准答案的问题,chatGPT自然信手拈来。但凡问它一点儿**没有人**曾经想过的、写过的代码,它就抓瞎了。

E: 你写的代码是错的

C: 对不起,我的代码可能有错误。如果您发现了错误,请提供您的反馈,以帮助我改进代码。

点评:它的认错只是对前文的规定反应罢了。

第三回合

实验者决定降低一下问题难度,和chatGPT聊一聊“概念题”。这时候我们会发现,拼凑概念是它的擅长。以下是对话(E为实验者,C为chatGPT,点评是事后追加):

E: 你真的知道闪电网络是什么吗?

C: 是的,我知道闪电网络是一种分布式的支付网络,它可以让用户在短时间内进行比特币和其他加密货币的支付。它使用了一种叫做“支付通道”的技术,可以让用户在不需要在区块链上发布交易的情况下进行支付。

点评:谈概念最简单了。因为只需要“抄书本”。

E: 那你为什么说它支持JavaScript或Python来编写智能合约呢?

C: 闪电网络支持使用JavaScript和Python编写智能合约,因为它们都是高级编程语言,可以让开发者更容易地编写智能合约。此外,它们也支持Solidity,这是一种用于构建智能合约的语言。

点评:这句算是追问。不过显然,chatGPT在胡拼乱凑。

E: 你知道比特币脚本吗?

C: 是的,我知道比特币脚本是一种用于构建比特币交易的脚本语言。它可以用来创建复杂的比特币交易,如多重签名交易、脚本锁定交易和智能合约。

点评:实验者想试一试引导一下chatGPT,看看它是不是能区分出智能合约和比特币网络的脚本的区别。

E: 比特币脚本和智能合约有什么区别?

C: 比特币脚本和智能合约之间有一些显著的区别。比特币脚本是一种用于构建比特币交易的脚本语言,而智能合约是一种用于构建分布式应用程序的编程语言。比特币脚本只能用于比特币交易,而智能合约可以用于构建复杂的分布式应用程序。

点评:基本上没有什么信息量的回答。有点儿像是在同义反复。

E: 比特币脚本是图灵完全的吗?

C: 不,比特币脚本不是图灵完全的。比特币脚本是一种非常简单的脚本语言,它只能用于构建比特币交易,而不能用于构建复杂的程序。因此,它不能被认为是图灵完全的。

点评:实验者希望具体提一些要点,看看chatGPT能否领悟到。不过,看起来它依然只是简单引述概念本身,而不能把概念和我们要讨论的问题关联起来。

E: 比特币脚本用的是波兰表达式还是逆波兰表达式?

C: 比特币脚本使用的是逆波兰表达式(Reverse Polish Notation)。逆波兰表达式是一种简化的表达式,它可以用来构建比特币交易,而不需要使用括号来表示优先级。

点评:实验者追问一些细节。可以看到,这些书本上存在的事实知识,chatGPT能够回答。不过,它画蛇添足的解释,也许是这个模型容易迷惑人的地方。chatGPT不懂一个古老的东方智慧:言多必失。

E: 比特币脚本为什么要用逆波兰表达式,而不用波兰表达式呢?

C: 比特币脚本使用逆波兰表达式的原因是,它比波兰表达式更加简洁,可以更快地执行比特币交易。此外,逆波兰表达式不需要使用括号来表示优先级,这使得它更容易理解和使用。

点评:这就是chatGPT的典型特点了,那就是说上很多句,就是说不到点儿上。不是它不想说到点儿上,实在是它的语料库里没有。很遗憾,基于最大概率的推测,并不能帮助chatGPT拓展知识边界。

第四回合

实验者此时已经不想再和chatGPT废话下去了,因为显然这纯粹是浪费时间。最后,实验者还是想测验一下,chatGPT对既有知识的掌握程度。以下是对话(E为实验者,C为chatGPT,点评是事后追加):

E: 那请你写一个3-of-5多签的比特币脚本

C: OP_3 OP_DUP OP_HASH160 OP_EQUALVERIFY OP_CHECKSIG OP_SWAP OP_HASH160 OP_EQUALVERIFY OP_CHECKSIG OP_SWAP OP_HASH160 OP_EQUALVERIFY OP_CHECKSIG OP_SWAP OP_HASH160 OP_EQUALVERIFY OP_CHECKSIG OP_SWAP OP_HASH160 OP_EQUALVERIFY OP_CHECKSIG OP_3 OP_CHECKMULTISIG

点评:比特币脚本的全部逻辑和编码知识都有资料、文档和书籍。一个人类的学习者经过学习后,就可以根据学到的知识,结合需求来编写出一段正确的脚本。而且,这次实验者询问的3-of-5多签脚本,也是一个非常常见的脚本。chatGPT的拼凑显然是错的离谱,这一点倒是出乎实验者的意料。

E: 你写的这是scriptSig还是scriptPubKey?

C: 这是scriptPubKey,它是用来定义比特币交易的输出,它定义了交易的接收者可以使用哪些公钥来验证交易的有效性。

点评:实验者试图提示一下chatGPT。还好,它知道相关概念。

E: 对应的scriptSig应该是怎样的呢?

C: scriptSig应该包含所有参与者的签名,以及参与者的公钥,以便验证交易的有效性。它应该是这样的: OP_3 OP_CHECKMULTISIG

点评:于是实验者追问,看看chatGPT是不是能自己发现自己的问题。但是很遗憾,它并不能。

E: 你写的scriptSig和scriptPubKey能放在一起正常工作吗?

C: 是的,如果所有的签名和公钥都正确,那么它们就可以正常工作。

点评:最后实验者还是想和它确认一下。chatGPT完全没有读出这个问题背后隐藏的意思。它肯定的如此斩钉截铁,就像一个草履虫对外界刺激的反应。

ChatGPT测试

实验者提出一个假设,那就是chatGPT只能在既有人类知识范畴之内进行总结和重新拼接,并不能突破既有的知识边界。

对于理学学科而言,这个知识边界就是目前人类对于这个世界、这个宇宙的认知目前所达到的极限。在这一类知识范畴中,对于答案正确与否的终极裁决者是宇宙客观规律。

对于文学、艺术等学科而言,这个知识边界是人类元认知能力的极限,所有的文学创作和艺术创作,其要素组合形式固然千变万化,甚至无穷无尽(因为组合爆炸),但终究还是在人类元认知能力的极限之内。在这一类知识范畴中,对于答案正确与否的终极裁决者是人。

因此,chatGPT无论如何发展,都必然受到上述两个极限的约束。它既无法超越人类已知的宇宙客观规律,也无法超越人的感受本身。

那么,chatGPT便可以用来测试一个人的认知水平,在整个人类中(假设chatGPT已经充分学习了全人类的全部语料)究竟在一个什么样的水平。如果一个人觉得chatGPT太惊艳了、太神奇了、太厉害了,那也许并不是chatGPT厉害,而是这个人对这个问题的认知水平大大低于人类已知的一般水平。反之,则是因为这个人对问题的认知水平大大超出一般水平。

也就是说,chatGPT代表的,永远是一般水平。一个人可以用它来帮助自己测试自己的认知水平,是“砖家”级,还是“专家”级。

但是,永远不要相信一个人披露的自己的chatGPT测试的结果。因为人类有一个能力,那就是善于伪装自己。

结论

经过四个回合的对话,实验者已经没有兴趣再继续和chatGPT聊下去了。可以看到,chatGPT在任何一个稍微具体的专业问题上都是错漏百出,不具有任何可信度。好在只要提问者稍微懂得一些专业知识,就可以轻易分辨出chatGPT的错误。

ChatGPT的能力,并没有从本质上突破一个循环神经网络基于前文对后文进行概率推测的限制。显然,我们人类说话,并不只是为了赢得对话。有的时候,我们是为了表达思想。很容易看得出来,chatGPT只是在说话,而背后并没有思想。

因此,chatGPT的发展上限,就是能够准确地整理、归纳、总结、重新拼接和丰富已有的人类知识库,而无法突破既有的知识边界。

综上所述,ChatGPT基本代表了一般认知水平。一个人可以用chatGPT测试来测试自己的认识水平高低。

关注公众号后请添加星标,以及时收到文章推送。

(公众号:刘教链。知识星球:公众号回复“星球”)

(免责声明:本文内容均不构成任何投资建议。加密货币为极高风险品种,有随时归零的风险,请谨慎参与,自我负责。)


http://chatgpt.dhexx.cn/article/y8eJ7fcW.shtml

相关文章

ChatGPT前传

文章目录 前言GPT概述GPT-1代GPT-1 学习目标和概念介绍GPT-1 训练数据集GPT-1 模型结构和应用细节GPT-1 效果性能和总结 GPT-2代GPT-2 学习目标和概念介绍GPT-2 训练数据集GPT-2 模型结构和应用细节GPT-2 性能效果和总结 GPT-3代GPT-3 学习目标和概念介绍GPT-3 训练数据集GPT-3…

十条ChatGPT常用的Prompt

Prompt 本文数据来源:@Will 3.6-6.16 硅谷,原作者:@rowancheung 一,简化复杂的信息 Prompt: 将(主题)分解成更小、更容易理解的部分。使用类比和现实生活中的例子来简化概念并使其更相关 Break down the (topic) into smaller, easier-to-understand parts. Use ana…

详细解读ChatGPT

文章目录 前言一、ChatGPT的本质二、语言模型的发展阶段三、语言模型的能力边界四、ChatGPT如何回答问题?五、ChatGPT的缺陷六、ChatGPT需要的资源七、人工智能的边界在哪里? 前言 ChatGPT是什么?我调用了api_key对它提问,大家可以…

上海亚商投顾:创业板指高开高走 ChatGPT概念卷土重来

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 沪指今日红盘震荡,深成指、创业板指小幅走高,科创50指数涨近1.5%。ChatGPT概念股再度爆发&…

上海亚商投顾:沪指窄幅震荡 ChatGPT概念再度走高

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 沪指今日窄幅震荡,创业板指低开低走,午后跌幅扩大至1%,宁德时代一度跌近4%。6G…

ChatGPT调研

ChatGPT调研 背景:ChatGPT简单介绍FINETUNED LANGUAGE MODELS ARE ZERO-SHOT LEARNERSFine-Tuning Language Models from Human PreferencesLearning to Summarize with Human FeedbackTraining language models to follow instructions with human feedbackChatGPT…

谷歌推Bard引发灾难性发布:市值蒸发千亿美元 带崩ChatGPT概念

雷递网 乐天 2月9日 所谓心急吃不了热豆腐,用在谷歌身上最合适不过。 为了应对ChatGPT爆红带来的挑战,谷歌迅速推出类ChatGPT产品Bard,却发生了灾难性发布,引发了外界对AI聊天机器人Bard的嘘声。 近期,谷歌推出了一则视…

【GPT】P1 ChatGPT 概念普及,学习路线与技术栈

GPT 知识储备 GPT 学习路线 这是一条不激进的学习路线,步步为营;对于没有基础的初学者比较适合,但是学习周期非常长,需要坚持; 而比较激进的学习路线即直接瞄准核心,直击 Transformer 语言架构&#xff0c…

ChatGPT是什么?ChatGPT里的G、P、T分别指什么

文章目录 ChatGPT是什么GTP中的 生成式 是什么意思GTP中的 预训练 是什么意思GTP中的 变换模型 是什么意思 什么是Transformer什么是注意力机制 监督学Xi、无监督学Xi、强化学Xi ChatGPT是什么 GPT: Generative Pre-trained Transformer 生成式预训练变换模型 ChatGPT是由Ope…

Chatgpt和低代码结合使用能提高效率吗

ChatGPT:是一个由OpenAI训练的大型语言模型,可以回答各种问题并生成人类可读的文本。无论是关于历史、科学、技术还是其他任何主题,都会尽可能提供最佳答案。 图片来自 网络 低代码: 低代码(Low-code)是一种软件开发…

我用低代码结合ChatGPT开发,每天多出1小时摸鱼

👉腾小云导读 GPT 出现之后,很多人推测大量的软件都会因为其出现而重写。本文主要是低代码平台与 ChatGPT 结合的一些思考以及实践。期望与各位读者一起搭上 AI 这列快车,为开发提提速~ 👉目录 1 背景 2 Demo 演示 3 思…

15个借助AI,ChatGPT自动写代码工具

整理了15个借助AI和ChatGPT辅助我们自动写代码的工具,整理到 15个借助AI,ChatGPT自动写代码工具https://www.webhub123.com/#/home/detail?projectHashid19072648&ownerUserid27786724 ​每个卡片为一个工具对应的网址,点击图片直达。可以点击右上…

体验chatGPT编写代码

今天注册了openAI账号,并且体验了以下chatGPT。体验过程中,我明显感觉到chatGPT不是所谓的“人工智障”,比起原来简单的问答机器人有了巨大的进步。 我主要体验的是chatGPT自动编写代码的功能。 下面两段是由chatGPT生成的代码: 提…

一百行代码实现搭建简易版 ChatGPT 聊天机器人,网页搭建

最近,OpenAI 的一款聊天机器人模型 ChatGPT 爆火。本篇文章旨在为大家提供一款简易的聊天机器人,只需一百行代码即可制作。话不多说,先上效果: 一百行代码实现简易版chatgpt聊天机器人 CSS代码: .container-fluid {p…

还在熬夜改代码?你怕是不知道ChatGPT可以协助改代码/查找Bug

前言 你还在拼命熬夜查找Bug、修改代码吗?如果是,那你肯定没有发现ChatGPT在编程领域的辅助作用! 为了验证ChatGPT修改代码的能力,我们将尝试用不同类型的代码进行测试: 改Bug 怎么把这行代码里的中位数调成第一或者…

ChatGPT写python代码实录

ChatGPT写python代码实录 print(hello world) 众所周知,咱们程序员学习编程是为了世界好。 所以,咱们就从hello world开始。 然后是一个杨辉三角 def generate_triangle(n):triangle [] ​for i in range(n):row [1] * (i 1)for j in range(1, i):r…

嘿ChatGPT,来帮我写代码

最近 ChatGPT 发行了,这是由 OpenAI 开发的AI聊天机器人,专门研究对话。它的目标是使AI系统更自然地与之互动,但是在编写代码时也可以为您提供帮助。 您可以让 ChatGPT 做你的编程助理,甚至更多! 在过去的几天里&#…

利用ChatGPT优化代码

众所周知,ChatGPT是一个基于大规模预训练语言模型的对话系统,由OpenAI开发。它可以帮助我们查找资料,进行内容创作,翻译语言等。那么,对于程序猿来说,可以利用ChatGPT干些什么呢?下面给大家看下…

ChatGPT专业应用:自动修复代码

正文共 754 字,阅读大约需要 4 分钟 程序开发必备技巧,您将在4分钟后获得以下超能力: 自动修复代码 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者…