百度文心一言,是中国版的ChatGPT吗?

article/2024/12/22 17:29:50

百度文心一言,是中国版的ChatGPT吗?

文心一言发布会网友评论

  • 百度在让人失望这件事上,从来没让人失望过!
  • 技术原理一句没有,商业价值滔滔不绝。
  • ChatGPT?CheatGPT!
  • 难怪暴跌,还没看两眼就困了,没话可以直播咬打火机,股票起码还能涨一点点。

哈喽,大家好,我是松露,一个不务正业但也不误正业非正经程序猿

3月16号,我看了百度文心一言的发布会,emm…怎么说呢?整场下来,我印象最深刻的就是李彦宏那身白衬衣白腰带白皮鞋

3月19日,我终于从朋友这里,获得了百度文心的内测机会。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kmgSdFeA-1679216294440)(http://oss-qiniu.kujiajia.xyz/image-20230319135029547.png)]

于是,我迫不及待的和文心一言展开了一场深(肤)刻(浅)的对话交流。

怎么说呢?这种感觉就像去看了一场国足比赛,就是你明明预测到了结局,但还是抱有着一丝期待

为了保持客官公正的态度,我从以下四个维度来分别测评:

  • 高质量文本生成
  • 逻辑推理计算
  • 代码编写能力
  • 多模态生成

如有小伙伴有更多想看的内容,也可以在评论区留言,我会在后面持续补充。

一、高质量文本生成

对于一个大语言模型,为用户提供有用和高质量的文本生成服务是最基本的能力。

无论是需要写文章、编故事、解释概念、提供建议或回答问题等,都需要生成高质量的文本。

下面,我们来看一下两款产品的测评。

在这里,我让他们来帮我生成一段吃烧烤的文案

这是文心一言的回答:

而这,是ChatGPT的回答。

明显可以看出来,无论是生成字数语言连贯性语句准确性,百度文心都没有给我一种眼前一亮的感觉,只能够说是中规中矩吧。我感觉是勉强能够及格的水平,毕竟它能够输出这样一段完整的话,就挺不错的了。

反观ChatGPT,它一开始出圈就是因为高质量的文本生成能力,这个我就不多说了, ChatGPT甚至还能帮你一本正经的写一篇胡编乱造的学术论文来,甚至连参考文献能够给你伪造出来。

所以说,结论一目了然。

二、逻辑推理计算

我们再来看一下,两款AI模型在逻辑推理计算上面的对比。

在百度文心的发布会上,李彦宏演示的是鸡兔同笼问题,这个问题太常规了,三年级小朋友都知道。

所以我就挑了几道,早期我给学生上课讲的逻辑推理题,看看它们的表现又是如何。

问题1:喝汽水问题

第一道题是数学计算问题,题目是这样的:

夏天到了,小卖铺开始搞优惠卖汽水。1 瓶汽水 1 元钱,但是 3 个空汽水瓶可以换 1 瓶汽水。小明现在有 10 元钱,那么他最多可以喝到几瓶汽水呢?

以下是ChatGPT的回答:

然后,这是文心一言的回答:

可以看出来,ChatGPT是理解了这道题的意思,然后也算出来了14瓶水(我在上课的时候,99%的同学算出来也是14瓶水),但是正确答案是15瓶水,少算了1瓶。

📢 注意

正确答案是15瓶水,这道题在最后有一个脑机急转弯思维在里面,欢迎大家可以在评论区留言讨论。

对于文心一言给出的答案,我只能说,还能够买半瓶水吗?这么明显的常识性错误。

而且,文心一言给出的计算方法也是不对的,可以看出,它并没有真正理解这道题的意思

问题2:称水问题

然后,我又问了一道世界500强面试经常会问的称水问题,题目是这样的:

假设有一个池塘,里面有无穷多的水。现有 2 个空水壶,容积分别为 5 升和 6 升。问题是如何只用这 2 个水壶从池塘里取得 3 升的水。

我们来看下ChatGPT的回答:

然后,这是百度文心的回答:

可以看出,ChatGPT生成的答案是完全正确的,虽然前面第1步和第2步重复了,但后面的逻辑和步骤都是正确的。

但是,文心一言给出的答案,确实是一派胡言啊,和答案完全没有一点关系。

问题3:职业问题

然后, 我又问了一道纯逻辑推理的问题,看看两款产品的逻辑推理能力如何。

题目是这样的:

小王、小张、小赵三个人是好朋友,他们中间其中一个人下海经商,一个人考上了重点大学,一个人参军了。此外他们还知道以下条件:

  • 小赵的年龄比士兵的大;
  • 小张的年龄比大学生大;
  • 小王的年龄和大学生的年龄不一样。

请问这三个人中谁是商人?谁是大学生?谁是士兵?

这是ChatGPT给出的回答:

这是文心一言给出的回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jwOygQiX-1679216298113)(null)]

两个模型最后给出的结果都是错的,但是他们错的地方不一样。

ChatGPT前面的推理都是正确的,只有在最后结论的时候出错了,导致最终答案是错的。

而文心一言,在第一句的推理,就是完全在胡说八道。

所以说,通过上面三道逻辑推理题,我们可以发现,ChatGPT无论是在计算还是逻辑的理解上,都远超于百度文心。但是,ChatGPT毕竟是生成式预训练模型,所以它的逻辑能力还是并没有达到非常高的水平,简单的逻辑推理是可以做的,对于稍微复杂的推理问题,ChatGPT就会在后面越说越离谱,最后也把自己给绕进去了。

三、代码编写能力

作为一款能让程序员失业的语言模型,我们来看看它们的代码水平如何。

我们分别让它们生成一个后端代码和静态网页,看看效果如何吧。

编写纯后端代码

我让它们写一个简单的排序算法。

这是ChatGPT给出的回答:

然后,我们来看看文心一言的答案:

它们采用的是不通过的算法,ChatGPT给出的冒泡排序,文心一言给出的是快速排序,两个都是常见的排序算法,所以说这一块没有太多可以对比的。

但是接下来,它们的区别就非常大了。

编写静态网页

然后,我让它们编写一个静态网页,这个网页能够实现MD5加密。

这是ChatGPT给出的回答:

这是文心一言给出的回答:

可以看出,百度文心一言给出的代码并不是前端代码,还是Node.js的后端代码。

然后,我把ChatGPT生成的代码保存成HTML文件后,用浏览器真的可以打开,而且也确实是我想要的效果。

所以说,文心一言是会写代码,但不多!看了文心一言的前端代码生成能力,我感觉我的前端岗位,起码还能够保住3~5年

而ChatGPT依托于Github这个宇宙第一的代码库平台,生成的代码质量也是很高的。

四、多模态生成

现在,文心一言的多模态生成模块,只能够画画、播放语言,但不能做视频。所以,我就对比了两款模型在AI图片生成方面的能力。

我让它们来帮我生成一个《孙悟空大战超人》的图片。

这是ChatGPT生成的图片:

这是文心一言生成的图片:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-72zK7TXm-1679216298122)(null)]

可以看出,文心一言并没有理解我的需求,我要的是《孙悟空大战超人》,而并不是《孙悟空和超人的结合体》。

总结

刚开始,我是满心期待百度能够一洗以往的「黑料」,为我们大众带来有价值的产品,这样也能够打破国外的技术壁垒。但是,在我使用下来后,我发觉可能我一开始的期望过高,导致现在挺失望。可转念一想,百度也算是国内第一个吃螃蟹的公司,率先发布的大语言模型,这份勇气也是值得称赞的。

因为,我们希望看到的在AI领域出现百花齐放的局面,而不是现在的ChatGPT一花独放。对于我们普通人来说,大厂之间的良性竞争和技术内卷,才有可能创造出普及大众的优秀产品。就像早期的小米手机,它的出现拉低了中国智能手机的市场价格

我记得很清楚,我刚上大学的时候,主流的是苹果和三星,而且手机价格都不低。国产品牌只有魅族和酷派在小打小闹,上不了台面,导致国内没有一款真正有竞争力的产品。直到小米手机上市,才真正带来了为我们消费者带来了性价比高的智能机,而性价比极大的提升了国产手机的竞争力

在小米以前,国产手机就是垃圾的代名词,人人都想着买外国牌子。自从小米1爆红后,消费者会把注意力转移到性价比更高的国产品牌上来,这也加速了智能手机的普及

所以说,对于百度文心一言的这次发布,虽然没有撼动ChatGPT在大语言模型市场的地位,但是作为国内第一个率先硬刚ChatGPT的互联网企业,已经领先了其他同行。对此,我们也多一点耐心、理解和信心。

希望未来有一天,我们能够用上谷歌、微软、苹果、百度、腾讯、阿里、字节…各大互联网大厂研发的便宜又好用的AI产品

写在最后

最后,有一点我想说,也是最近网络上一直热议的问题,那就是:人工智能如果导致就业减少,多余的人类应该如何生存?

以下是ChatGPT给出的回答:

这是一个复杂的问题,涉及到众多方面,包括政策、教育、文化等。以下是几种可能的解决方案:

  1. 转向人类需要的领域:随着自动化技术的发展,一些传统的工作岗位可能会被取代。因此,人们需要转向一些机器难以替代的领域,比如创造性行业、艺术、文化、教育等。这需要教育体系、社会文化和政策支持等多方面的努力。
  2. 重视职业培训和终身学习:人工智能技术的发展需要不断学习和更新知识。因此,人们需要注重职业培训和终身学习,以保持自己的竞争力和适应能力。政府可以提供相关的培训和补贴,帮助人们适应新的就业形势。
  3. 推动基本收入制度:基本收入制度是指政府给每个公民提供一定的收入,以保障人民的基本生活需求。这可以减轻部分人因就业岗位流失而面临的经济困难。不过这种制度需要政府的大力支持和社会的共识。
  4. 推动社会创新和创业:人工智能技术的发展也会催生新的商业模式和机会。政府可以通过支持创业、鼓励创新等方式,帮助人们创造新的就业机会和经济增长点。

总之,人工智能的发展对就业形势带来了一定的挑战,但也同时催生了新的机会和方向。我们需要采取多种措施来应对这一挑战,以保证人们的生存和发展。


http://chatgpt.dhexx.cn/article/OEr0t7nx.shtml

相关文章

不同问题来评测百度、谷歌、ChatGPT、Phind、GPT-4(持续更新)

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

ChatGPT爆火 百度急了

月活超1亿,对话机器人ChatGPT终于把火引向搜索引擎,谷歌、微软、百度开卷。 2月7日,火药味飙升:谷歌母公司Alphabet确认,将推“实验性对话式AI服务”Bard;微软举办发布会,直接推出了带有对话&a…

百度chatGPT chatgpt 程序员

ChatGPT作品展示: 可以使用Nginx反向代理,具体代码如下:server { listen 80; server_name www.example.com; location / { proxy_pass http://127.0.0.1:8080; } } 最近发现很多科技公司都在搞ChatGPT,我们普通网民没有技术也想体…

百度文心一言对标 ChatGPT,你怎么看?

文心一言 VS ChatGPT接受不完美 期待进步里程碑意义文心一言初体验✔ 文学创作✔ 商业文案创作✔ 数理逻辑推算✔ 中文理解✔ 多模态生成 写在最后 何为文心?“文”就是我们中华语言文字中的文,“心”是希望该语言模型可以用心的去理解语言,用…

百度版ChatGpt来了,真的太强大了!

今天突然发现百度官网的右上角多了一个【AI】的标志,点击图标后,居然直接进入了百度版ChatGpt。我也没有申请内侧什么的,应该是全部开放了吧,试了下一下感觉比ChatGpt的3.5模型要强大多了,跟4.0模型还是有一些差距的&a…

ChatGPT:百度文心一言畅想

国产“ChatGPT”扬帆启航。OpenAI的商业模式为API接口收费。我们认为此种商业模式具有“卡脖子”的风险,因此我国需要发展自主可控的“ChatGPT”。国产生态正在逐步繁荣,百度打响国产ChatGPT领域“第一枪”,其在算法、算力、数据、生态、平台…

开启收费模式,ChatGPT 试行 20 美元即享 Plus 体验,谷歌慌了!

整理 | 何苗 出品 | CSDN(ID:CSDNnews) OpenAI 在 1 月初就 “开始考虑如何使 ChatGPT 货币化”,近日,OpenAI 确实为 ChatGPT 推出了一个新的试点订阅计划,被称为 ChatGPT Plus,起价为每…

OpenAI收费标准,ChatGPT调用须知!

OpenAI收费标准,ChatGPT调用须知! 免费镜像站价格说明GPT4GPT3.5图片模型如何付费 免费镜像站 ChatGPT有很多镜像站,需要输入API-KEY才可以使用,镜像站不会进行收费,而是OpenAI会对您进行收费。本文主要说明OpenAI的收…

PHP - ChatGpt 学习 仅供参考

由于最近ChatGpt 大火,但是门槛来说是对于大家最头疼的环节, 由此ChatGpt 有一个API 可以仅供大伙对接 让我来说下资质: 1:首先要搞得到一个 ChatGpt 的账户, 会获得一个KEY,该key为访问API核心&#xff0…

【chatGPT】API 即将来临,GPT-3 不等同于chatGPT,chatGPT收费了?

今天的人工智能系统具有令人印象深刻但范围有限的能力。 似乎我们会不断削弱它们的限制,在极端情况下,它们几乎可以在每一项智力任务上达到人类的水平。 很难想象人类水平的人工智能能给社会带来多大的好处,同样也很难想象如果构建或使用不当…

收费!ChatGPT官方版API来了

来源:SegmentFault思否 3 月 2 日,OpenAI 在官方博客宣布,开放 ChatGPT 和 Whisper 的模型 API ,用户可将其集成在应用程序等产品中。ChatGPT API 价格为 1k tokens/$0.002,等于每输出 100 万个单词,价格才…

ChatGPT 可收费的那种产品该如何实现?一点尝试

导读|时隔两个月,勇哥终于把chatGPT生成SQL的功能发布上线了,支持统计分析查询、创建表、数据生成等多种全面的SQL DDL生成能力,本文就和大家聊聊相关功能的使用和背后实现逻辑,并希望相关功能能帮助大家在工作中提升一定的工作效…

S级秘术!指导ChatGPT训练一个神经网络的超详细「指令」来啦!

文|Posibilitee知乎编|CVer 这个话题有点超乎大多数人的理解。 步骤是这样的: 1.先让它伪装成Ubuntu 18.04,给它说你安装了Python 3.9, Pytorch 1.8, CUDA 11.3和其他训练一个pytorch模型所需要的库。 让ChatGPT伪装成Linux终端,这…

高效又稳定的ChatGPT大模型训练技巧总结,让训练事半功倍!

文|python 前言 近期,ChatGPT成为了全网热议的话题。ChatGPT是一种基于大规模语言模型技术(LLM, large language model)实现的人机对话工具。现在主流的大规模语言模型都采用Transformer网络,通过极大规模的…

训练自己的ChatGPT-OpenAI 微调模型

OpenAI终于下定决心——正式开放ChatGPT API! ChatGPT API地址:https://platform.openai.com/docs/guides/chat gpt-3.5-turbo的新模型 OpenAI正式打开了官方的ChatGPT API,为广大开发者打开了新的大门。 微调(Fine-tuning&…

ChatGPT客服系统产品-利用chatgpt训练企业知识开发个性化客服系统

打造最前沿的AI智能客服系统,基于自有数据语料,充分运用ChatGPT的大模型自然语言生成能力,定制化客服系统为企业提供自主性的客服服务能力。 ChatGPT如何革新智能客服? 根据当前ChatGPT的使用情况,我们发现未来中短期内…

如何将ChatGPT训练成某个领域的专家!附完整示例!

背景 最近听了 八叉的一个ChatGPT讲座,讲的是如何将ChatGPT训练成领域专家,这样我们就可以用它来解决该领域的各种问题。 整个讲座中最让我印象深刻的就是训练方法,它是通过让ChatGPT向我们提问,然后由我们给出答案的方式进行训…

DeepSpeed-Chat:最强ChatGPT训练框架,一键完成RLHF训练!

原文:百度安全验证https://baijiahao.baidu.com/s?id1762957756537641297&wfrspider&forpc 【新智元导读】微软开源的DeepSpeed Chat,让开发者实现了人手一个ChatGPT的梦想! 人手一个ChatGPT的梦想,就要实现了&#xff…

ChatGPT训练流程

图源:State of GPT - Microsoft Build 笔者翻译上图如下: 阶段子阶段目标备注Pre-Training--------语言建模Instruction Finetuning---------让模型能够理解自然语言指令RLHFReward Modeling奖励建模,用来代替人工打分,降低标注…

ChatGPT训练一次要耗多少电?

如果开个玩笑:问ChatGPT最大的贡献是什么? “我觉得它对全球变暖是有一定贡献的。”知名自然语言处理专家、计算机科学家吴军在4月接受某媒体采访时如是说。 随着ChatGPT引爆AIGC,国内外巨头纷纷推出自己的AI大模型,大家为人工智…