【导读】ChatGPT版必应对一些网友已经开放测试了,综合大家的反馈,总的来说就是——它很强。
小编还在waiting list上望眼欲穿地苦等,但是幸运的人已经有必应的内测资格了!
话不多说,下面上一波国内外网友的测评。
知友测评
知友「ccskai」表示,相对于ChatGPT,新必应响应速度真的太快了,汉字刷刷地出,几乎不卡壳。
其次在引用上,相对于ChatGPT,必应的AI会去搜索网页,然后总结网页的内容给出答案。这样,在信息的时效性上,必应就比ChatGPT领先了不少。
要求他将文章改成某种风格,它会先去搜某种风格怎么改,然后他自己再改。
能看懂「月色真美,适合刺猹」,这个必应厉害了。
图源:ccskai
不同于ChatGPT的没主见,必应AI在坚持观点方面做得很好。
图源:ccxkai
当被「ccskai」突然表白时,必应受宠若惊,使用了大量的流汗黄豆(大概是中文数据集的特色吧😅)。可以脑补一下日本动漫中那种羞涩挠头说着「いやあ~いやあ~」的男生。
OMG,这也太会卖萌了吧……
知友「hez2010」发现,必应配合Edge的网页上下文理解能力太强了。
图源:hez2010
它不仅推测出了正确的label,还知道如何使用GitHub搜索来筛选,让网友大呼震撼。
图源:hez2010
「知友钛科闹了技Tech」表示,新必应相比于之前ChatGPT有两个很恐怖的提升:
1.接入网络了,可以获取实时信息
2.可以通过我的提示和网络上的消息来自我验证,还能看到纠错后的正确结果
所以再用一段时间,训练多了,反馈多了,准确率会越来越高。
「钛科闹了技Tech」问了必应「Time获得了中国星际有史以来第一个冠军」这个消息,必应并不知道。
图源:钛科闹了技Tech
可以看出,必应虽然联网了,但对最新消息的收录仍有一定的门槛。但是,它可以纠错了。
下图可以看出,必应的纠错能力很强大。
图源:钛科闹了技Tech
「知友钛科闹了技Tech」问了必应一个他自己都存疑的内容。
图源:钛科闹了技Tech
结果必然居然正面回答了,「知友钛科闹了技Tech」当场表示:「它带给我的震撼已经无可言表……」
图源:钛科闹了技Tech
知友「永遇乐」也说,「体验有点恐怖。本来以为只是简单的给bing加个chatgpt访问借口,没想到是直接汇总你问题的查询结果,以人话给你说明并标记参考资料。这比普通搜索或不知道信息来源的原生ChatGPT强多了。」
随便问个问题,都可以直接查看答案信息来源(图源:永遇乐)
答主「幽幽夜」表示,新必应比起ChatGPT更快、更稳定。
写的代码段质量很高,还可以自动解析代码内容。
图源:幽幽夜
以后用ChatGPT和不用ChatGPT的程序员,或许效率会有天壤之别了。
图源:幽幽夜
新必应vs.ChatGPT
下面,咱们来看看一位外国网友的测评。他把新必应和ChatGPT、老必应、谷歌、Bard都做了一番全方位的比较。
众所周知,ChatGPT的训练数据只有2021年之前的。
而新必应不仅可以访问网页和最新的数据,同时还能在结果中给出参考资料的来源。
举个例子,你要是问ChatGPT推特的现任CEO是谁,它肯定答不上来。但新必应就可以脱口而出。
此外,新必应还将搜索提示一并加到了聊天框和精选摘要里。
不管用户点击哪一个,都可以体验到更具沉浸感的聊天体验。
新必应vs.老必应
新必应与老必应的核心搜索结果实际上是相同的,唯一的区别是聊天机器人的存在。
过去的十几年,必应的目标是让核心搜索结果达到谷歌的标准。但在这之前,必应需要改进的地方还有很多。
尤其在广告方面,微软这些为了年确保收益采用了太多的「黑科技」。
具体而言,老必应存在有3个核心问题:
-
广告数量过多:必应会在搜索结果中展示5个广告,而谷歌最多是4个。
-
广告差异极小:必应故意将搜索结果之间的差异做得很小,用户难以区分词条之间的差别,很可能会意外点中广告。
-
EMD权重过大:不可否认,搜索结果中必应给予精确匹配占比很大,可以说已经到了泛滥的地步。
而新必应在AI的加持下,看起来确实更具吸引力。
当然,目前这个功能还存在一些bug。
比如下面就是没有被触发时候的样子——AI就是把其中一个结果「框起来」了而已。
新必应vs.谷歌
以必应现在的市场份额,即便是搜索结果有了AI的加持,也远不足以推翻谷歌的地位。
然而,万万没想到到的是,谷歌在首次发布Bard时,就打了自己的脸。
注意看,Bard的其中一个回复是「JWST拍摄了我们太阳系以外的行星的第一批照片」,然而这并不准确。
实际上,有史以来第一张关于太阳系以外的行星,也就是系外行星的照片,是在2004年由智利的甚大射电望远镜(Very Large Array, VLA)拍摄的。
这颗系外行星被称为2M1207b,大小约为木星的五倍,位于离地球约170光年处。
是的,正如新必应给出的结果所说的那样。
显然,在目前的形式下,新必应的确有能力从谷歌手里夺走一些潜在的流量。
新必应vs.Bard
谷歌发布的Bard,其重点是在于有NORA(没有一个正确答案)的查询,这似乎与新必应使用的方法不同。
在发布会上,谷歌重点强调了Bard在处理NORA(没有一个正确答案)问题时的能力。
在谷歌给出的示例中,Bard提到最好的星座是猎户座、仙后座、大熊座和飞马座。
而新必应则详细介绍了一组不同的建议,包括金牛座、剑鱼座,以及其他几个谷歌没有提到的星座。
至于哪个答案「更好」,基本上全凭大家都主观判断,不过从传统搜索的使用体验上来看,谷歌通常会更胜一筹。
总结一下:
-
新必应有近乎实时(有延迟)的网络访问,可以找到ChatGPT没见过的数据。
-
新必应并没有取代精选摘要等SERP功能,而是将聊天功能作为一个扩展。在部分情况下,新必应会提供「双倍」的答案,让页面显得非常混乱。
-
老必应还有很长的路要走,毕竟有很多阻碍着它与谷歌竞争的问题,至今都还没得到解决。
-
在Bard给出的建议里,谷歌并没有给出作为参考的信息来源,而新必应则有大量的链接可供用户点击。
目前来说,虽然在搜索引擎中加入由AI驱动的聊天结果这件事还处于初期阶段,但进展迅速。
而这些变化对传统搜索所产生的影响,也不一定是负面的。
毕竟,每隔几年都会有人提出这样那样的担忧,但搜索行业却仍在快速地增长。
参考资料:
https://www.zhihu.com/question/583588366
https://dkb.blog/p/bing-ai-cant-be-trusted
https://brodieclark.com/new-bing-review/
特别鸣谢:
「ccxkai」https://www.zhihu.com/question/583588366/answer/2889780355
「钛科闹了技Tech」https://www.zhihu.com/question/583588366/answer/2891347604
「hez2010」https://www.zhihu.com/question/583588366/answer/2892199436
「永遇乐」
https://www.zhihu.com/question/583588366/answer/2892200163