复旦发布国内首个类ChatGPT模型!已开放内测申请,代码将于3月发布

article/2025/4/20 7:20:12
Pine 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

没想到,众人加班加点抢“中国版ChatGPT”热度时,首个国内类ChatGPT模型竟然已经发布了!

砸出这个重磅消息的,不是紧锣密鼓宣传的BAT大厂,也不是直接出手几亿的投资大V,而是这段时间来一直没吭气的复旦大学

事情一出,直接引爆了一众社交媒体,不仅在微博刷出数个热搜话题,知乎更是冲上热榜第一。

02147b5d6b4c5d86202c18b087df1d54.png

各路“ChatGPT爱好者”连夜赶来围观,甚至由于官网访问人数太多,服务器一度被挤爆,又上了一次热搜。

5e2011b63e38e6077d566a820b3a8a21.png

这是怎么回事?

原来,复旦NLP团队这个类ChatGPT模型,发布即面向公众进行内测,甚至连预告都没有:

90638ab0f98e8efad51c92bbc9cc5625.png

紧接着,团队又投下另一颗重磅炸弹:模型3月份就会开源代码

最关键的是模型的名字。

复旦团队用了《流浪地球》里面拥有自我意识的AI——MOSS来命名这一模型,直接把消息热度推上顶峰。

有网友表示,MOSS率先开放至少有一大优势,那就是“获得更多数据”:

ChatGPT有一个巨大的先发优势,就是通过抢先开始公测收集大量用户数据,并且这部分数据现阶段只有人家有。

算法都是成熟且公开的算法,真正的核心其实是数据和硬件。

0dcda3a511899acbeefeae434db210fd.png

说回模型本身。据MOSS自己介绍,它同样具备ChatGPT能实现的这些功能:

问答、文本翻译、摘要总结、故事撰写、情绪分析、建议提供、代码和算法编写等。

c46bbdb79f5c0cf4407ef3eaf5bb7539.gif

但实际测试效果又是如何,具体训练方法和效果会不会有什么差异?

我们一步步来看。

MOSS与ChatGPT相比效果如何?

据团队介绍,MOSS与ChatGPT主要有三大差异

0b25c1d429a21d240d8efe2b8c19b206.png

最主要的就是参数量的不同。MOSS模型的参数量比ChatGPT小了一个数量级。

然后是训练方式的不同。虽然MOSS也是自然语言模型基座训练+理解人类意图对话能力训练,但后者的训练方式与ChatGPT采用的RLHF不同。

复旦团队没有采取人工标注(指令微调)的方式来进行理解对话能力训练,而是基于与其他AI对话模型的交互来训练自己。

没错,相比人类调教,MOSS直接选择和其他AI模型进行对话……

最后是开放程度不同。ChatGPT背后模型目前还没有开源,但MOSS承诺会将代码开源。

说了这么多,MOSS的效果具体如何?

从官方给出示例来看,它问答和生成代码的能力似乎还不错。

在问答环节中,让MOSS列五部科幻片,分分钟就能给出(不过,《黑镜》好像是电视剧?):

8da20ecb6867c80a394367aae5e9ebe9.png

做表格的速度也非常快:

4709bb607d07d6d5940a285f2cae058d.png

在代码生成中,写个快速排序算法也没问题:

eddc55a4b5955d1804e693cda531dda3.png

与ChatGPT相比,MOSS的实测效果究竟如何呢?

知乎已经有匿名用户称已经拿到了内测资格,并实时更新了一波测试结果,我们将MOSS的回答与ChatGPT简单对比一下。

75840f0c5b81d6e8acc2ceb1e10f1967.png

第一轮,先来看看写文章的能力。

例如“帮忙写一下国家自然科学基金申请,杰青那种”,MOSS回答如下:

e9b344474a339a54f337bfde901a28b9.png

我们把问题拿给ChatGPT后,得到了这样的回答:

61ed8594c43fe0def6784062c7933bf3.png

第二轮,来看看写代码的能力。

d2336bf5ad01f9641a37d660353106e6.png

这是MOSS给出的代码实现:

完整代码:for(i=1:length(mat文件中的名字)){name = mat文件中的名字[i];data = {name};fprintf(‘%s,’,name);}end for

这是ChatGPT给出的代码与回答:

1ab82999b837b8cf7c457ed8e0b7b539.png

第三轮,测试一下算法题的效果。

MOSS给出了一个实现思路:

4bdca711916b9ca8788f6931d9ce00a4.png

ChatGPT则包办了代码和具体算法实现的流程:

7c74aef1a632bbd46d3a20e83d53c325.png

最后一轮,再来看看做数学题的能力。

0987b81a72fcf96c976afada21268544.png

不过从功能介绍来看,MOSS应该还不具备解数学题的能力,这个问题确实不一定能回答出来。

ChatGPT则列了个方程解决这个问题:

1f31c159b487c75ef0bee5b19de7228a.png

整体来看,MOSS虽然在算法题上表现出了一定的逻辑,但在包括写文章、做数学题等具体解决方案的提供上,还有待继续训练提升。

“只是想验证ChatGPT技术路线”

针对种种疑问,团队也在官网上做出了回应。

首先,是MOSS与ChatGPT的差距上。团队表示,目前它还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走:

我们一个实验室无法做出和ChatGPT能力相近的模型,只是想在百亿规模参数上探索和验证ChatGPT的技术路线。

接下来,是针对服务器被挤爆的回应:

我们没想到会引起这么大关注,计算资源不足以支持如此大访问量,向大家致以真诚的歉意。

最后还有关于命名MOSS的回应:

就像过去NLP领域的其他优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型。

d478a2825272936f03c07fd01b290cb1.png

此外,研究团队还在介绍网站中详细列出了MOSS的限制因素:

  • 训练数据中的多语言语料库有限;

  • 模型容量相对较小,不包含足够的世界知识;

  • 执行方式比较迂回,甚至不按照指示执行;

  • 可能会生产不道德或有害的内容;
    ……

总结下来,就是MOSS的回答不及ChatGPT就是因为它缺乏高质量的数据、计算资源以及模型容量

不过,有意思的是,团队表示,在这些问题里面MOSS的最大短板是中文水平不够高

a7d68ef720dc3a5edf002b6cd23c3572.png

具体来说,相较于英文问答能力,MOSS的中文问答水平要低很多,这也与前面提到的预训练模型学习数据量有关:

它的模型基座学习了3000多亿个英文单词,而互联网上的中文网页干扰信息如广告很多,清洗难度很大,导致中文词语只学了约300亿个

目前,复旦大学NLP实验室正在加紧推进中文语料的清洗工作,清洗后的高质量中文语料也将用于下一阶段模型训练。

当然,和ChatGPT相比,MOSS也不是“一无是处”(手动狗头),起码它会在3月份开源代码

79585ce4f27f6f2b3c9989c11e815231.png

而这一把也将会直接有效降低预训练语言模型的研发和应用门槛,属实是利好中小企业了,邱锡鹏教授也表示:

MOSS的计算量相对不那么大,中小企业都能用起来。

此外,研究团队对MOSS的“野心”似乎还不止于对话问答、写代码等这些ChatGPT拥有的功能。

在这次面向公众内测的同时,团队还透露出了MOSS的下一步计划:

结合复旦在人工智能和相关交叉学科的研究成果,赋予MOSS更多的能力,如绘图、语音、谱曲和教学,并加强它辅助科学家进行高效科研的能力等。

研究团队

MOSS是复旦大学自然语言处理实验室的成果,并且该项目还得到了上海人工智能实验室的支持。

研究团队由邱锡鹏带队,其余几位均为复旦大学NLP实验室的成员。

92f0cbd3bfa7a03de97a978523da561a.png

复旦大学自然语言处理实验室,是由复旦大学首席教授吴立德先生创建,是我国最早开展自然语言处理和信息检索研究的实验室之一。

18cc640a6f6b1f00aa27b584c57ddc94.png

目前实验室已经发表了大量高水平国际期刊和会议论文,其中包括中国计算机学会推荐的A/B类国际会议和期刊论文(ACL,SIGIR,IJCAI,AAAI,NIPS,ICML等)论文150余篇。

此外,复旦NLP实验室还发布了国内首家中文自然语言开源系统FudanNLP,被包括联合国教科文组织在内的国内外多家研发机构采用。

邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师,研究方向为自然语言处理、深度学习,发表CCF-A/B类论文70余篇。

cb6bb31dd098c2a10462b275aca0fdd7.png

他还主持开发了开源自然语言处理工具:FudanNLP 、FastNLP,获得了学术界和产业界的广泛使用。

对于复旦MOSS模型的发布,你的看法是?

参考链接:
[1] https://txsun1997.github.io/blogs/moss.html
[2] https://www.shobserver.com/staticsg/res/html/web/newsDetail.html?id=584634
[3] https://www.zhihu.com/question/585248111/answer/2903204899
[4] https://xpqiu.github.io/index.html

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”?最有竞争力和潜力的AIGC力量位于何方?

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术能够被大众看到。

b1c17cbf16a6b4ef72a338f105cbd2b1.png

点这里👇关注我,记得标星哦~


http://chatgpt.dhexx.cn/article/ihRGfgfp.shtml

相关文章

OpenAI发布ChatGPT:程序员瞬间不淡定了

OpenAI发布ChatGPT:程序员瞬间不淡定了 12月1日,OpenAI发布了针对对话场景优化的语言大模型ChatGPT。ChatGPT是InstructGPT的兄弟模型,可以以对话的形式与用户交互,这使得ChatGPT能够回答问题、承认错误、质疑假设、拒绝不当问题…

ChatGPT-4震撼发布

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于…

ChatGPT API使用介绍

1.概述 随着人工智能技术的不断发展,越来越多的AI产品被应用到各个领域,其中最具代表性的莫过于人工智能语言模型。语言模型是一种可以通过学习大量语言数据来预测文本或语音的技术,其应用范围十分广泛,如智能客服、机器翻译、语…

ChatGPT详细介绍原理

ChatGPT的介绍 ChatGPT全称为“chat Generative Pre-trained Transformer”,翻译成中文就是生成型预训练变换模型。它是美国公司OpenAl在2022年11月30日发布研发的聊天机器人程序,能用于问答、文本摘要生成、机器翻译、分类、代码生成和对话Al。「l是一…

ChatGPT探索系列之六:思考ChatGPT的未来发展趋势和挑战

文章目录 前言一、未来发展趋势1. ChatGPT重塑数据分析之道2. ChatGPT颠覆企业运用人工智能和机器学习的途径3. ChatGPT颠覆自动化商业流程4. ChatGPT引领企业决策迈向新纪元 二、ChatGPT掀开未来充满机遇和挑战的新篇章总结 前言 ChatGPT发展到目前,其实网上已经有…

ChatGPT 未来会造成大量职业的裁员和失业吗?

大家好,小编来为大家解答以下问题,一个有趣的事情,一个有趣的事情,今天让我们一起来看看吧! 1、chatGpt来自那个国家? ChatGPT是一种聊天机器人技术,它来自美国,由OpenAI公司开发。…

ChatGPT 未来会对游戏行业带来哪些影响?

ChatGPT的出现,为整个游戏行业带来了新的思考。 ChatGPT是由微软发布的一个大型语言模型,在被训练之后能够进行对话式文本生成,目前已在多个领域取得了不小的进展,包括聊天机器人、智能客服等。 作为一款大型语言模型&#xff0c…

程序员要失业了?风靡全网的ChatGPT,到底有什么厉害之处

最近ChatGPT非常火,小编也尝试了下,看下其具体能解决的问题。OpenAI发布的免费机器人对话模型ChatGPT,目前还是处于测试阶段。 用它自己的回答:ChatGPT是一个基于大型语言模型的聊天机器人。它使用自然语言处理技术,能…

(文末送18本ChatGPT扫盲书)从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

文末一口气赠书18本, 这次就让你high个够。 人工智能技术的发展已经逐渐改变了我们的生活和工作方式,其中,语言模型技术是近年来关注度很高的一个领域。在这个领域,ChatGPT是一个备受瞩目的产品,它不仅是一个聊天程序…

【文末送18本ChatGPT扫盲书】从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通…

ChatGPT未来会取代程序员吗?

前言 程序员更多的时间是在调试和修改代码,包括讨论需求同步信息等,然后才是写代码-时间占比最多也就是20%~30%左右,而更时间占比更多的80%左右需要程序员用独立思考能力和批判性思维进行工作,这是ChatGPT目前还做不到的地方。即…

ChatGPT是否会取代程序员:一场关于职业未来的讨论

ChatGPT是否会取代程序员: 一场关于职业未来的讨论 目录 ChatGPT是否会取代程序员: 一场关于职业未来的讨论导读一、ChatGPT简介二、ChatGPT的使用三、ChatGPT是否会取代程序员?四、观点与看法五、展望未来 导读 随着人工智能的迅猛发展,许多领域都受到…

OpenAI透露ChatGPT未来发展计划:要与人类价值保持一致

编|张倩、陈萍 源|机器之心 OpenAI 推出的 ChatGPT 非常强大,但依然存在一些问题,比如输出编造或带有偏见的内容、定制化程度低…… 在最新的一篇博客中,OpenAI 披露了他们未来的一些改进计划。 OpenAI 的使命是确保通…

ChatGPT商业前景如何?人工智能未来会如何发展?

ChatGPT不仅在互联网和多个行业引发人们的关注,在投资界还掀起了机构对人工智能领域的投资热潮。人工智能聊天程序ChatGPT在去年11月亮相之后,在推出仅两个月后,今年1月份的月活用户已达到了1亿,成为史上增长最快的消费者应用程序…

ChatGPT未来将是什么样子?《你好,ChatGPT》深度阐述

前言 人工智能技术的发展已经逐渐改变了我们的生活和工作方式,其中,语言模型技术是近年来关注度很高的一个领域。在这个领域,ChatGPT是一个备受瞩目的产品,它不仅是一个聊天程序,更是一个能够产生具有连贯性和逻辑性的…

ChatGPT 未来的前景以及发展趋势

当谈到ChatGPT的未来和发展趋势时,需要考虑人工智能技术以及文本生成和交互的迅速发展。在这方面,ChatGPT的前景非常有希望,因为它是一种迄今为止最先进的人工智能技术之一。 ChatGPT是一种基于机器学习的自然语言处理技术,它能够…

ChatGPT是未来吗?

ChatGPT自2022年11月份发布以来,获得了很多关注,最近GPT-4、文心一言陆续发布,也让大家有了更多的感受。这次再重新审视一下ChatGPT,谈谈未来到底是怎样的。 先拿出来ChatGPT官网对自己的一些说明: ChatGPT面临的主要…

从一路高歌到遭多国“封杀”,ChatGPT未来将是什么样子?

“IT有得聊”是机械工业出版社旗下IT专业资讯和服务平台,致力于帮助读者在广义的IT领域里,掌握更专业、更实用的知识与技能,快速提升职场竞争力。 点击蓝色微信名可快速关注我们! 人工智能技术的发展已经逐渐改变了我们的生活和工作方式&…

ChatGPT体验感受

对话人机 ------ 从Wechat 到 We chat with GPT 声明:本文未教授如何注册的ChatGPT, 仅记录与该语言模型的对话 文章目录 对话人机------ 从Wechat 到 We chat with GPT什么是ChatGPT?如何使用ChatGPT?错误的使用姿势正确的使用姿势另辟蹊径 Good news! 更多内容请看文末另…

“ChatGPT 互动体验:我做了一个可以在线使用的网站“

ChatGPT是什么? ChatGPT本质是一个应用在对话场景的语言模型,基于GPT3.5通过人类反馈的强化学习微调而来,能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。 ALAPI 是什么? ALAPI 是国内的一个接口开发聚合平台&#xff…