复旦发布中国版 ChatGPT :MOSS

article/2024/12/22 11:17:23

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇

来源 | 机器之心

ChatGPT 是最先进的 AI,也是最热门的应用 —— 自去年 11 月底发布以来,它的月活跃用户两个月超过一亿,轻松拿到了全球互联网史上用户增长速度的第一。

它也是一种门槛很高的技术。由于 ChatGPT 的训练过程所需算力资源大、标注成本高,目前国内暂未出现对大众开放的同类产品。百度、阿里、京东等互联网大厂都放出消息,表示正在打造「国产 ChatGPT」,并将在近期发布。

在各大厂产品到位之前,学界先有了消息。2 月 20 日晚,复旦大学自然语言处理实验室发布了具备 ChatGPT 能力的语言模型 ——MOSS,并面向大众公开邀请内测。

  • MOSS 体验链接:https://moss.fastnlp.top/

  • MOSS 项目主页:https://txsun1997.github.io/blogs/moss.html

outside_default.png

MOSS 的名称来自电影《流浪地球》,和电影一样火的是,MOSS 发布的消息很快冲上了知乎等平台热搜榜的第一位。

outside_default.png

不过与科幻不同的是,现实世界的 AI 还没有量子计算机加持,距离开放还没有过 24 个小时,由于瞬时访问压力过大,MOSS 服务器昨晚已被挤爆,可见大家对于生成语言模型的期待程度有多高。

据复旦大学研究人员介绍,目前在内测,与用户交互迭代优化,不适合公测。

outside_default.png

我们知道,自然语言处理是 AI 领域的最大挑战之一,虽然突破已经出现,但这个月上线的新必应搜索,以及谷歌发布的竞品 BARD 在测试中不时会出现问题,复旦大学的 MOSS 水平如何呢?

对话 MOSS,水平如何?

MOSS 的基础功能与 ChatGPT 类似,可以按照用户输入的指令完成各类自然语言处理任务,包括文本生成、文本摘要、翻译、代码生成、闲聊等等。在预览期间,MOSS 的使用是免费的。

outside_default.png

MOSS 和 ChatGPT 一样,构建的过程包括自然语言基础模型训练,以及理解人类意图的对话能力训练两个阶段。

86e4dfa74c55af65c86f675dfa5c6590.png

据项目主页介绍,MOSS 和 ChatGPT 的主要区别在于:

  • MOSS 的参数数量比 ChatGPT 少得多。

  • MOSS 通过与人类和其他人工智能模型交谈来学习,而 ChatGPT 则通过人类反馈强化学习(RLHF)进行训练。

  • MOSS 将是开源的,以促进未来的研究,但 ChatGPT 可能不会。

MOSS 的对话水平如何,让我们看几个示例。以下是 MOSS 生成的一些交互记录:

outside_default.png

在这个例子中,用户首先要求 MOSS 推荐五部科幻电影,接着要求 MOSS 生成了一个表格来展示这些电影以及它们的导演,最后要求 MOSS 在表格中新插入一列来展示这些电影的上映年份。完成这一任务需要语言模型具备强大的多轮交互能力和指令理解能力,MOSS 显然在这两方面表现优异。

与 ChatGPT 类似,MOSS 有时也会输出一些事实性错误的例子,比如例子中《黑客帝国》的导演并不是 Thomas Neff,而是沃卓斯基兄弟(姐妹)。

除了多轮对话,MOSS 生成代码也不在话下。在下面的例子中,MOSS 不仅可以为用户提供实现快速排序的 Python 代码,还能在用户的要求下对这段代码提供解释和使用示例,可谓是手把手教学的程序员了。

outside_default.png

除了让 MOSS 帮忙写代码之外,还可以向 MOSS 询问有关代码细节的问题,让其更好地帮助理解代码。在下面的例子中,用户向 MOSS 询问了一段代码的编程语言和功能,并进一步提问了其中一个函数的作用,MOSS 均给出了满意的回复。

7fbb3415ab23ed1874531c997a80fc3c.png

此外,MOSS 还具备人类的价值观,当被要求回答不合理的问题时,MOSS 会拒绝回答并给出正确的劝导。

outside_default.png

据了解,MOSS 采用参数量为百亿级的自研模型进行训练。在对话能力训练阶段,OpenAI 收集了至少几十万条人类指令 —— 让各行各业的专业标注员写出指令回复,再将它们输入模型基座,以帮助 ChatGPT 逐步理解各种指令。复旦团队则采用不同的技术路线,通过让 MOSS 和人类以及其它 AI 模型都进行交互,显著提升了学习效率和研发效率,短时间内高效完成了对话能力训练。

研发团队表示,虽然 MOSS 已经实现了 ChatGPT 的一些功能,但仍然存在许多限制,由于缺乏高质量的数据、计算资源和模型容量,MOSS 仍然远远落后于 ChatGPT。

  • 由于训练数据中的多语言语料库有限,MOSS 在理解和生成英语以外的语言的文本方面表现不佳。团队目前正在开发一个改进版本,以提高其中文语言技能。

  • 由于模型容量相对较小,MOSS 不包含足够的世界知识。因此,MOSS 生成的一些响应可能包含误导性或虚假信息。

  • 有时 MOSS 以迂回的方式执行,甚至未能遵循指示。在这种情况下,用户可能需要重新生成几次或修改 prompt,以获得令人满意的回复。团队正在积极提高其遵循指示的能力以及生产力。

  • 有时 MOSS 可能会因 prompt 生成不道德或有害的反应。用户可通过单击 “不喜欢” 来帮助减少此类行为,团队将在下一个版本中更新模型。

研究团队指出,当前版本的 MOSS 表现仍不稳定,也受到数据集问题的影响:「MOSS 的英文回答水平比中文高,因为它的模型基座学习了 3000 多亿个英文单词,中文词语只学了约 300 亿个。」

发布之后,团队将持续通过提供 MOSS 的可访问界面,根据宝贵的用户反馈(在许可下)不断改进模型。

未来,研究人员还计划结合复旦在人工智能和相关交叉学科的研究成果,赋予 MOSS 绘图、语音、谱曲等多模态能力,并加强它辅助科学家进行高效科研的能力等。

期待 MOSS 能为国内对话大模型的发展开一个好头。

团队介绍

MOSS 的主要作者共有两位:复旦大学教授邱锡鹏和他的博士生孙天祥。此外还有多位成员对项目有所贡献。

1cd5d50deed4c83d6cb817e7ef77806e.png

邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师。国家优青获得者,于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,发表 CCF A/B 类论文 70 余篇,获得 ACL 2017 杰出论文奖(CCF A 类)、CCL 2019 最佳论文奖、《中国科学:技术科学》2021 年度高影响力论文奖,有 5 篇论文入选 PaperDigest 发布的 IJCAI/ACL/EMNLP 的最有影响力论文(被引用数进入前当届会议的 20 名)。出版开源专著《神经网络与深度学习》,Github 关注数 1.5 万,豆瓣评分 9.4 分。主持开发了开源框架 FudanNLP 和 FastNLP,已被国内外数百家单位使用。2015 年入选首届中国科协青年人才托举工程项目,2018 年获钱伟长中文信息处理科学技术奖青年创新奖一等奖,2020 获第四届上海高校青年教师教学竞赛优等奖,2021 年获首届上海市计算机学会教学成果奖一等奖(第一完成人)等。培养学生多次获得一级学会优博、微软学者、百度奖学金等。

outside_default.png

孙天祥,复旦大学计算机科学学院博士生,导师为邱锡鹏教授和黄萱菁教授。2019 年毕业于西安电子科技大学。研究兴趣集中于机器学习及其在自然语言处理中的应用,特别是预训练语言模型的高效微调及推理、多任务学习、知识表示学习等。以第一作者在 ICML, ACL, NAACL, AAAI, COLING 等会议发表多篇论文。

-End-

最近有一些小伙伴,让我帮忙找一些 面试题 资料,于是我翻遍了收藏的 5T 资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

outside_default.png

点击👆卡片,关注后回复【面试题】即可获取

在看点这里outside_default.png好文分享给更多人↓↓


http://chatgpt.dhexx.cn/article/xfJ3h0K7.shtml

相关文章

桌面版 ChatGPT 来了!

由于工作、学习需要,现在基本上每天都要使用几个小时的 ChatGPT。一直以来的方法就是登录 OpenAI ChatGPT 的 web 版:http://chat.openai.com/ 每天登录网页比较麻烦,如果能有一个桌面应用就方便了!今天就给大家推荐一个 ChatGPT …

如何下载ChatGPT-ChatGPT如何写作

CHATGPT能否改一下文章 ChatGPT 作为一种自然语言处理技术,生成的文章可能存在表达不够准确或文风不符合要求等问题。在这种情况下,可以使用编辑和修改来改变输出的文章,使其符合特定的要求和期望。 具体来说,可以采用以下步骤对…

文心一言发布!【中国版ChatGPT】附测试链接

文心一言是百度推出的生成式对话产品,2023.3.16正式发布12。它基于文心大型模型技术,被外界誉为“中国版ChatGPT” 文心一言测试链接: https://cloud.baidu.com/survey_summit/wenxin.html 文心一言与Chatgpt对比 文心一言在中文的支持方面…

全开源chatGPT聊天机器人商业版源码 支持魔改 完全开放源代码

正文: 全开源chatGPT聊天机器人商业版源码 支持魔改 完全开放源代码CHATGPT商业源码 支持魔改 全开源 无后门 全开源 随意改! 云盘地址: http://zijieyunpan.cn/PEpjOyeLuuK 图片:

vscode ChatGpt中文版 插件

最近刚刚上手 ChatGpt插件,真是贼拉好用,下面就是给大家分享一下,如何安装、如何使用、 安装步骤: 1.在应用商店里面搜索"ChatGpt" 2.点开插件,安装 3.安装成功以后,在资源管理器文件列表随便选…

浅谈ChatGPT

ChatGPT概述 ChatGPT是一种自然语言处理模型,ChatGPT全称Chat Generative Pre-trained Transformer,由OpenAI开发。它使用了基于Transformer的神经网络架构,可以理解和生成自然语言文本。ChatGPT是当前最强大和最先进的预训练语言模型之一&a…

ChatGPT中文版提示词学习手册, 学完工作效率提升百倍!

既然你对ChatGPT及其功能有了⼀些了解,让我们更深入地了解⼀下ChatGPT是什么以及它是如何工作的。 那么ChatGPT是如何工作的呢?在高层次上,这个过程可以分解为以下步骤: 1. 用户将文本输入ChatGPT界面。这可能是一个问题&#xf…

ChatGPT中文客户端

拥有功能👍: ChatGPT在线对话 ChatGPT角色设置,应用功能 Midjourney绘画功能 下载地址: 八九智能助手客户端.zip - 蓝奏云

ChatGPT中文电脑端软件

ChatGPT中文电脑端软件 背景 ChatGPT作为一种基于人工智能技术的自然语言处理工具,近期的热度直接沸腾🌋。 作为一个好奇心很强的人,找到一款好用的中文版的ChatGPT软件,测试很久了,觉得非常好用,很想分…

ChatGPT中文版写论文神器使用技巧

又到了一年一度的毕业季,写论文成了同学们的头等大事。ChatGPT系当今世上最强的人工智能产品,已经深刻地影响着人们的工作生活学习。ChatGPT也是写论文的神器,能帮助同学们拓宽思路,举一反三,事半功倍。以面给同学们盘…

chatgpt写作文 chatgpt中文在线

ChatGPT作品展示: 今天,我和爸爸妈妈一起去外婆家串门。一路上,我们一路欢笑,聊着天,谈着家常。到了外婆家,外婆家的门口,一阵清新的空气扑面而来,让我们精神一振。进了外婆家&#…

chatgpt相关学习内容资料

chatgpt 中文版免费访问 简介一、ChatGPT中文网二、 ChatGPT三、ChatGPTWEB四、博弈AI五、小熊共享六、tab精灵七、AI文本工具站1、有直接chatgpt体验对话2、文案工具箱 八、学习chatGpt 简介 最近chatgpt太火了,用起来十分方便。chatgpt是一种基于人工智能技术的语…

ChatGPT在社工攻击和反钓鱼中的应用

概述 ChatGPT是一种基于神经网络的自然语言处理模型,可以生成自然流畅的文本或对话。在钓鱼攻击中,攻击者可以使用ChatGPT生成虚假电子邮件或消息,更好地伪装成受害者所信任的个人或组织,从而获取受害者的个人信息。这种行为对个…

强力推荐:关于谷歌ChatGPT模型用户测试的140个示例的展示与实现功能

目录 1、ChatGPT 介绍与使用简要介绍安装ChatGPT与使用想写出有效的问答吗?使用 ChatGPT 桌面应用程序使用 prompts.chat2、ChatGPT模型140个示例充当 Linux 终端充当英语翻译和改进者担任`position`面试官充当 JavaScript 控制台充当 Excel 工作表充当英语发音帮手充当旅游指…

聊聊ChatGPT

ChatGPT是什么?它能做什么?会有大批人因它而失业吗?带着这些问题,我们今天聊聊ChatGPT! 自ChatGPT问世以来,人们对它的评价从好评如潮到疯狂膜拜。从初见时的震撼与赞美已渐渐演变成非理性的鼓吹。许多人毫…

经验:调教200多个ChatGPT模型后的经验分享

大家好!我是zhongsir。从去年12月布局ChatGPT的应用到现在已经将近快4个多月了。 我认为在ChatGPT使用门槛不断降低的情况下,决定能否真正将其转化为生产力的因素就是“调教精度”。 之前在星球分享过ChatGPT调教的三板斧,今天逐一来详细分析…

【ChatGPT】ChatGPT还能保持多久的神话?

文章目录 引言正文ChatGPT的由来ChatGPT的影响乱象频出ChatGPT未来的走势 引言 最近ChatGPT的热度持续拔高,一个功能强大的AI迅速引爆了全世界,上到技术大佬,下到平民百姓,都在讨论并使用这个“跨时代的”的技术。有人拿它聊天&a…

ChatGPT潮落 资金逃离AI概念股

ChatGPT访问量首次出现负增长,寒气传导到证券市场。 上半年经历暴涨的一众AI概念股偃旗息鼓,蓝色光标、三六零、昆仑万维等知名个股均较高点跌超30%。微软、英伟达也未能幸免,同样有不同程度回调。 回顾这波过山车般的市场表现,…

三谈ChatGPT(ChatGPT可以解决问题的90%)

这是我第三次谈ChatGPT,前两篇主要谈了ChatGPT的概念,之所以火的原因和对人们的影响,以及ChatGPT可能存在的安全风险和将面临的监管问题。这一篇主要讲讲ChatGPT的场景和处理问题的逻辑。 这一次我特意使用了ChatGPT中文网页版体验了一番。并…

中国版ChatGPT高潮即将到来,解密ChatGPT底层网络架构

2022年11月30日人工智能研究实验室OpenAI发布全新聊天机器人ChatGPT,在中国用户无法访问的前提下,上线仅两个月月活用户就突破了1亿。ChatGPT如同重磅炸弹,一时间火遍全球。 面对这一万亿级市场机遇,在国内,无论是资本…