中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本

article/2024/9/8 10:37:35

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

ChatGLM

(封面图由ERNIE-ViLG AI 作画大模型生成)

中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本

ChatGLM是一个具备问答和对话功能的语言模型,目前处于内测阶段,已经开启邀请制,并且将逐步扩大内测范围。此外,ChatGLM也已经开源了最新的中英双语对话模型ChatGLM-6B,结合模型量化技术,用户可以在消费级显卡上进行本地部署。ChatGLM-6B共经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,模型参数达到了62亿。虽然规模不及千亿模型,但是ChatGLM-6B已经能够生成相当符合人类偏好的回答,大大降低了用户部署的门槛。

GLM介绍

GLM是一个用自回归填空目标预训练的通用语言模型,可以在各种自然语言理解和生成任务上进行微调。2022年11月,斯坦福大学大模型中心对全球30个主流大模型进行了全方位的评测,GLM-130B 是亚洲唯一入选的大模型。在与 OpenAI、谷歌大脑、微软、英伟达、脸书的各大模型对比中,评测报告显示 GLM-130B 在准确性和恶意性指标上与 GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中表现不错(下图)。
GLM

关于 GLM-130B 的学术文章已被国际深度学习会议 ICLR’23 接收。自2022年8月开放以来,收到53个国家369个研究机构(截至2023年2月1日)的下载使用需求,包括谷歌、微软、脸书、AI2、华为、阿里巴巴、百度、腾讯、头条、小冰、小度、小米以及斯坦福、麻省理工、伯克利、卡耐基梅隆、哈佛、剑桥、牛津、北大、浙大、上交、复旦、中科大、国科大等国内外人工智能研究机构和高校。
GLM

ChatGLM介绍

ChatGLM 参考了 ChatGPT 的设计思路,在千亿基座模型 GLM-130B1 中注入了代码预训练,通过有监督微调(Supervised Fine-Tuning)等技术实现人类意图对齐。ChatGLM 当前版本模型的能力提升主要来源于独特的千亿基座模型 GLM-130B。它是不同于 BERT、GPT-3 以及 T5 的架构,是一个包含多目标函数的自回归预训练模型。2022年8月,我们向研究界和工业界开放了拥有1300亿参数的中英双语稠密模型 GLM-130B1,该模型有一些独特的优势:

  • 双语: 同时支持中文和英文。
  • 高精度(英文): 在公开的英文自然语言榜单 LAMBADA、MMLU 和 Big-bench-lite 上优于 GPT-3 175B(API: davinci,基座模型)、OPT-175B 和 BLOOM-176B。
  • 高精度(中文): 在7个零样本 CLUE 数据集和5个零样本 FewCLUE 数据集上明显优于 ERNIE TITAN 3.0 260B 和 YUAN 1.0-245B。
  • 快速推理: 首个实现 INT4 量化的千亿模型,支持用一台 4 卡 3090 或 8 卡 2080Ti 服务器进行快速且基本无损推理。
  • 可复现性: 所有结果(超过 30 个任务)均可通过我们的开源代码和模型参数复现。
  • 跨平台: 支持在国产的海光 DCU、华为昇腾 910 和申威处理器及美国的英伟达芯片上进行训练与推理。

ChatGLM-6B 特点

ChatGLM-6B 是一个具有62亿参数的中英双语语言模型。通过使用与 ChatGLM(chatglm.cn)相同的技术,ChatGLM-6B 初具中文问答和对话功能,并支持在单张 2080Ti 上进行推理使用。具体来说,ChatGLM-6B 有如下特点:

优势:

  • 充分的中英双语预训练:ChatGLM-6B 在 1:1 比例的中英语料上训练了 1T 的 token 量,兼具双语能力。
  • 优化的模型架构和大小:吸取 GLM-130B 训练经验,修正了二维 RoPE 位置编码实现,使用传统 FFN 结构。6B(62亿)的参数大小,也使得研究者和个人开发者自己微调和部署 ChatGLM-6B 成为可能。
  • 较低的部署门槛:FP16 半精度下,ChatGLM-6B 需要至少 13 GB 的显存进行推理,结合模型量化技术,这一需求可以进一步降低到 10GB(INT8)和 6GB(INT4),使得 ChatGLM-6B 可以部署在消费级显卡上。
  • 更长的序列长度:相比 GLM-10B(序列长度 1024),ChatGLM-6B 序列长度达 2048,支持更长对话和应用。
  • 人类意图对齐训练:使用了监督微调(Supervised Fine-Tuning)、反馈自助(Feedback Bootstrap)、人类反馈强化学习(RLHF)等方式,使模型初具理解人类指令意图的能力。输出格式为 markdown,方便展示。
    劣势:
  • 相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时,ChatGLM-6B 可能会生成不正确的信息,也不太擅长逻辑类问题(如数学、编程)的解答。
  • 可能会产生有害说明或有偏见的内容:ChatGLM-6B 只是一个初步与人类意图对齐的语言模型,可能会生成有害、有偏见的内容。
  • 较弱的多轮对话能力:ChatGLM-6B 的上下文理解能力还不够充分,在面对长答案生成和多轮对话的场景时,可能会出现上下文丢失和理解错误的情况。

ChatGLM-6B本地部署(在Ubuntu18.04系统中测试通过)

(1) 首先安装git

Ubuntu环境下运行以下命令下载安装git git简介及常用命令介绍

apt-get install git

(2) 然后clone官方开源的ChatGLM-6B源码

运行以下代码下载官方源码:

git clone https://github.com/THUDM/ChatGLM-6B.git

然后进入ChatGLM-6B文件夹:

cd ChatGLM-6B

(3)安装python环境

可以使用conda新建一个python环境用于运行代码:

# 新建chatglm环境
conda create -n chatglm python=3.8
# 激活chatglm环境
conda activate chatglm
# 安装PyTorch环境(根据自己的cuda版本选择合适的torch版本)
# 建议安装torch1.12版本,版本太低例如1.7.1版本我测试过会出错
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
# 安装gradio用于启动图形化web界面
pip install gradio
# 安装运行依赖
pip install -r requirement.txt

(4)对源文件进行一定的修改

在web_demo.py的最后一句demo.queue().launch(share=True),加两个server_name=“0.0.0.0”, server_port=1234参数,其中server_name如果是本地部署的话可以写127.0.0.1,端口可以自己定义,不要和自己电脑的一些端口冲突就行。

最后在浏览器输入http://server_name:server_port就可以开始调教了。

参考文献

[1] ChatGLM:千亿基座的对话模型启动内测,单卡版模型已全面开源 https://mp.weixin.qq.com/s/N79Sdx3K1em1EJxQZ9lcpA
[2] ChatGLM:千亿基座的对话模型开启内测
⸺对应单卡版本开源 https://chatglm.cn/blog
[3] ChatGLM-6B https://github.com/THUDM/ChatGLM-6B


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈


http://chatgpt.dhexx.cn/article/XnEQO058.shtml

相关文章

开源项目ChatGPT-website再次更新,累计下载使用1600+

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言&#x1f4d…

ChatGPT应用工具

ChatGPT作为一种先进的自然生成技术,已经在各个领域展现出了其强大的应用能力,下面将给大家介绍一些ChatGPT的功能应用。 简介 此系统是基于likeadmin—PHP开发的智能对话系统,ChatGPT是一种基于人工智能技术的聊天机器人,它可以…

FastChat-Vicuna开放,媲美ChatGPT的90%能力——从下载到安装、部署

FastChat-Vicuna开放,媲美ChatGPT的90%能力——从下载到安装、部署 前言两个前置软件创建FastChat虚拟环境安装PyTorch安装 FastChat下载 LLaMA,并转换为HF格式生成FastChat对应的模型Vicuna启动FastChat的命令行交互将模型部署为一个服务,提…

面试官-你真的懂computed原理?(源码解读)

要理解 computed 的工作原理,只需要理解下面4个特性 - 特性1:computed默认不执行(因为 lazy 的原因,在新建watcher实例的时候,会将 watcher.value 赋值为 undefined,而不会立马进行计算。) - 特性2:取值的…

ChatGPT的兴起的时代,国内chatgpt产品大盘点

1、 百度文心一言 2023年3月发布 文心一言​yiyan.baidu.com/ 2、阿里通义千问 2023年4月发布 通义千问​tongyi.aliyun.com/ 3、讯飞火星 2023年5月发布 讯飞星火认知大模型​xinghuo.xfyun.cn/ 4、360:360智脑 2023年4月发布 360智脑 x 360搜索邀您体验​…

ChatGPT是什么?为何会引爆国内算力需求?

过去十年中,通过“深度学习大算力”从而获得训练模型是实现人工智能的主流技术途径。由于深度学习、数据和算力这三个要素都已具备,全世界掀起了“大炼模型”的热潮,也催生了大批人工智能企业。 大模型是人工智能的发展趋势和未来 大模型&…

国内那么多AI专业,为什么国内却没有ChatGPT?

作者:赵俊博 Jake(浙大博导 AI专家) 浙大青椒,谢邀。以下纯为个人观点,不喜勿喷。 首先,我必须肯定一下ChatGPT,这个模型展现出来如下几个点让我震惊:(1)推…

你如何看待,“国内ChatGPT还没成熟,但ChatGPT的付费模式已经成熟了?”

作者:小傅哥 博客:https://bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获!😄 说来奇怪🤔,我们从0到1的事往往较少,但从1到100的嫁衣神功却很多也很快。就像 ChatGPT 还没有…

国内这么多“ChatGPT”是真是假

国内这些产品是真的吗?与国外的ChatGPT有什么联系? 用ChatGPT官方图标当头像 免费试用几次后开始收费 据澎湃科技报道,随手点开微信搜索框,就可以发现一系列与ChatGPT“沾亲带故”的产品,并以ChatGPT的官方图标为头像。…

国内版 ChatGPT 要来了?传百度有此计划

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) ChatGPT 横空出现,引发 AIGC 热潮。虽然 ChatGPT 目前尚未面向国内普通用户开放,但是其彰显的潜力也引得很多开发者、企业跃跃欲试,这其中便包括了搜索引擎巨头百度。…

文心一言:中国版“ChatGPT”介绍与测评

👨‍💻作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等资料&#xff0…

借助国内ChatGPT平替+MindShow,飞速制作PPT

系列文章目录 借助国内ChatGPT平替markmap/Xmind飞速生成思维导图 借助国内ChatGPT平替剪映/百度AIGC平台快速制作短视频 利用ChatGPT编写Excel公式,对比讯飞星火与ChatGPT对Excel公式的回答 文章目录 系列文章目录前言一、科大讯飞“星火”认知大模型介绍二、使…

阿猫智能机器人称:国内用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!

4月12日,微软宣布开源了Deep Speed Chat,帮助用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!(国内chatgpt平台阿猫智能机器人项目合作地址:https://3amao.comGptChat, AI, APIhttps://…

不要让ChatGPT成为你的智商税

难处 我相信有部分人苦于政策,但是又没有途径,没法享受到chatGpt带来的便利。 我也相信有不少无良的人,在百度浏览器的各个官网搞什么接入openaiAPI的网站,欺骗广大人民交那么几十块。 这种行为本身不合理,也不合法…

全网唯一,不忽悠的ChatGPT

Datawhale干货 作者:Ben,中山大学,Datawhale成员 最近ChatGPT火出圈了,它和前阵子的Stable Diffusion(AIGC)一样成为社交媒体上人们津津乐道的话题。“ChatGPT要取代谷歌搜索了?”“ChatGPT要让…

两分钟成为 ChatGPT 国内高手【不要再拿ChatGPT当百度用了】

不要再问ChatGPT那些问百度的问题了,有更进阶的用法 更高效的编写prompts,以便ChatGPT给出更精准的回答 但是需要注意的是:国内现在根本没有GPT-4使用,但凡是说有GPT-4的都是骗子。 GPT 可以写文章,可以写诗&#x…

ChatGPT国内镜像站初体验:聊天、Python代码生成等

ChatGPT国内镜像站初体验,聊天、Python代码生成。 (本文获得CSDN质量评分【92】) 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单……

chatgpt 国内版写代码功效 让技术人员轻松作业

上篇文章已经教过大家如何使用,由于很多程序员小伙伴想要看写代码如何 那么今天就简单的展示一下国内版写程序怎么样 废话不多说 咱们看效果 1 2 3 4 5 这个代码使用 Python 和 Pygame 实现了一个简单的俄罗斯方块游戏。运行代码后,您应该可以看到一个…

国内各大厂ChatGPT技术布局及应用场景

2023年无疑会是AIGC掀起浪潮的一年,自从微软投资的OpenAI 研究室发布了神仙级别的自然语言生成式AI——chatGPT之后,人工智能领域也算是被彻底“杀疯了”。 ​有人说,它诞生的意义不亚于Stable Diffusion等AI绘画生成模型的出现,…

用chatgpt写insar地质灾害的论文,重复率只有1.8%,chatgpt4.0写论文不是梦

突发奇想,想用chatgpt写一篇论文,并看看查重率,结果很惊艳,说明是确实可行的,请看下图。 下面是完整的文字内容。 InSAR (Interferometric Synthetic Aperture Radar) 地质灾害监测技术是一种基于合成孔径雷达…