前言
这篇文章主要是笼统的讲了一些关于ChatGPT的介绍。
首先,ChatGPT和GPT不是一个东西,别混淆。前者是一款产品,后者是一个语言模型。ChatGPT是基于GPT的基础之上研发的一款产品。
ChatGPT最强大的是基于GPT这个超大体量的数据模型开发的一款会话式产品,目前已经到了GPT3.5,本身也没有网上说的那么神乎其神,更多的是商家和营销号在炒作,博人眼球挣流量。
细心的同学会发现还是有很多的问题所在,比如本身不能直接使用语音对话(想要接语音的得二开)、受使用场景的局限性太多、内容的准确性有很大的问题(比如返回的图片地址经常404)等。
很多人开始慢慢提及 AI 将来会不会取代人类之类的话题,我建议各位看到这类字眼心里笑笑就行,营销号炒作的嘘头而已,别当真。按照目前的科技发展,起码在我们有生之年是不会遭遇这个情况的,至于千百年之后,我们想操心也管不着,活在当下,及时行乐。
1)AI 本身是把双刃剑。给人类带来一定的便捷的同时,也会让一些人下岗失业,这是人类社会文明必然会出现的现象。;
2)但别惊慌,更别排斥它,AI 归根到底还是科技与狠活儿,套用行业大佬的一句话就是:无能的人才会去惧怕它,而聪明的人会学会利用 AI 。计算机的发明让很多人失业了,但是造福了更多的人。AI 也是如此!!!
3)AI 的出现只会让我们 ”终身学习” 的信念更加坚定。(人如果不学习,那跟猪有什么区别?人生还有何意义呢?)
一、 什么是ChatGPT
ChatGPT是OpenAI公司基于语言模型开发的聊天机器人技术,
(应用场景:翻译、问答、代码生成、文本摘要、推文分类等)
二、GPT基础知识
全称是:Generative Pre-Training(生成式训练)
其发展历程(收集—>汇总训练—>引导训练)
1)GPT-1
- Pre-Training,预训练
- Fine-Tuning,监督模型(有序)
2)GPT-2
- (扩大训练规模:WebText数据集,15亿参数)
- 无监督模型
3)GPT-3
- 训练模型更大,1750亿个参数(Sparse Transformer,采用密集和稀疏交替形式)
- 引导性训练,对少量样本进行训练
三、NLP基础知识
1)自然语言处理的概念和技术
- 自然语言理解(NLU)
- 自然语言生成(NLG)
2)主要内容
- 文本挖掘
- 信息检索
- 句法语义分析
- 机器翻译
- 问答系统
- 对话系统
四、GPT-3模型架构
- text-ada-001(最快,成本最低,只能执行非常简单的任务(2048))
- text-babbage-001(非常快、成本更低,只能执行简单任务)
- text-curie-001(比 davinci 更快,成本更低,非常有能力)
- text-davinci-003(质量更高、输出更长、指令理解更强,且支持文本插入补全(4000))
五、相关文档
- 官方文档(科学上网)(https://platform.openai.com/docs/introduction)
- 注册账号流程 (https://www.cnblogs.com/chat-gpt/p/how-to-use-chatgpt-in-china.html)
- Idea加入ChatGPT (https://docs.obiscr.com/article/GPT-Getting-Started)
- 查看 api-key(科学上网)(https://platform.openai.com/account/api-keys)
- 微信接入 ChatGPT(https://51.ruyo.net/18261.html)
- 下载接入微信的安装包(https://gitee.com/shtml/wechatbot/tree/main/bin)