ChatGPT是OpenAI在2022年11月30日发布的一款全新的聊天机器人模型。
- OpenAI 2015年创立,目标是开发造福全人类的AI技术
- 2018年发布GPT(生成式预训练语言模型),生成文章,代码,机器翻译等
- 2022年11月30日发布ChatGPT全新聊天机器人模型
一、什么是ChatGPT?
Optimizing Language Models for Dialogue(优化对话语言模型)
ChatGPT以对话方式进行交互
ChatGPT能跟聊天的上下文进行互动,真正像人类一样来聊天交流
ChatGPT的模型,能完成撰写邮件、视频脚本、文案、翻译、代码等任务
ChatGPT是基于GPT3架构开发的对话AI模型,ChatGPT的优秀表现如下:
ChatGPT能做什么?
回答问题:能够根据上下文调整回答各种问题
对话能力:通过文本或语音,理解人类的意图,使对话更自然
寻求方案:ChatGPT可以识别人类的需求,根据问题提供适当的帮助
学习工具:ChatGPT作为一种学习工具,我们可以通过于它科交流来提供语言能力和知识水平
自动化:ChatGPT可以作为客户助手使用
二、ChatGPT整体架构
注意:数据处理需要人工处理,ChatGPT主要在模型构建与训练部分使用
项目代码结构
三、CahtGPT属于基于深度学习的一种语言模型
关于生物神经网络结构如下:
神经网络介绍
人工神经网络( Artificial Neural Network, 简写为ANN)也简称为神经网络 (NN), 是一种模仿生物 神经网络结构和功能的计算模型。
当电信号通过树突进入到核细胞时,会逐渐聚集电荷。达到一定的电位后,细胞会被激活,通过轴突发出信号。
从大脑的神经元抽象得到的模型的数学表示:
第一个感知机模型
如果学习参数w
通过误差反向传播更新参数。
神经网络发展经历
神经网络中信息只想一个方向移动,即从输入节点向前移动,通过隐藏节点,再向输出节点移动。其中基本部分是:
1. 输入层: 即输入 x 的那一层
2. 输出层: 即输出 y 的那一层
3. 输入层和输出层之间都是隐藏层
1.确定神经网络层数
(1)输入层和输出层仅有一层,隐层有多层
2.确定每层单元的个数
(1)输入层单元个数根据输入数据个数定
(2)输出层单元个数根据目标分类个数确定
(3)隐层的单元个数如何确定?
• 神经网络介绍
=>隐层个数设定没有明确规则,根据准确度来进行判断和改进。
ChatGPT是在GPT基础上进一步开发的NLP模型
Generative Pre-trained Transformer( 生成式训练模型)
ChatGPT是基于GPT-3的优化实现版本
四、ChatGPT本质
2022年11月30日,OpenAI的CEO,Altman在推特上写道:“今天我们推出了ChatGPT,尝试在这里与它交谈”, 然后是一个链接(https://chat.openai.com/auth/login),任何人都可以注册一个帐户, 开始免费与 OpenAI的新聊天机器人ChatGPT交谈。
ChatGPT是由OpenAI开发的一种大型预训练语言模型, 其和人类沟通的方式为人机对话形式
这个时候,我们可以思考两个问题。机器如何判断一条输入句子的合理性?机器的回复是否是人类可以理解的或者是人类习惯在日常生活中习惯表达的。
什么是语言模型?
通俗理解:判断一个句子序列是否是正常语句, 即是否是人话.
标准定义:对于某个句子序列, 如{W1, W2, W3, …, Wn}, 语言模型就是计算该序列发生的概率, 即P(W1, W2, …, Wn). 如果给定的词序列符合语用习惯, 则给出高概率, 否则给出低概率
以上,有人看会持续更。