聊天机器人历史

article/2025/8/22 10:48:48

定义

模仿人-人交互的模式来构建人机交互系统,我们称之为对话系统(Spoken Dialogue Systems, SDSs)(Lopez-Cozar &Araki, 2005; McTear, 2004; Pieraccini, 2012)或聊天机器人。

 

时间?叫什么?是什么?有什么用?怎么实现的?

 

1950年,图灵测试,起源

聊天机器人的研究源于图灵(Alan M. Turing)在1950年《Mind》上发表的文章《Computing Machinery and Intelligence》,文章开篇提出了“机器能思考吗?”(“Can machines think?”)的设问,并且通过让机器参与一个模仿游戏(Imitation Game)来验证“机器”能否“思考”,进而提出了经典的图灵测试(Turing Test)。图灵测试被认为是人工智能的终极目标,图灵本人因此也被称作“人工智能之父”。

论文链接:JSTOR: Mind, New Series, Vol. 59, No. 236 (Oct., 1950), pp. 433-460

p442图灵的原句是:
"I believe that in about fifty years' time it will be possible to programme computers, with a storage capacity of about 10^9, to make them play the imitation game so well that an average interrogator will not have more than 70% chance of making the right identification after five minutes of questioning."
图灵预言,到 2000 年在模仿游戏中普通人能区分人与机器人的概率将会低于 70%。亚马逊语音助手 Alexa 部门的首席科学家 Rohit Prasad 认为,随着 AI 被广泛整合到手机、汽车和家庭,人们现在关心的是人机之间的互动,而不是区分机器和人类。他认为图灵测试过时了,AI 需要新基准测试。Rohit Prasad 指出,最近几年的聊天机器人程序已经能欺骗三成以上的裁判相信它是人类,而愚弄 30% 的裁判这一阈值实际上是任意设定的,并无多大的意义。(Solidot)

 

1966年,ELIZA(伊莉莎),第一个实现了的聊天机器人,人工编写关键词匹配+回复

最早的聊天机器人ELIZA[1]诞生于1966年,由麻省理工学院(MIT)的约瑟夫·魏泽鲍姆(Joseph Weizenbaum)开发用于在临床治疗中模仿心理医生。值得注意的是尽管ELIZA的实现技术仅为关键词匹配及人工编写的回复规则,但魏泽鲍姆本人对ELIZA的表现感到吃惊,随后撰写了《Computer Power and Human Reason》这本书,表达他对人工智能的特殊情感。

请看“伊莉莎”在计算机上与一位姑娘的谈话摘要:

姑娘: 男人们全都一样。

伊莉莎: 在哪些方面?(拒识处理--提问1)

姑娘: 他们总找借口躲避我们

伊莉莎: 你能举个例子吗?(拒识处理--提问2)

姑娘: 好吧,我的男朋友要我到你这里来。

伊莉莎: 哦,你的男朋友要你到我这里来。(“关键词” 匹配)

姑娘: 他说我很烦闷。

伊莉莎: 你很烦闷,这使我很难过。(“关键词” 匹配)

 

1988年,UC(UNIX Consultant),

1988年,加州大学伯克利分校(UC Berkeley)的罗伯特·威林斯基(Robert Wilensky)等人开发了名为UC(UNIX Consultant)[2]的聊天机器人系统。顾名思义,UC是一款帮助用户学习怎样使用UNIX操作系统的聊天机器人。它具备了分析用户的语言、确定用户操作的目标、给出解决用户需求的规划、决定需要与用户沟通的内容、以英语生成最终的对话内容以及根据用户对UNIX系统的熟悉程度进行建模的功能。如果说ELIZA开启了智能聊天机器人时代的话,那么UC则进一步推动了聊天机器人的智能化程度。

1990年,设立勒布纳奖

为了将图灵测试付诸实践,美国科学家兼慈善家休·勒布纳(Hugh G. Loebner)于1990年设立了人工智能年度比赛——勒布纳奖(Loebner Prize)[3](包括10万美金的奖金和一块印有勒布纳与图灵头像的金牌)。勒布纳奖的设立旨在奖励首个与人类回复无差别的计算机程序,即聊天机器人系统,并以此推动图灵测试及人工智能的发展。

1995年,ALICE系统

在勒布纳奖的推动下,聊天机器人的研究迎来了一个高潮,这里面较为代表性的聊天机器人系统是ALICE(Artificial Linguistic Internet Computer Entity)[4]。受到ELIZA聊天机器人的启发,理查德·华勒斯(Richard S. Wallace)博士在1995年开发了ALICE系统。ALICE曾经在2000年、2001年和2004年三次问鼎勒布纳奖,并于1998年开始开源,目前全世界有超过500个开发者为ALICE项目贡献代码。值得注意的是,随着ALICE一同发布的AIML(Artificial Intelligence Markup Language)目前被广泛应用在移动端虚拟助手的开发中。尽管ALICE采用的是启发式模板匹配的对话策略,但是它仍然被认为是同类型聊天机器人中性能最好的系统之一。此外,还有用于查询英国电话黄页的YAP[5]、用于外语学习伴侣的CSIEC[6]、用于哈佛大学数学教学的Sofia[7]等,在这里暂不展开介绍。

 

2001年,SmarterChild,模式匹配和脚本答案

彼得·列维坦(Peter Levitan)创办了ActiveBuddy公司,其机器人SmarterChild用在老牌即时通讯AIM上,能对用户查询给出反馈。如问‘昨晚纽约扬基队的得分是多少?’可以得到快速的回答。在某种程度上,它是后世Siri等语音搜索工具的早期版本。

它在2006年被微软收购,并利用其技术推出了Windows Live Agents。

2006年?,IBM Watson,DeepQA

Watson是一个专家系统,能直接用自然语言回答专业问题,提供专家级别的决策咨询;

2011年的时候,在一个叫危险边缘的问答节目中首次击败了人类。

2014 年IBM 正式创建了 Watson业务部,开始了商业化之旅。

2015年,Watson独立出Watson Health部门,进军健康医疗领域。到2016 年,Watson 大约花费了40 亿美元(约新台币1200 亿元)收购了4 家医疗数据公司,包括Explorys、Phytel 和Merge Healthcare。

2018年,有报告称Watson推荐了“多个不安全和不正确治疗建议”。同年,IBM解雇了大批Watson工程师。

 

综合来看,AI医疗在今天更适合解决那些琐碎、重复度高的医疗工作,比如誊写病历、看X光片、检查化验单等等,这些工作可以把医生的时间解放出来。让AI本身去治疗重大疾病,无论是技术能力还是安全风险上都无法承担。

从底层技术上来说,Watson 从一开始到现在都是由 DeepQA 驱动。简而言之,DeepQA 是一套集分析、推理与提供答案的复杂软件架构,这套架构能够读取数百万文本数据,再通过自然语言处理技术产生答案,最后根据问题的情景作出回答。(“Building Watson: An Overview of the DeepQA Project”)

2011 年,Siri,

2008年,苹果发布App Store,整合了众多网络服务功能的Siri上架。后来,苹果收购Siri于2011,在iso 5搭载Siri。Siri能够支持广泛的用户命令,包括执行电话操作,检查基本信息,安排事件和提醒,处理设备设置,搜索互联网,浏览区域,查找娱乐信息,并能够与iOS集成的应用程序进行互动。

siri原理图:

 

2014年,微软小冰,

2014年5月29日下午,微软(亚洲)互联网工程院发布了人工智能机器人“微软小冰”。

2015年,阿里小蜜,

阿里巴巴集团在2015年7月24日发布一款人工智能购物助理虚拟机器人,并取名“阿里小蜜”。

架构

 

2015年,京东JIMI

2015年10月20日 金融页面正式接入JIMI,无需排队,24小时服务。

 

2017年,百度unit

百度面向开发者推出的智能对话定制与服务平台。

 

 

从应用场景的角度来看,可以分为在线客服、娱乐、教育、个人助理和智能问答五个种类。

在线客服聊天机器人系统的主要功能是同用户进行基本沟通并自动回复用户有关产品或服务的问题,以实现降低企业客服运营成本、提升用户体验的目的。其应用场景通常为网站首页和手机终端。代表性的商用系统有小I机器人、京东的JIMI客服机器人等。用户可以通过与JIMI聊天了解商品的具体信息以及反馈购物中存在的问题等。值得称赞的是,JIMI具备一定的拒识能力,即能够知道自己不能回答用户的哪些问题以及何时应该转向人工客服。

娱乐场景下聊天机器人系统的主要功能是同用户进行开放主题的对话,从而实现对用户的精神陪伴、情感慰藉和心理疏导等作用。其应用场景通常为社交媒体、儿童玩具等。代表性的系统如微软“小冰”、微信“小微”、“小黄鸡”、“爱情玩偶”等。其中微软“小冰”和微信“小微”除了能够与用户进行开放主题的聊天之外,还能提供特定主题的服务,如天气预报和生活常识等。

应用于教育场景下的聊天机器人系统根据教育的内容不同包括构建交互式的语言使用环境,帮助用户学习某种语言;在学习某项专业技能中,指导用户逐步深入地学习并掌握该技能;在用户的特定年龄阶段,帮助用户进行某种知识的辅助学习等。其应用场景通常为具备人机交互功能的学习、培训类软件以及智能玩具等。这里以科大讯飞公司的开心熊宝(具备移动终端应用软件和实体型玩具两种形态)智能玩具为例,“熊宝”可以通过语音对话的形式辅助儿童学习唐诗、宋词以及回答简单的常识性问题等。

个人助理类应用主要通过语音或文字与聊天机器人系统进行交互,实现个人事务的查询及代办功能,如天气查询、空气质量查询、定位、短信收发、日程提醒、智能搜索等,从而更便捷地辅助用户的日常事务处理。其应用场景通常为便携式移动终端设备。代表性的商业系统有Apple Siri、Google Now、微软Cortana、出门问问等。其中,Apple Siri的出现引领了移动终端个人事务助理应用的商业化发展潮流。Apple Siri随着IOS 5一同发布,具备聊天和指令执行功能,可以视为移动终端应用的总入口,然而受到语音识别能力、系统本身自然语言理解能力的不足以及用户使用语音和UI操作两种形式进行人机交互时的习惯差异等限制,Siri没能真正担负起个人事务助理的重任。

智能问答类的聊天机器人主要功能包括回答用户以自然语言形式提出的事实型问题和需要计算和逻辑推理型的问题,以达到直接满足用户的信息需求及辅助用户进行决策的目的。其应用场景通常作为问答服务整合到聊天机器人系统中。典型的智能问答系统除了IBM Watson之外,还有Wolfram Alpha和Magi,后两者都是基于结构化知识库的问答系统,且分别仅支持英文和中文的问答。

 

参考博客:

https://www.gkzhan.com/tech_news/detail/206772.html

参考文献:

[1] Weizenbaum J. ELIZA—a computer program for the study of natural language communication between man and machine[J]. Communications of the ACM, 1966, 9(1): 36-45.

[2] Wilensky R, Chin D N, Luria M, et al. The Berkeley UNIX consultant project[J]. Computational Linguistics, 1988, 14(4): 35-84.

[3] http://www.loebner.net/Prizef/loebner-prize.html

[4] http://www.alicebot.org/

[5] Kruschwitz, U., De Roeck, A., Scott, P., Steel, S., Turner, R., and Webb, N. (1999). Natural language access to yellow pages. In Third International conference on knowledge-based intelligent information engineering systems, pages 34–37.

[6] Jia J. CSIEC (Computer Simulator in Educational Communication): A virtual context-adaptive chatting partner for foreign language learners[C]//Advanced Learning Technologies, 2004. Proceedings. IEEE International Conference on. IEEE, 2004: 690-692.

[7] Knill O, Carlsson J, Chi A, et al. An artificial intelligence experiment in college math education[J]. http://www. math. harvard. edu/~ knill/preprints/sofia. pdf, 2004.

[8] Ginzburg J, Fernandez R. Computational Models of Dialogue[M]// The Handbook of Computational Linguistics and Natural Language Processing. Wiley‐Blackwell, 2010:429-481.

[9] Jurafsky, D., & Martin, J. H. (2009). Speech and language processing an introduction to natural language processing, computational linguistics, and speech recognition. Prentice-Hall, Inc. Second Edition.

[10] Reiter E, Dale R. Building natural language generation systems[M]. Cambridge University Press, 2000.

[11] Z. Ji, Z. Lu, H. Li. An information Retrieval Approach to Short-text Conversation. arXiv: 1408.6988, 2014.

[12] Ritter A, Cherry C, Dolan W B. Data-Driven Response Generation in Social Media.[J]. Empirical Methods in Natural Language Processing, 2011:583-593.

[13] L. Shang, Z. Lu, and H. Li. Neural Responding Machine for Short-text Conversation. In Proceedings of ACL, 2015. 

[14] I.V. Serban., A. Sordoni, Y. Bengio et al. Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models. arXiv:1507.04808v2 [cs.CL] 25 Nov 2015.


http://chatgpt.dhexx.cn/article/eMm7GNae.shtml

相关文章

让你的MSN更精彩!聊天伴侣小i机器人试用体验

【 搜狐软件评测】MSN是目前最受欢迎的即时通讯软件之一,它提供了文字、语音、视频等多种即时通讯方式,并且能够在全球范围轻松传送文件、共享资源,让所有的沟通没有障碍。 MSN在全球有超过5亿的用户,随着它的不断改进完善&#…

讯飞离线语音命令词+TTS离线发音,实现命令词交互(windows dll for unity插件)

步骤一 登录讯飞平台注册并创建自己的应用 https://www.xfyun.cn 步骤二 下载离线命令词识别SDK windows MSC ,注意下载的SDK会根据你的appid捆绑在代码段里,应该是讯飞的版权策略 步骤三 下载离线语音合成(普通版)SDK &…

【Qbot】6.讯飞文字转语音Api使用/VITS派蒙复读机实现

该项目计划长期进行维护更新,欢迎star:https://github.com/zstar1003/Qbot 前言 看完流浪地球2之后,萌生了一个想法:我想给机器人完整的一生。作为一个完整的机器人,声音势必是其灵魂所在,正好go-cqhttp支…

android免费离线讯飞语音合成

前言:目前市面上的语音合成平台有很多,讯飞,百度等等。目前使用讯飞tts语音合成。 语音合成分为方式: 一、使用讯飞语音开放平台在线语音合成SDK。 优点:免费,有统计数据,发音人种类贼多。 缺…

Linux下 python调用讯飞离线语音合成(tts)

Linux下,使用Python调用讯飞TTS离线SDK,源代码: https://github.com/cch96/iflytek_tts具体使用方法参照readme 解决过程 Windows Windows的SDK有编译好的可以直接被python用ctypes模块调用的动态链接库。可以直接根据科大讯飞的接口文档…

使用讯飞tts+ffmpeg自动生成视频

起因 某日,看到一个营销号的视频说做视频日进斗金,大意是用软件识别文章小说,搭配一些图片转换成自己的视频。看完当时脑海里冒出一个念头,我也可以,于是有了这番尝试。 方案 首先文字方面,我选择了【聚合数…

构建简单的智能客服系统(三)——基于 UniMRCP 实现讯飞 TTS MRCP Server

上一篇我们封装了科大讯飞接口实现了 UniMRCP ASR Plugin,这篇文章我们再简单说一下 TTS 的实现。 MRCP plugin 以下内容请参考《基于 UniMRCP 实现讯飞 ASR MRCP Server》: UniMRCP 的编译、安装运行UniMRCP plugin 的加载、调用流程UniMRCP plugin 的…

ROS语音交互系统_(2)利用讯飞TTS实现ROS下语音合成播报

前言 - Writing a Simple Publisher and Subscriber (C++) - ubuntu16.04外接音箱无声音 1、先前准备 (1)在~/catkin_ws/src目录下执行 $ catkin_create_pkg voice_system roscpp rospy std_msgs (2࿰

讯飞tts调用

目标:能在arm开发板上运行 拿到arm版本libmcs.so库后尝试集成到开发板,导入库后运行10102错误,查找官方错误码。 注意到官方给的例子有两个参数: const char* session_begin_params "engine_type local,voice_namexiaoya…

讯飞tts语音引擎_讯飞输入法A.I.语音引擎再升级 更强大更实用!

时代在进步,用手打字已OUT,眼下是语音的大时代。近日,讯飞输入法Android版和iOS版更新A.I.语音引擎,进一步优化通用语音识别效果,同时还基于说话人和使用场景,重点提升语音候选词、噪声环境、轻声说话及专有名词的识别准确率。正是科大讯飞技术创新、成果落地的真实投映。…

基于ROS2和科大讯飞的文字转语音TTS入门教程

基于ROS2和科大讯飞的语音转文字入门教程 基于ROS2和科大讯飞的文字转语音TTS入门教程1.环境搭建2.创建工程3.编译和执行 基于ROS2和科大讯飞的文字转语音TTS入门教程 本文将展示,如何利用ROS2和科大讯飞的TTS模块,实现简单的文字转语音功能。利用ROS2&…

巧用讯飞TTS进行文本合成语音(LINUX操作系统)

因为工作需要用到文本转语音文件,然后进行播放的应用场景。 我先后研究了三种开源的框架程序,festival、ekho和espeak。但实际运行后,效果很差,也没精力训练调试它们。 后来我突然想起来在科大讯飞是语音处理的老大,TT…

初探机器学习之使用讯飞TTS服务实现在线语音合成

最近在调研使用各个云平台提供的AI服务,有个语音合成的需求因此就使用了一下科大讯飞的TTS服务,也用.NET Core写了一个小示例,下面就是这个小示例及其相关背景知识的介绍。 一、什么是语音合成(TTS) 1.1 What is 语音合…

麒麟系统虚拟机安装教程

作者:朱金灿 来源:clever101的专栏 为什么大多数人学不会人工智能编程?>>> 1.首先得安装VM Ware软件。 2.打开VM Ware,点击“文件”->“新建虚拟机”。 3.进入新建虚拟机向导,点击下一步。如下图&…

史上最最详细的win10虚拟机安装教程,手把手从头到尾

史上最最详细的win10虚拟机安装教程 1.安装VMware 12Pro 前天我安装了VM12,并安装了win10系统的虚拟机。遇到了很多问题,我想拿出来和大家分享一下解决办法。 首先,第一步先上下载地址: VMware 12下载地址 大家下载时记得选择普…

虚拟机安装教程

虚拟机安装教程   vmware10虚拟机是个软件,安装后可用来创建虚拟机,在虚拟机上再安装系统,在这个虚拟系统上再安装应用软件,所有应用就像操作一台真正的电脑,因此,我们可以利用虚拟机学习安装操作系统、…

Fedora虚拟机安装教程

Fedora虚拟机安装教程 (作者:Baron_wu 禁止转载) 获取VMware14 链接: https://pan.baidu.com/s/1WQuajxl2KOtcn9WYendglQ 提取码:2K32获取Fedora安装镜像 64bit : https://download.fedoraproject.org/pu…

win10虚拟机安装教程

win10虚拟机安装 下载iso镜像文件win10镜像安装步骤拍摄快照 下载iso镜像文件 首先我们需要准备一个win10的iso镜像系统,下载地址:https://msdn.itellyou.cn/ 我们选择最新版本就可以了,选择consumer editions版本(其实选择两个…

VMware16虚拟机安装教程

一、VMware下载 VMware下载地址:https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html 我的电脑是Windows电脑,所以选择Workstation 16 Pro for Windows下载,如果你的电脑事Linux系统,选择Work…

deepin虚拟机安装教程

deepinISO镜像:链接:https://pan.baidu.com/s/1yzxtAetA9eccO6pNFO6wTg 提取码:az78 --来自百度网盘超级会员V5的分享 deepin是Linux内核的,里面附带办公软件,今天小编就在虚拟机上体验一波!开车&#x…