20篇聊天机器人领域必读论文速递!

article/2025/8/22 10:48:49

聊天机器人(Chatbot)是经由对话或文字进行交谈的计算机程序。其能够模拟人类对话,通过图灵测试。自1966年来人类从未停止过对聊天机器人的探索。现如今,苹果语音助手Siri,微软的小冰、小娜、Rinna、Tay、Zo、Ruk kkuh,亚马逊的Echo,百度的小度机器人,京东JIMI客服机器人,网易七鱼等Chatbot纷纷进驻到生活的各个领域,改变着我们的生活。

历史发展脉络

  • 1966 年,MIT 的计算机科学家 Joseph Weizenbaum 发表了 ELIZA,它可以根据人工设计的脚本与人类交流,是世界上第一个模仿人类谈话的机器人;
  • 1971年, 斯坦福大学的Kenneth Colby开发出Parry聊天机器人,它模仿偏执狂患者,这是第一个通过图灵测试的聊天机器人;
  • 1988 年,加州大学伯克利分校的 Robert Wilensky 等人开发了名为 UNIX Consultant 的聊天机器人系统;
  • 1990 年,美国人 Hugh Loebner 设立 Loebner Prize,奖励首个与人类回复无差别的计算机程序,即聊天机器人系统;
  • 1995 年,Richard Wallace 博士开发的ALICE 系统允许用户自定义自己的聊天机器人,被认为是20世纪最伟大的聊天机器人。ALICE在 2000、2001 和 2004 年三次斩获勒布纳人工智能奖(Loebner Prize),该奖项颁发给最像人类的系统;
  • 2001 年,SmarterChild 在短信和即时信息中广泛流行,聊天机器人第一次被应用在即时通信领域;
  • 2006 年,IBM Watson 能够用自然语言回答问题;
  • 2010 年,苹果语音助手 Siri 诞生;
  • 之后,全球各大公司开始推出 Chatbots 平台或开源架构。

必读论文推荐

1. Dialog State Tracking: A Neural Reading Comprehension Approach

作者:Shuyang Gao, Abhishek Sethi, Sanchit Agarwal, Tagyoung Chung, Dilek Hakkani-Tur

链接:https://www.aminer.cn/pub/5de0b9f3df1a9c0c41598a75/dialog-state-tracking-a-neural-reading-comprehension-approach

对话状态追踪用于在给定所有先前对话的情况下估计当前的对话状态。机器阅读理解则侧重于构建系统,以读取文本段落并回答基于段落理解的问题。本篇论文将对话状态追踪转化为一项机器阅读理解任务,以基于上下文回答当前的对话状态是什么这一问题。传统的状态跟踪方法通常将对话状态预测为本体中所有可能的槽值在封闭集合上的分布,而本文使用简单的基于注意力的神经网络来指向对话中的槽值。

 

2. Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations

作者:Karthik Gopalakrishnan, Behnam Hedayatnia, Qinlang Chen, Anna Gottardi, Sanjeev Kwatra, Anu Venkatesh, Raefer Gabriel, Dilek Hakkani-Tür

发表:Interspeech Conference

链接:https://www.aminer.cn/pub/5db92b0647c8f7664621a7e6/topical-chat-towards-knowledge-grounded-open-domain-conversations

建立可以与人类进行深层次、开放性对话的社交机器人,是人工智能领域的重大挑战之一。Amazon团队开发的Topical-Chat是一个基于知识的人-人之间开放领域对话数据集(Knowledge-Grounded Open-Domain Conversations)。其中的基础知识涵盖8个广泛的主题,并且对话伙伴没有明确定义的角色,有助于对开放域对话式AI的进一步研究。本文还在Topical-Chat上训练了几种最新的编码器-解码器对话模型,并使用自动和人工评估以进行基准测试。

 

3. MoEL: Mixture of Empathetic Listeners

作者:Zhaojiang Lin, Andrea Madotto, Jamin Shin, Peng Xu, Pascale Fung

链接:https://www.aminer.cn/pub/5db9294b47c8f766461f2f8d/moel-mixture-of-empathetic-listeners

以往对移情对话系统的研究主要关注在特定情绪下产生的反应。但是,产生共情不仅需要具备生成情绪反应的能力,更需要理解用户的情绪并适当地予以回复。本篇论文提出全新的基于端到端(End-to-End)在对话系统中建立移情模型的方法:移情听众的混合物(MoEL)。这一模型首先捕获用户的情绪并输出情绪分布。基于此,MoEL将结合优化后的侦听器的对某些情绪做出的反应,从而产生移情。

 

4. Ethical Challenges in Data-Driven Dialogue Systems

作者:Peter Henderson, Koustuv Sinha, Nicolas Angelard-Gontier, Nan Rosemary Ke, Genevieve Fried, Ryan Lowe, Joelle Pineau

发表: In the 2018 AAAI/ACM Conference on AI, Ethics, and Society

链接:https://www.aminer.cn/pub/5a4aef9e17c44a2190f7a8b1/ethical-challenges-in-data-driven-dialogue-systems

本篇论文重点介绍对话系统研究中可能出现的道德问题,包括:数据驱动系统中的隐性偏见、对抗性示例的出现、潜在的隐私侵犯源、安全问题,强化学习系统的特殊考虑以及可复制性问题等。

 

5. MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling

作者:Pawel Budzianowski, Tsung-Hsien Wen, Bo-Hsiang Tseng, Iñigo Casanueva, Stefan Ultes, Osman Ramadan, Milica Gasic

链接:https://www.aminer.cn/pub/5bdc315017c44a1f58a05b9f/multiwoz-a-large-scale-multi-domain-wizard-of-oz-dataset-for-task

尽管机器学习已成为对话研究界的主要场景,但真正的突破已被可用数据的规模所阻碍。为了解决这个基本障碍,本篇论文引入了 Multi-Domain Wizard-of-Oz 数据集(MultiWOZ),这是一个跨越多个领域和主题的完全标记的人与人的书面对话数据集。它的对话数量达到了10k,比所有先前注释的面向任务的语料库大至少一个数量级。除了是标有对话信念状态和对话行为的开源数据集之外,这项工作的贡献有两方面:首先,提供数据收集程序的详细描述以及数据结构和分析的摘要。数据收集渠道完全基于众包,无需聘请专业注释人员;其次,报告了一组信念跟踪,对话行为和回复生成的基准结果,显示了数据的可用性,并为未来的研究设定了基线。

 

6. A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version

作者:Iulian Vlad Serban, Ryan Lowe, Peter Henderson, Laurent Charlin, Joelle Pineau

发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/5b3d98bd17c44a510f800274/a-survey-of-available-corpora-for-building-data-driven-dialogue-systems-the

本篇论文告诉我们目前有哪些可用于对话生成系统的开源数据集,并且分析了它们各自的重要特性,以及该如何使用他们。此外讨论了它们除了对话系统外的其他用途,以及这些数据集对应的检测方法。

 

7. The Design and Implementation of XiaoIce, an Empathetic Social Chatbot

作者:Li Zhou, Jianfeng Gao, Di Li, Heung-Yeung Shum

发表:Computational Linguistics

链接:https://www.aminer.cn/pub/5c5ce50d17c44a400fc38d54/the-design-and-implementation-of-xiaoice-an-empathetic-social-chatbot

这是由微软研究员发表的关于智能语音助手小冰的论文。小冰是一个独特的人工智能伴侣,具有情感联系,满足人类对交流、感情和社会归属的需求。本篇论文在系统设计中考虑了智商和情商,将人机社交聊天作为马尔可夫决策过程(MDP)的决策,并优化了小冰的长期用户参与度和预期的每次会话对话。本篇文章详细介绍了系统架构和关键组件,包括对话管理器、核心聊天、技能和移情计算模块;并展示了小冰如何动态识别人类的感受和状态,理解用户意图,并在长时间的对话中响应用户需求。

 

8. A Network-based End-to-End Trainable Task-oriented Dialogue System

作者:Lina Maria Rojas-Barahona,Milica Gasic, Nikola Mrksic, Pei-Hao Su, Stefan Ultes, Tsung-Hsien Wen, Steve J. Young, David Vandyke

链接:https://www.aminer.cn/pub/59ae3c3a2bbe271c4c71fcd9/a-network-based-end-to-end-trainable-task-oriented-dialogue-system

让机器去和人类自然的交谈是具有挑战性的。最近的任务型对话系统需要创造几个部分并且通常这需要大量的人工干预,或者需要标注数据去解决各部分训练的问题。本篇论文提出了一种端到端的任务型对话系统(End-to-End trainable system),它采取了一种基于管道框架的新颖的收集对话数据的方法。这个方法确保轻松实现对话系统而不用过多的人工干预。

 

9. Neural Belief Tracker: Data-Driven Dialogue State Tracking

作者:Nikola Mrksic, Diarmuid Ó Séaghdha, Tsung-Hsien Wen, Blaise Thomson, Steve J. Young

链接:https://www.aminer.cn/pub/57a4e921ac44365e35c9913a/neural-belief-tracker-data-driven-dialogue-state-tracking

现代口语对话系统的核心组成部分之一是 belief tracker,它可以在对话的每一步估计用户的目标。然而,目前大多数方法难以扩展到更大、更复杂的对话领域。这是由于他们依赖:a)口语理解(Spoken Language Understanding,SLU)模型,需要大量注释的训练数据;或者 b)手工制作的词汇表,用于捕捉用户语言中的一些词语变种。本篇论文提出了一个新的 Neural Belief Tracking(NBT)框架,通过将模型建立在表征学习上以此克服了这些问题。NBT 模型对预训练的词向量进行推理,学习将它们组合成用户话语和对话上下文的分布式表示。

 

10. Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses

作者:Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier, Yoshua Bengio, Joelle Pineau

链接:https://www.aminer.cn/pub/59ae3c262bbe271c4c71ea58/towards-an-automatic-turing-test-learning-to-evaluate-dialogue-responses

本篇论文使用语境和真实反应来对模型生成的反应进行打分,并和人类打分的分值进行比较,从而达到一种自动进行图灵检测效果。训练出来的模型可以生成符合人类判断、能回答输入语句的对话。 在给定地面实况的情况下,以往的工作都是计算生成话语和地面实况的相似性(包括字面上、语义上),本篇论文从人的理解角度出发,对生成的反应进行度量。

 

11. Adversarial Learning for Neural Dialogue Generation

作者:Jiwei Li, Will Monroe, Tianlin Shi, Alan Ritter, Dan Jurafsky

链接:https://www.aminer.cn/pub/58d82fcbd649053542fd6082/adversarial-learning-for-neural-dialogue-generation

 

12. To Plan or not to Plan? Discourse Planning in Slot-Value Informed Sequence to Sequence Models for Language Generation

作者:Neha Nayak, Dilek Hakkani-Tür, Marilyn A. Walker, Larry P. Heck

发表:Interspeech Conference

链接:https://www.aminer.cn/pub/5a73cb6317c44a0b30358265/to-plan-or-not-to-plan-discourse-planning-in-slot-value-informed

 

13. Training End-to-End Dialogue Systems with the Ubuntu Dialogue Corpus

作者:Ryan Thomas Lowe, Nissan Pow, Iulian Vlad Serban, Laurent Charlin, Chia-Wei Liu, Joelle Pineau

发表:Dialogue & Discourse 

链接:https://www.aminer.cn/pub/58d82fecd649053542fdc665/training-end-to-end-dialogue-systems-with-the-ubuntu-dialogue-corpus

 

14. A Copy-Augmented Sequence-to-Sequence Architecture Gives Good Performance on Task-Oriented Dialogue

作者:Mihail Eric, Christopher D. Manning

链接:https://www.aminer.cn/pub/58d82fd2d649053542fd76c7/a-copy-augmented-sequence-to-sequence-architecture-gives-good-performance-on-task

 

15. Learning Symmetric Collaborative Dialogue Agents with Dynamic Knowledge Graph Embeddings

作者:He He, Anusha Balakrishnan, Mihail Eric, Percy Liang

链接:https://www.aminer.cn/pub/599c7953601a182cd263067d/learning-symmetric-collaborative-dialogue-agents-with-dynamic-knowledge-graph-embeddings

 

16. Key-Value Retrieval Networks for Task-Oriented Dialogue

作者:Mihail Eric, Lakshmi Krishnan, Francois Charette, Christopher D. Manning

链接:https://www.aminer.cn/pub/5d9edbfa47c8f7664602e485/key-value-retrieval-networks-for-task-oriented-dialogue

 

17. Learning Robust Dialog Policies in Noisy Environments

作者:Maryam Fazel-Zarandi, Shang-Wen Li, Jin Cao, Jared Casale, Peter Henderson, David Whitney, Alborz Geramifard

链接:https://www.aminer.cn/pub/5a73cbc317c44a0b3035eb5a/learning-robust-dialog-policies-in-noisy-environments

 

18. Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning

作者:Jason D. Williams, Kavosh Asadi, Geoffrey Zweig

链接:https://www.aminer.cn/pub/58d82fcbd649053542fd5e67/hybrid-code-networks-practical-and-efficient-end-to-end-dialog-control-with

 

19. The Dialog State Tracking Challenge Series: A Review

作者:Jason D. Williams, Antoine Raux, Matthew Henderson

发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/57a4e937ac44365e35c9cbfe/the-dialog-state-tracking-challenge-series-a-review

 

20. How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

作者:Chia-Wei Liu, Ryan Lowe, Iulian Vlad Serban, Michael Noseworthy, Laurent Charlin, Joelle Pineau

链接:https://www.aminer.cn/pub/573696106e3b12023e5239eb/how-not-to-evaluate-your-dialogue-system-an-empirical-study-of-unsupervised

 

 


http://chatgpt.dhexx.cn/article/O3RN3sj0.shtml

相关文章

野火i.MX Linux开发实战指南

1. 为什么学习Linux开发 本章主要从Linux的应用场景,程序员的技能学习,职业方向来 讨论为什么需要学习Linux开发并对如何学好Linux开发提出了一些建议。 1.1. Linux的应用场景 对于一般用户来说,因为经常接触PC、手机,可能会知…

聊天机器人历史

定义 模仿人-人交互的模式来构建人机交互系统,我们称之为对话系统(Spoken Dialogue Systems, SDSs)(Lopez-Cozar &Araki, 2005; McTear, 2004; Pieraccini, 2012)或聊天机器人。 时间?叫什么&#xff…

让你的MSN更精彩!聊天伴侣小i机器人试用体验

【 搜狐软件评测】MSN是目前最受欢迎的即时通讯软件之一,它提供了文字、语音、视频等多种即时通讯方式,并且能够在全球范围轻松传送文件、共享资源,让所有的沟通没有障碍。 MSN在全球有超过5亿的用户,随着它的不断改进完善&#…

讯飞离线语音命令词+TTS离线发音,实现命令词交互(windows dll for unity插件)

步骤一 登录讯飞平台注册并创建自己的应用 https://www.xfyun.cn 步骤二 下载离线命令词识别SDK windows MSC ,注意下载的SDK会根据你的appid捆绑在代码段里,应该是讯飞的版权策略 步骤三 下载离线语音合成(普通版)SDK &…

【Qbot】6.讯飞文字转语音Api使用/VITS派蒙复读机实现

该项目计划长期进行维护更新,欢迎star:https://github.com/zstar1003/Qbot 前言 看完流浪地球2之后,萌生了一个想法:我想给机器人完整的一生。作为一个完整的机器人,声音势必是其灵魂所在,正好go-cqhttp支…

android免费离线讯飞语音合成

前言:目前市面上的语音合成平台有很多,讯飞,百度等等。目前使用讯飞tts语音合成。 语音合成分为方式: 一、使用讯飞语音开放平台在线语音合成SDK。 优点:免费,有统计数据,发音人种类贼多。 缺…

Linux下 python调用讯飞离线语音合成(tts)

Linux下,使用Python调用讯飞TTS离线SDK,源代码: https://github.com/cch96/iflytek_tts具体使用方法参照readme 解决过程 Windows Windows的SDK有编译好的可以直接被python用ctypes模块调用的动态链接库。可以直接根据科大讯飞的接口文档…

使用讯飞tts+ffmpeg自动生成视频

起因 某日,看到一个营销号的视频说做视频日进斗金,大意是用软件识别文章小说,搭配一些图片转换成自己的视频。看完当时脑海里冒出一个念头,我也可以,于是有了这番尝试。 方案 首先文字方面,我选择了【聚合数…

构建简单的智能客服系统(三)——基于 UniMRCP 实现讯飞 TTS MRCP Server

上一篇我们封装了科大讯飞接口实现了 UniMRCP ASR Plugin,这篇文章我们再简单说一下 TTS 的实现。 MRCP plugin 以下内容请参考《基于 UniMRCP 实现讯飞 ASR MRCP Server》: UniMRCP 的编译、安装运行UniMRCP plugin 的加载、调用流程UniMRCP plugin 的…

ROS语音交互系统_(2)利用讯飞TTS实现ROS下语音合成播报

前言 - Writing a Simple Publisher and Subscriber (C++) - ubuntu16.04外接音箱无声音 1、先前准备 (1)在~/catkin_ws/src目录下执行 $ catkin_create_pkg voice_system roscpp rospy std_msgs (2࿰

讯飞tts调用

目标:能在arm开发板上运行 拿到arm版本libmcs.so库后尝试集成到开发板,导入库后运行10102错误,查找官方错误码。 注意到官方给的例子有两个参数: const char* session_begin_params "engine_type local,voice_namexiaoya…

讯飞tts语音引擎_讯飞输入法A.I.语音引擎再升级 更强大更实用!

时代在进步,用手打字已OUT,眼下是语音的大时代。近日,讯飞输入法Android版和iOS版更新A.I.语音引擎,进一步优化通用语音识别效果,同时还基于说话人和使用场景,重点提升语音候选词、噪声环境、轻声说话及专有名词的识别准确率。正是科大讯飞技术创新、成果落地的真实投映。…

基于ROS2和科大讯飞的文字转语音TTS入门教程

基于ROS2和科大讯飞的语音转文字入门教程 基于ROS2和科大讯飞的文字转语音TTS入门教程1.环境搭建2.创建工程3.编译和执行 基于ROS2和科大讯飞的文字转语音TTS入门教程 本文将展示,如何利用ROS2和科大讯飞的TTS模块,实现简单的文字转语音功能。利用ROS2&…

巧用讯飞TTS进行文本合成语音(LINUX操作系统)

因为工作需要用到文本转语音文件,然后进行播放的应用场景。 我先后研究了三种开源的框架程序,festival、ekho和espeak。但实际运行后,效果很差,也没精力训练调试它们。 后来我突然想起来在科大讯飞是语音处理的老大,TT…

初探机器学习之使用讯飞TTS服务实现在线语音合成

最近在调研使用各个云平台提供的AI服务,有个语音合成的需求因此就使用了一下科大讯飞的TTS服务,也用.NET Core写了一个小示例,下面就是这个小示例及其相关背景知识的介绍。 一、什么是语音合成(TTS) 1.1 What is 语音合…

麒麟系统虚拟机安装教程

作者:朱金灿 来源:clever101的专栏 为什么大多数人学不会人工智能编程?>>> 1.首先得安装VM Ware软件。 2.打开VM Ware,点击“文件”->“新建虚拟机”。 3.进入新建虚拟机向导,点击下一步。如下图&…

史上最最详细的win10虚拟机安装教程,手把手从头到尾

史上最最详细的win10虚拟机安装教程 1.安装VMware 12Pro 前天我安装了VM12,并安装了win10系统的虚拟机。遇到了很多问题,我想拿出来和大家分享一下解决办法。 首先,第一步先上下载地址: VMware 12下载地址 大家下载时记得选择普…

虚拟机安装教程

虚拟机安装教程   vmware10虚拟机是个软件,安装后可用来创建虚拟机,在虚拟机上再安装系统,在这个虚拟系统上再安装应用软件,所有应用就像操作一台真正的电脑,因此,我们可以利用虚拟机学习安装操作系统、…

Fedora虚拟机安装教程

Fedora虚拟机安装教程 (作者:Baron_wu 禁止转载) 获取VMware14 链接: https://pan.baidu.com/s/1WQuajxl2KOtcn9WYendglQ 提取码:2K32获取Fedora安装镜像 64bit : https://download.fedoraproject.org/pu…

win10虚拟机安装教程

win10虚拟机安装 下载iso镜像文件win10镜像安装步骤拍摄快照 下载iso镜像文件 首先我们需要准备一个win10的iso镜像系统,下载地址:https://msdn.itellyou.cn/ 我们选择最新版本就可以了,选择consumer editions版本(其实选择两个…