认知智能介绍发展道翰天琼

article/2025/9/14 12:22:15

计算智能、感知智能和认知智能,是探索人工智能道路上的三个台阶。
在计算智能方面,机器早已远远超过人类。而在感知智能方面,机器也已达到可媲美人类的水平。科大讯飞在语音识别错误率上每年相对下降30%以上。在2018年CHiME-5国际多通道语音分离和识别大赛上,当面对大量噪声干扰、语音交叠的更难语音识别任务时,科大讯飞再次获得第一名。
基于语音识别、语音合成、语义理解、图像识别等技术,深耕人工智能19年的科大讯飞作为“中国智造”的影响力持续扩大。不仅首个认知智能国家重点实验室已经在讯飞落户,科大讯飞还在人工智能+脑科学等诸多前瞻科研领域展开了探索。
9月20日,AI WORLD 2018世界人工智能峰会重磅发布AI领域年度大奖——AI Era创新大奖,评选出2018年度对AI领域作出重大贡献,切实推动AI进步和发展的人物、企业和产品。科大讯飞凭借领先世界的智能语音技术成功登榜「中国AI领军企业TOP10」,科大讯飞创始人、董事长刘庆峰也被评选为「华人AI人物TOP10」。
此外,本次峰会同时也颁发了「AI产品影响力TOP10」,讯飞翻译机2.0成功入围。目前,讯飞翻译机2.0具备中文与33种语言即时互译、离线翻译、拍照翻译、方言翻译等功能,英文翻译水准达到大学六级水平。
科大讯飞已经在感知智能以及认知智能领域中的自然语言处理技术上领先世界,科大讯飞高级副总裁、研究院院长胡国平在AI WORLD 2018世界人工智能峰会上说:“机器的自然语言理解能力已经超过人类的平均水平,这是认知智能的重大突破。”
然而当谈到AI企业该如何彻底地迈上人工智能的最高台阶——认知智能时,胡国平表示:“在强调知识、推理能力的认知智能方面,机器与人类仍有差距。”自然语言处理技术的确是认知智能的重要技术基石,但即便是自然语言处理技术在特定领域已经超过人类,AI在认知智能层面依旧面临艰巨挑战。
“现在多数产业在认知智能上面的做法大多停留在纯文字层面,然而语言只是人类智慧的载体和表层,如果只纯粹在文字层面做认知智能,可能会有着极矮的天花板”,针对这一问题,胡国平在本次峰会上分享了认知智能下一步方向,“若想在认知智能路上走得更远,需要关注的是语言之下智慧本质”。
下面是科大讯飞高级副总裁、研究院院长胡国平在AI WORLD 2018世界人工智能峰会上的演讲。《认知智能最新进展及下一步思考》的主要内容:

胡国平:人工智能现在大家都习惯把它分为三个台阶,计算智能、感知智能和认知智能。计算智能方面,机器已经远远超过人类,而在感知智能方面,机器也可与人类媲美,而认知智能则强调知识、推理等相关的技能,能理解、会思考,这些方面机器与人之间依然存在差距。
全球首次通过国家执业医师资格的机器人:自然语言理解能力强,分数赶超人类考生

关于感知智能,这里有两个例子。首先是语音识别,包括科大讯飞在内的很多公司都把语言识别做得非常厉害。在过去的六年里,科大讯飞语言识别每年错误率相对下降30%,换言之,語音识别率从2012年的85%左右一路飙升到现在的97-98%。
语音合成亦是如此,科大讯飞语音合成自然度现在已经超过一般自然人的说话水平,今年1月,语音合成技术已经在中央电视台《创新中国》纪录片中正式上岗应用:将已故播音员李易老师的声音合成之后再现荧屏。
而认知智能涉及到语义理解、知识表达、联想推理、智能问答等问题,大部分技术专家都认为认知智能相比感知智能是更难的任务,而且是至关重要的任务。认知智能方面最典型的任务就是阅读理解:目前机器的阅读理解在精确匹配指标上已经超过人类的水平,机器的阅读理解指标达到82.48,人类平均水平则是82.3,这也是认知智能重大的突破。

当机器具有阅读能力后,科大讯飞训练机器人阅读医学书籍,2017年,科大讯飞“智医助理”机器人参加了国家临床执业医师综合笔试测试,并以456的高分通过该考试,成为全球首台通过人类行业准入考试的人工智能机器人。

此外,现在不仅认知智能国家重点实验室已经在讯飞落户,科大讯飞还在人工智能+脑科学等诸多前瞻科研领域展开了探索。
如何在认知智能路上走得更远?不能只停留在纯文字方面,更要重视语言之下的智慧本质

人工智能跟脑科学有非常多结合的地方,我下面要分享的内容则是关于认知智能下一步方向的思考。
先举几个例子,我们认为认知智能现在的做法属于纯文字层面,甚至是把文字当作符号的层面。我们看这些例子,例如父爱如山,我们知道父爱如山是指重的意思不是陡峭的意思。这里就存在着一个我们认为很重要的概念——语言的Grounding的问题。

平头哥——所有人知道云栖大会上发布的平头哥,如果你不了解这个词汇肯定会去查,如果查到是这样一段文字的描述,你可能无法真正形成对这样一个词汇的真实理解或者在大脑中的真实印象。于是你需要一张图片,甚至可能会去看一下它跟毒蛇搏斗的视频,才能形成对平头哥的概念、印象、知识。我们把这个叫作语言的Grounding,你必须要有这样的能力才能理解这个世界。人类的智能是基于多模态的,不是纯粹语言符号能够闭环自洽的,我们认为语言只是人类智慧的载体和表层,如果只在文字符号层面做认知智能,可能会有着极矮的天花板。
再举一个例子,苹果大还是鸡蛋大?你绝对不会去估算苹果10公分的长度,鸡蛋5公分的长度,苹果比鸡蛋大。而是在脑袋中苹果有一个印象,鸡蛋有一个印象,自然而然基于多模态甚至物理的印象就直接能够判断出来。我们认为语言只是智能的表层和载体,更多的智能在语言之下,这是对语言之下智慧本质的一些思考。
认知智能的挑战:难以像人类做到基于物体与时空感知的序列记忆和预测

生活在城市中的乌鸦为了吃到坚果,懂得利用马路上的汽车把坚果碾碎并在红灯让车停下来的时候,安全地吃到坚果,在这样一个观察和运用的过程中,乌鸦体现了自己的智慧,而这个过程中却 没有任何语言。我们认为语言之下智慧的本质还有一个通式,这个通式定义为对物体在三维空间加一维时间坐标下对序列的感知、记忆和预测的能力。在三维空间里,无论是人还是乌鸦,都在观察的过程中掌握了物体移动或者变化的规律。
人类也是这样的学习过程,在这个过程中实现了对物体、空间和时间的感知,并且把它们融合到一起,最终形成了智慧。

比如说一根火柴被点燃之后,也许没有书上写出这个火柴点燃之后是什么样,但是所有人都很清楚这根火柴点燃之后燃烧的形状,因为在你的脑中已经有过对它的记忆。如果火柴点一张纸,纸会被点着,这是你在记忆上掌握的知识。人类在所有和环境互动的过程中其实都自然而然的产生了很多的记忆,这些记忆形成了智慧,我们在预测的时候使用了这些智慧,也就有了潜意识。
科技馆有无源的自来水,悬空的水龙头不停往下流水。孩子们一开始都会对这个现象感到很惊讶,因为他们在正常环境的训练里已经认识到:水龙头后面应该有根管子才对。这其实也是序列记忆和预测运用在人们实际生活中的例子。脑科学研究者认为,学习和记忆是大脑工作的基本机理。我们也认为,序列的记忆和相应的预测能力也是人类大脑工作很重要的模式。
未来展望:训练AI机器多模态的建模和预测能力,从而获取智慧本质的通式
我们有一个猜想:最复杂的人类大脑本身的智慧也存在大道至简的通式,即多模态序列的记忆建模和预测的能力。这是有很大可能性的,虽然人类大脑中还有包括多巴胺、逻辑思考等更多的能力或功能,生活中很多的能力其实是靠多模态序列记忆和预测来实现知识积累和智慧应用的。

我们也在思考,如果让我们的AI看了一亿个视频,视频内容是车水马龙的道路之后,它到底能不能预测下一秒的路面会是什么情况?事实上,我并不清楚。这是验证刚才所说的通式比较理想的任务。我们希望一个机器看了很多的视频之后,能够基于深度学习继续不断地预测下去。这类任务的好处是什么?它一定程度上解决了有监督训练数据的问题:在所有的序列预测任务里,答案一定程度上是现成的,基于之前时刻的路况去预测下一时刻的路面情况,其实它的标注答案绝大部分就在当前的画面里。也许可以利用深度学习端到端的模式,加上一些抽象的能力,去实现这样一个序列任务上的建模和预测。
在未来科大讯飞希望用更有效的方法去训练机器的建模和预测能力,探寻智慧的本质,从而获取智慧本质的通式。例如,让机器拥有路况的预测能力,把摄像头换成驾驶员视角的高拍仪或者行车记录仪,也许我们在无人驾驶或者很多其它场合下的应用不止基于当前时刻的情况来做预测,而是基于一秒钟甚至更长时段内的路况来预测,无人驾驶会因此变得更智能、更安全。
当“Thanks”这个词出现在屏幕的时候,其实你的序列预测能够判断出来我的演讲已经结束了、我会说谢谢;我会走下台阶,在我的序列预测中,你们应该会鼓掌。

认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。

接口申请官网地址:www.weilaitec.com
接口地址(例子):
http://a239p06512.zicp.vip/Web/BuAppJava.bujqrex?apikey="+apikey+"&msg="+msg+"&ip="+ip
用户端消息内容。
String msg ="你在干嘛呀?";
apikey参数。这个apikey就是网站上申请的APIKEY
apikey ="";
//客户端ip,最终用户端的唯一标识(可以是用户端的IP,或者手机设备号,或者微信号或者,qq号码等能证明身份的唯一标识就可以)
String ip ="";
//这里一定要encode转换编码。转成GBK。
msg = URLEncoder.encode(msg, "GBK");
三个参数全部小写
msg参数就是传输过去的对话内容。
msg参数要编码成gbk,不然会乱码。
接口具体代码:
package ai.nlp.jiekou.test;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.UnsupportedEncodingException;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import ai.nlp.util.changliang.ChangLiangZi;
public class ApiTest {
/**
* Get请求,获得返回数据
* @param urlStr
* @return
*/
private static String opUrl(String urlStr)
{
URL url = null;
HttpURLConnection conn = null;
InputStream is = null;
ByteArrayOutputStream baos = null;
try
{
url = new URL(urlStr);
conn = (HttpURLConnection) url.openConnection();
conn.setReadTimeout(5 * 10000);
conn.setConnectTimeout(5 * 10000);
conn.setRequestMethod("POST");
if (conn.getResponseCode() == 200)
{
is = conn.getInputStream();
baos = new ByteArrayOutputStream();
int len = -1;
byte[] buf = new byte[128];
while ((len = is.read(buf)) != -1)
{
baos.write(buf, 0, len);
}
baos.flush();
String result = baos.toString();
return result;
} else
{
throw new Exception("服务器连接错误!");
}
} catch (Exception e)
{
e.printStackTrace();
} finally
{
try
{
if (is != null)
is.close();
} catch (IOException e)
{
e.printStackTrace();
}
try
{
if (baos != null)
baos.close();
} catch (IOException e)
{
e.printStackTrace();
}
conn.disconnect();
}
return ChangLiangZi.WU;
}
public static void main(String args []){
//三个参数全部小写
//msg参数就是传输过去的对话内容。
//msg参数要编码成gbk,不然会乱码。
String msg ="你在干嘛呀?";
//apikey参数。
String apikey ="UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV";
//客户端ip,最终用户端的唯一标识(可以是用户端的IP,或者手机设备号,或者微信号或者,qq号码等能证明身份的唯一标识就可以)
String ip ="127.0.0.1";
//这里一定要encode转换编码。转成GBK。
try
{
msg = URLEncoder.encode(msg, "GBK");
} catch (UnsupportedEncodingException e)
{
e.printStackTrace();
}
System.out.println(opUrl("http://a239p06512.zicp.vip/Web/BuAppJava.bujqrex?apikey="+apikey+"&msg="+msg+"&ip="+ip));
}
}


http://chatgpt.dhexx.cn/article/7saVrFMx.shtml

相关文章

【干货】认知智能时代:知识图谱实践案例集.pdf(附下载链接)

大家好,我是文文(微信号:sscbg2020),今天给大家分享中国电子技术标准化研究院于2021年1月份发布的干货报告《认知智能时代:知识图谱实践案例集.pdf》,关注知识图谱及人工智能伙伴们别错过了&…

肖仰华:知识图谱与认知智能

今天跟大家分享的主题是《知识图谱与认知智能》。 知识图谱自2012年提出至今,发展迅速,如今已经成为人工智能领域的热门问题之一,吸引了来自学术界和工业界的广泛关注,在一系列实际应用中取得了较好的落地效果,产生了巨…

【认知智能】邓志东教授:如何迈向认知智能与通用人工智能

中国金融信息网讯 9月10日-13日,2017世界物联网博览会在无锡召开,清华大学计算机科学与技术系教授邓志东在网易AI公开课上介绍了人工智能现状和复兴原因,及其商业价值和中国人工智能产业发展的优势和短板,以及如何迈向认知智能与通…

智能发展的四个层次:运算智能,感知智能,认知智能,强智能。道翰天琼认知智能。

2016年,人工智能成为产业界和学术界的大热词。年初,李世石与Alpha Go的人机围棋大战吸睛无数,人工智能的话题始料未及地席卷了世界每处。此外,今年也恰逢人工智能学科诞生一甲子,Alpha Go再一次打败人类,受…

知识图谱认知智能理论与实战----------第一章 知识图谱概述

文章目录 一. 什么是知识图谱二. DIKW模型三. 知识图谱技术体系四. 知识图谱辨析I. 知识图谱与自然语言处理II. 知识图谱与图数据库III. 知识图谱与语义网络IV. 知识图谱与搜索引擎 一. 什么是知识图谱 知识图谱:是一种对知识间的关联进行建模的方法,目…

新基建之人工智能认知智能发展新阶段

前言 城市新型基础设施建设是城市化发展的载体,也是城市化发展的需求。当前我国城 镇化进程的发展规模和速度令人瞩目,2019 年我国城镇化率达到 60.6%。然而,与美、日等 发达经济体 82%到 91%的城市化水平仍有较大差距。随着城乡融合战略的推…

认知智能整体技术框架简介介绍

认知智能整体术体系简介 认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的…

认知智能简介介绍简述 新智能时代到来

认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口&#…

认知智能发展典型案例解析

随着认知智能技术逐步发展,认知智能已能够为各类场景提供 更专业、更个性、更有互动感的服务,应用愈发广泛且多样,典型应用覆盖金融、制造、教育、零售、医疗、公安等,涉及城市数字 化转型领域的方方面面,深刻地改变着…

数据库|(六)连接查询

(六)连接查询 1. 笛卡尔乘积2. 连接查询分类2.1 按年代分2.2 按功能分 3. 等值连接(sql 92标准)3.1 特点3.2 一般使用3.3 为表取别名3.4 两表顺序可以调换3.5 可以加筛选3.6 可以加分组3.7 可以加排序3.8 可以实现三表连接 4. 非等值连接(sql 92标准)5. …

数据库的内连接查询

数据库的内连接查询 数据库查询时,用户需要查询的数据有时并不都在一个数据表中,可能涉及一个以上的表,这时就要使用多表查询 多表查询是将多个表连接在一起的查询,也称为连接查询 根据查询的需要,连接查询主要分为内…

连接查询实验

一、实验目的 1. 掌握连接查询方法。 2. 掌握各种查询的使用方法。 二、实验硬、软件环境 开发环境: Windows XP 操作系统及以上版本 数据库管理系统:SQL Server 2012 运行环境:Windows XP 操作系统及以上版本 三、实验内容及步骤 1…

SQL server连接查询

目录 前沿小补充等值与非等值连接查询自身连接外连接多表连接 前沿小补充 例3.48 查询平均成绩大于等于80分的学生学号和平均成绩 SELECT Sno,AVG(Grade) FROM SC WHERE AVG(Grade)>80 GROUP BY Sno; SELECT * FROM SC;此时发现: 这是因为WHERE子句中是不能用…

MySQL数据库——连接查询

第1关 内连接查询 一、本关任务:使用内连接查询数据表中学生姓名和对应的班级。 内连接查询 仅将两个表中满足连接条件的行组合起来作为结果集,称为内连接; 关键字:[inner] join ... on。 语法: 表1 [inner] joi…

数据库-连接查询

数据库连接查询可以进行多表联查,可以同时展示多个表的数据,方便进行查阅。那么连接查询分为多种方式,我们可以根据要求筛选合适的方式进行查询。下面我们来讲解一下怎么进行多表联查。 首先连接查询大致分为3种形式,分别为&…

当app发生闪退,测试人员该如何进行定位?

对app闪退问题进行定位 1、使用usb连接电脑和手机,打开手机的开发者模式 2、使用adb connect命令去进行连接,如:adb connect ip地址 3、再用adb devices命令查看是否成功连接设备 4、adb logcat -v time >d:\logcat.txt 生成日志文件到D盘…

简单adb 命令抓Android app 闪退日志

系统:Windows 1.手机连上电脑,打开开发者选项,打开调试模式 2.打开cmd,输入命令adb devices查看设备连接成功 下面进入正题: 查看手机的所有日志 adb logcat 只获取该应用的日志 adb logcat | findstr 应用包名开…

[Android Studio]开发APP应用出现软件程序打开闪退的排错

🟧🟨🟩🟦🟪 Android Debug🟧🟨🟩🟦🟪 Topic 发布安卓学习过程中遇到问题解决过程,希望我的解决方案可以对小伙伴们有帮助。 📋笔记目…

iOS App 闪退监测

为保障线上 App 的用户体验,我们一般都会对线上 App 的 crash 率做实时监控,一旦检测到 spike,可以即刻调查原因,但这一切的前提是 crash 日志能够准确上报。 crash 日志上报有两个难点: crash handler 安装之前的代…

苹果上传闪退 php,苹果手机app频繁闪退原因以及解决方法

就算再流畅的ios系统,再好的iPhone手机,用久了都会遇到一个这样子的问题,就是闪退的问题,而且APP闪退占据多数。那该怎么修复呢?闪电修告诉你原因和搞定的步骤。 闪电修上门维修手机 我们先了解下iPhone闪退的原因: 1.插件影响程序的正常运行,而导致APP闪退 2.下载的软件…