ChatGPT引发的人机交互发展历程与升级思考

article/2025/9/14 3:23:48

ChatGPT自从去年12月火爆以来一直热度不减,最近正好研读了科技之巅,书中详细阐述了人机交互、人工智能、算力算法等技术的发展历史,本文主要围绕ChatGPT引发的人机交互方面的思考。

在讨论人机交互之前,首先需要说明的一点,目前计算机发展的结果已经从原来作为科学计算工具转变为信息处理和信息交互工作,计算机通过软硬件帮助大家做业务研究或管理决策,目前大部分办公室白领、生产平台员工、智能工厂员工等从事的工作不是实际操作机器,而是要依赖一台计算机,甚至是一台能远程控制机器的计算机,计算机已经涉及人们的方方面面。

那么,人机交互是什么呢?人机交互是为了解决人类与机器(作为工具)之间的交流问题。人类和计算机的交流和互动是人机交互技术的核心,所有交互技术的发展都是用来提升人机交互的体验和效率。

人机交互从最初的穿孔卡片--》专用编程语言--》图形界面和鼠标操控--》Apple Siri/Google Assistant自然语言关键词交互--》ChatGPT自然语言理解交互--》Oculus Rift VR沉浸式虚拟现实--》Magic Leap Microsoft Hololens AR/MR增强/混合现实,使得人机交互更加符合人类自然的交互方式,从直观化和便捷化,发展到后来的可穿戴化,最后到达本能化和植入化。

应该说,ChatGPT彻底改变了以往我们使用计算机的应用入口,目前大家上互联网的入口主要还是搜索引擎,也有一些app,比如头条,小红书、b站等,但这些入口都有一个问题,主要还是通过关键词匹配内容,最多加入一些内容相关和个性化特征。但ChatGPT天生就是用大量语料训练的自然语言大模型,他解决了自然语言的分词、实体识别、关系识别、意图识别等等,而且ChatGPT是AIG的,即通用人工智能,解决大众普适的各类自然语言的问题,ChatGPT的受众更广泛,使用更自然,相比较以往的搜索引擎、语音助手、智能助手,ChatGPT更自然,正好是人机交互的发展所需,相当于是一种新的人机交互应用入口,大家称之为LUI(即Language User Interface),未来ChatGPT与各行各业的业务结合,一定会出现各种应用,比如ChatGPT+能源助手等。以下回顾了人机交互的发展历程。

1.结合手机的智能助手Apple Siri界面:Siri是2009年第一次出现在苹果手机,Siri不单单是一个搜索引擎,而是一个处理引擎,集成了AI、语音识别(与Nuance合作)、语音文字聊天服务和资源整合,人类通过与Siri大量的交流,Siri能够从交流中获取用户需求,并结合集成的各项技术和资源提供个性化答案。目前ChatGPT做到了更进一步,不单单是关键词,对整个语句进行了语义上下文理解,集合后端的大语言模型,提供有针对性的中性答案,人类也可以通过与ChatGPT互动,引导其提供某些倾向性的答案,相信后续的各种ChatGPT+业务应用场景会雨后春笋班的涌现出来。

2.手势界面:GUI界面需要键盘鼠标,触摸屏需要占用人类一两根手指,而手势界面是通过3D视觉识别技术实现的,核心是传感器和动作识别,所以,传感线和动作空间确定了手势界面的分层级别,平时玩游戏的游戏手柄相当于二维的触控手柄,而Microsoft Kinect体感游戏模块的动作识别就是三维空间的动作识别,Kinect通过深度摄像头,利用里面的红外线处理场景,获得物体景深信息并编码,再通过图像传感器读取编码后的场景,最后通过算法推算出场景的三维信息,非常复杂,要求高效,Kinect集成了动态捕捉、影像辨识、语音输入识别、多人互动等功能,应该是Kinect开启了人机交互的新纪元,但在三维空间中人机交互的动作识别和处理速度要求更高,XBOX就集成了Kinect,从而催生出手势界面和语音接口。

3.语音接口界面:语音接口其实是在AI、语音识别、自然语言处理和大语言模型技术催生下的产物,语音接口使得人机交互更加自然,计算机更贴心友好和个性化,而且受众用户也比图形用户界面广泛,比如老人、盲人,目前随着微信等即时通讯app的发展,语音接口已经成为人机交互的重要入口,特别是随着最近ChatGPT的火爆,后续一定会忘LUI方向发展,使得人机交互更加自然便捷。

4.智能可穿戴设备界面:目前大家每天用的最多的设备是手机,随着智能化可穿戴设备的出现,有可能有所转变,比如智能手表,智能手环,智能服饰,Google Glass眼镜,头盔等,这些设备或多或少具有语音识别、健康跟踪检测,健康指导指南、信息提醒等功能,我认为这些可穿戴设备都是一些过渡产品,未来可能会出现更加自然的人机融合产品。

5.沉浸式交互界面:VR是结合了众多人机交互接口技术的沉浸式超凡用户体验的核心技术,代表性产品是Oculus Rift VR;AR更进一步,是将虚拟事物加到现实世界中,代表性产品是Magic Leap或Microsoft Hololens,AR技术设计空间感知和光场显示技术,光场显示需要建立起四维的光场空间,使得虚拟物体与自然物体一样,在我们的视觉中有虚实变化,高低远近物体的聚焦变化等。这两项技术目前只在一些固定场景或游戏场景里面使用,针对消费类或工业类应用场景,实现通用的技术难度还是比较大,需要结合数字孪生,渲染引擎来做,目前在硬件、软件、产品定位和实际应用场景方面都存在大量未攻克的瓶颈,目前还做不到人类要求的自然人机交互水平,但后续的发展机会也非常多,现在国内外已经有很多结合头盔方面的产品和应用案例,因为我们实际业务中都得带头盔,相当于头盔是人从事工业工作得必需品,而这种设备相当于在头盔外面加一个附加设备。

因此,过去10年,人机交互技术发生了翻天覆地的变革,从最早的CLI(Command Line Interface)-->GUI(Graphical User Interface)-->VUI(Voice User Interface)-->LUI(Language User Interface),人机交互演进从直观化--》便捷化和集成化--》可穿戴化--》本能化和植入化

目前从人类五官(听觉、视觉、触觉、嗅觉和味觉)来分析,其实除了后面两个外,其他都已被人机交互技术涵盖了,只是精细度、自然性和一致性未达到人类要求,人机交互已经从一维/二维发展到三维或多维立体,也就是说,未来应该从感官层面向着脑意识层面转变,比如通过隐形眼镜、脑机接口真正实现人机融合,未来的人机交互技术或产品更加集成、便捷、可穿戴甚至植入。人机交互的未来发展趋势应该是交互的自然高效,形成高可用的自然交互技术,彻底实现人机融合,使得人类更高效的利用计算机这一集成工具。

未来可期。


http://chatgpt.dhexx.cn/article/sCGLj0ST.shtml

相关文章

最新ChatGPT GPT-4 相似匹配Embedding技术详解(附ipynb与python源码及视频讲解)——开源DataWhale发布入门ChatGPT技术新手从0到1必备使用指南手册(一)

目录 前言最新ChatGPT GPT-4 相似匹配Embedding技术详解1. 何为Embedding2. 相关API2.1 LMAS Embedding API2.2 ChatGPT Style 3. Embedding应用3.1 QA3.2 聚类3.3 推荐 相关文献 参考资料其它资料下载 前言 如果您想提高ChatGPT中文本处理的效率和精度,那么Embedd…

ChatGPT的前世今生

作者🕵️‍♂️:让机器理解语言か 专栏🎇:NLP(自然语言处理) 描述🎨:让机器理解语言,让世界更加美好! 寄语💓:🐾没有白走的…

苹果公司限制员工使用AI工具ChatGPT和GitHub Copilot

​关注文章下方公众号,即可免费获取AIGC最新学习资料 导读:苹果公司最近发布了一份内部备忘录,禁止员工使用生成式AI平台(包括ChatGPT和GitHub的Copilot等)用于工作任务。 本文字数:600,阅读时…

通俗易懂的ChatGPT的原理简介

简介: 本文介绍了ChatGPT的原理及应用。ChatGPT是基于GPT模型的自然语言处理技术,可以进行语言理解、文本生成、对话生成等多种应用。其基本原理是通过训练大规模语料库中的数据,生成模型,从而实现自然语言处理的任务。本文着重介…

接入ChatGPT应用被苹果阻止更新,要求改成17限

萧箫 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT开放API消息才出来,就有应用安排上了。 然而,苹果却把这次更新阻止了! 理由是人工智能可能会产生不适合所有受众的内容: 要么增加内容过滤功能,要么把APP适用人群改到1…

ChatGPT 发展历程、原理、技术架构详解和产业未来

👇快来关注我 作者:陈巍博士 原文链接: https://zhuanlan.zhihu.com/p/590655677 本文转自公众号 Python开发者 去年12月1日,OpenAI推出人工智能聊天原型ChatGPT,再次赚足眼球,为AI界引发了类似AIGC让艺术…

ChatGPT开源系列

目录 进化树 从GPT-4 可以看出未来 LLM 的哪些趋势?未来的研发方向和优化策略是什么? 模型 Stanford Alpaca 可以借鉴的点 llama.cpp 验证阶段已完成 nebullvm-chatllama(待定) 可以借鉴的点 OpenChatKit 可以借鉴的点&a…

ChatGPT发展历程、原理、技术架构详解和产业未来

‍‍ 作者简介: 陈巍 博士,存算一体/GPU架构和AI专家,高级职称。中关村云计算产业联盟,中国光学工程学会专家,国际计算机学会(ACM)会员,中国计算机学会(CCF&…

IDE装上ChatGPT,这款编辑器真的做到可以自动写代码了!

介绍 Cursor 是集成了 GPT-4 的 IDE 工具,目前免费并且无需 API Key,支持 Win、Mac、Linux 平台,可以按要求生成代码,或者让 AI 帮助优化代码,分析代码。Cursor目前已经集成了openai的GPT-4,它或将彻底改变…

IDE + ChatGPT,这款编辑器真的做到可以自动写代码了

介绍 Cursor 是集成了 GPT-4 的 IDE 工具,目前免费并且无需 API Key,支持 Win、Mac、Linux 平台,可以按要求生成代码,或者让 AI 帮助优化代码,分析代码。Cursor目前已经集成了openai的GPT-4,它或将彻底改变…

全球最大ChatGPT开源平替来了!支持35种语言,写代码、讲笑话全拿捏

【导读】刚刚,LAION发布了世界最大ChatGPT开源平替——OpenAssistant。网友上手实测后,纷纷表示这是开源的胜利。 世界最大的ChatGPT平替来了! OpenAssistant是一个开源的对话模型,基于Pythia和LLaMA微调而来,主要用…

ChatGPT插件系统正式开放,不用写代码,人人都是程序员

整理 | 褚杏娟、核子可乐、凌敏 当地时间 3 月 23 日,OpenAI 宣布正式上线了以安全为核心的 ChatGPT 插件系统。OpenAI 插件将 ChatGPT 连接到第三方应用程序,之后 ChatGPT 便能够与开发人员定义的 API 进行交互,从而增强 ChatGPT 的功能并允…

【ChatGPT】使用 Cursor !其中集成了免费的 GPT-4 帮我写代码,写文章,聊天(ChatGPT)

官网是 cursor.so,下载后安装即可使用,无需科学上网。 Github: https://github.com/getcursor/cursor 现在速度又快还免费,只希望收费晚点来。 使用过程中如果一次回复的字数太多了会戛然而止,这时候跟他说“上面的代码没写完,请写完”就可以了。 目录 一、GPT-4在代码…

不敲代码用ChatGPT开发一个App

先说下背景,有一天我在想 ChatGPT 对于成熟的开发者来说已经是一个非常靠谱的助手了,身边也确实有很多同事把它作为一个离不开的助理担当。 但是如果我只是略微懂一点前端知识的新人,了解 HTML、CSS、JS 相关的知识,想开发一个安…

无需VPN,使用chatGPT帮助你写代码

如果你想要编写高效而有效的代码,ChatGPT将成为你最好的工具!ChatGPT是一种强大的自然语言生成技术,它可以为你提供关于编程的灵感和建议。使用ChatGPT,你只需输入一些简单的自然语言,就可以获得代码的建议和修改。无论…

与ChatGPT进行高效对话,生成想要的代码

Prompt Engine:释放创造力的新工具 Prompt EnginePrompt Engine的背景和目的简介背景目的 如何让 Codex 生成您想要的代码什么是prompt-engine-py安装简介架构图下面是PromptEngine类中可以用到的函数以及继承的函数 使用PromptEngine生成prompt使用CodeEngine生成p…

从ChatGPT出发:大模型与自然语言模型

目录 引言基石故事的开始:Transformer异姓兄弟:GPT、Bert与GPT-2GPTBertGPT-2 大力出奇迹:GPT3模型的进化:InstructGPT ChatGPT代码库TransformerGPT-2GPT-3InstructGPT 未来的工作安全性&有效性算力与标注代价的平衡 参考文献…

NLP:《ChatGPT: Optimizing Language Models for Dialogue一种优化的对话语言模型》翻译与解读

NLP:《ChatGPT: Optimizing Language Models for Dialogue一种优化的对话语言模型》翻译与解读 目录 《ChatGPT: Optimizing Language Models for Dialogue》翻译与解读 Abstract Samples 回答修改代码 回答道德问题 回答数学问题 回答如何写信 Methods 三…

ChatGPT的初步学习和认识

文章目录 (一) 使用ChatGPT的体验(二) ChatGPT的优缺点ChatGPT的优势包括:ChatGPT的缺点: (三) ChatGPT的功能 (一) 使用ChatGPT的体验 1)使用chatGPT进行学习,知识点整理 2) 使用chatgpt进行编程 3)请教…

从语言模型到ChatGPT,大模型训练全攻略

文|python 前言 你是否想过,为什么ChatGPT能够如此火爆呢?我认为这主要是因为ChatGPT提供了好玩、有用的对话式交互功能,能够为用户提供帮助,而不仅仅是依靠“大”模型的魅力。毕竟,GPT-3在2020年就已经推出…