ChatGPT 的一些思考

article/2025/10/6 13:50:15

最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开始,就已经能够理解较多的上下文信息并给出符合上下文的回复,但是给人的震撼并不如这次 3.5/4.0 版本来的多。就我个人而言,最直接的比较震撼的是更加灵活的代码生成,小说续写改写等等,而且都是从自然语言习惯进行交流的,不用相对来说比较专业的术语或者提问方式就可以实现流畅的沟通。

这次 ChatGPT 的火爆让我重新回顾了下近些年来 AI 究竟在生活当中从哪些方面融入了我们的日常。就我个人而言,能够明显感受到或者了解到的 AI 实际应用的场景有下面几个:

  • 实时字幕/实时翻译;
  • 手机拍照(人像模式);
  • 图像文字提取
  • AI 绘画和人脸替换;

实时字幕的应用有几个细分,比如说双方交流的实时字幕生成,并不包含翻译部分,是把对方的话用对方的语言来实时生成字幕进行显示,特别适用于听力不好但是阅读能力比较好的人使用。典型的产品有WIN11 的全局实时字幕,小米手机的小米闻声实时字幕,当然还有其它的一些 APP,不过感觉一些专门做词典之类的软件反而并不如一些视频会议软件或者小米闻声做得好,讯飞也是做得比较好的。这种的典型应用场景就是春晚或者什么直播节目也可以进行实时字幕的生成,以及不同地区方言到统一官方语言的转换,还有就是需要进行语音实时转录文字,这个文字工作者应该会比较需要。还有一些细分就是同声传译,也就是除了识别对方说的话之外还额外帮你翻译出来转换到自己想用的语言上面去,这个准确度已经比以前提升了非常多了,这个极大的方便了不同国家不同语言口音的人交流,出国游的时候就不用担心会遇到无论如何也搞不懂说什么的状况。

手机拍照这个对于 AI 的应用也是愈来愈广泛,我就说一个比较典型的能够有明显感知的应用,比如说人像模式的拍照或者视频录制,需要进行背景虚化,以前的背景虚化搞得都是非常不准确的,该虚的地方没有虚好,该实的地方没有实,总之就是突出一个不稳定。而以小米为例,小米12s 系列就已经表现出了比较令人满意的背景虚化效果了,大部分情况下都可以得到令人满意的虚化效果。

还有就是图像文字提取,也就是古早时候的 OCR 技术实现的的升级版,比较明显的就是微信的图像文字提取,可以直接把图像当做文本文件进行选择、复制、剪切,十分方便。还有就是用于改作业、做作业的图像识别,直接可以识别出来文字和图形化的题目,并给出解析,这个也是非常能体现生产力的地方,当然还有很多其它的应用我就没过多涉及了,总之都是生产力提升的体现。

AI 绘画也是 AIGC 的一个比较令人震惊的应用,而且从目前来看,AI 绘画已经可以做到添加一些 AI 自己的艺术理解进去,有些情况下的画作已经比人类还要优秀了。最令我震惊的是最近的写实风 AI 图像生成,虽然一直被吐槽 AI 还是无法理解人类的手是什么个存在,但是通过一定的训练之后已经可以画出一些超写实的画作了,基本上乍一看看不出来真假。还有一部分是建模的应用,虽然不清楚具体的实现是不是基于传统 CV 还是改良后的 AI,但是我感觉纯传统 CV 应该做不到那么真实的模拟。而人脸替换则肯定是基于 AI 的实现了,这个在很多的短视频里面、电影里面都有体现了,已经达到相当的实用程度,不在是笨拙的纯玩具的级别。

而最近的 ChatGPT bing 版,我看好多时候回答已经体现出了一些独立人格的迹象,虽然它不一定是真的独立人格,但是给人的感觉已经非常接近了,对我来说已经有点恐怖谷效应了,属于非常接近但是还总是有一点不对劲的感觉。这次的版本更新给人一种强烈的危机感,毕竟离线训练版的就已经可以达到代码生成,超强的语义理解和交流,这些完全可以在不断的训练之中进化达到更强的程度。试想一下 ChatGPT 的接口引入到游戏产业,游戏里面的 NPC 可以产生完全符合现实中自然人类的对话和行为,这将创造一个极度真实的自由世界,只需要赋予每个 NPC 不同的 AI 人格,加之接口数据的指令化标准化就可以做到。

感觉下一次的社会层面技术大升级如初升红日,在远远的海岸线上已经绰约可见了。想象中的下一轮升级是属于 AI+机器人的,也就是把强 AI 录入到不同功用的机器人内生操作系统里面,由 AI 去控制完成一些自然语言指令,工业上或许要更加特殊化一些,但是生活和一些工业门类则可以做到完全使用自然语言去控制 AI+机器人实现真正的实用化的 AI 助手。而「流浪地球2」里面的机器人技术和 550 系列我感觉可能真的已经在不远的将来了,现在能想到的最可能的组合,AI+波士顿动力的机器人/机器狗,经过后续的接口对接和迭代或许可以在有生之年带来一场全新的技术革命,当然技术对于人类社会的冲击也许不可忽视,但是这是另外一个话题了。

目前已经可以看到端倪的,可以被少量或者大量替代的岗位我自己理解可能会有:程序员(UI 设计、互联网等比较标准化软件化的领域);效果调试(自动控制、Tuning);文字工作者(绘画、有一定格式要求的文章写手);语言工作者(翻译、同传);律师(一些民事领域的纠纷处理);服务类型岗位(流程处理、程式化的内容处理);会计(流程报表);司机等等。当然这些不会是完全替代,但是绝对会相当程度上解放其生产力,使得需要的工作岗位大量减少,只保留少部分中低端岗位和高端岗位,剩下的会被全部替代。

面对 AI 的的冲击,也许从个人来讲除了为此感到谨慎兴奋和享受其带来的便利之外,也该更多的去思考下对个人带来的影响。毫无疑问个人生产力会得到更大的解放,个人未来可能不需要再花大量的时间在一些日常家务、无效或者说无必要的人际交往等上面,更多把精力用于自己喜欢的事情和创造力上面去。但是也应警惕自己的可替代性,在向 AI 时代进化的过程初期和中期,肯定会牺牲掉一大部分人从而完成整个的过渡。我个人想到的不可替代的工作类型有:程序员(与硬件绑定较多的、高端理论发明、架构创造);医生(需要进行外科手术的);律师(刑事律师、经济领域、高端领域)等等。我想要特别说明的是教师,无论何种教师,教学工作内容简单与否,我想都是绝对不可替代的,即使 AI 的教学技术或许可以超过人类,但是学生家长是绝对不允许学生处在一个独立的学习环境的,客观条件上来讲义务教育阶段的学生也是绝对不可能适应独立学习环境的,初期学习是一个需要通过人际交往来实现的行为,脱离了人与人之间的交流,从目前的人类构造来讲,义务教育不太可能实现其预定的目标。

AI 的时代或许很快就会到来,个人虽不一定要深度参与其中,但是保持一定的敏感性还是很有必要的。


http://chatgpt.dhexx.cn/article/oaYSAtVC.shtml

相关文章

真诡异,ChatGPT 竟让知乎股价暴涨

大家好,我是校长。 今天一大早,看到一条新闻:2 月 8 日,知乎涨幅扩大至超 50%,股价创新高,报 34.8 港元。 根据中银国际发表的研究报告所说,ChatGPT 注册用户激增,AIGC 潜力巨大&…

【ChatGPT进阶】如何使用ChatGPT做知乎好物?

如果你想通过知乎赚钱,知乎好物是一个不错的选择,门槛很低,而且是一个可以长期“躺赚”的项目,如果你会ChatGPT的话,可以去卷同行。 知乎好物是什么? 知乎好物是一种在知乎平台上创作内容或回答问题时&am…

知乎精选 | ChatGPT与数学优化

来源:运筹or帷幄‍‍‍ 本文约2200字,建议阅读9分钟 ChatGPT的准确性和速度以及处理复杂任务的能力使其成为一种非常有用的工具。 作者信息:宋志刚,中国科学院大学物理学博士 一、引言 ChatGPT是一个由OpenAI训练的大型语言生成模…

ChatGPT到底是个啥?它会让我们失业么?

谈起AI届,几家大公司是无论如何都不能不提及的,谷歌的GoogleX与DeepMind (下围棋那个)、Meta的FAIR (Resnet提出者恺明所就职的)、OpenAI (搞大模型的领先公司,代表作是GPT,对标谷歌的Bert)、亚马逊 (中国AI研究生的实际导师李沐大…

一个超方便的国内版Chatgpt,基于gpt-3.5-turbo

为了方便自己在家使用chatgpt,自己注册了域名并购买了服务器,使用3.5-turbo的api。 本来想免费开放给同事使用,结果大意了,一直以为只有4.0才需要按token收费,3.5虽然便宜但也是要扣钱的,多人使用消耗量巨…

国内的几款强大的智能AI语言模型

1、Tomchat :Tomchat https://www.tomchat.work 支持gpt4 -3.5 支持 midjourny绘画 可长篇写作 无使用月限额 Webot: https://www.ai-worker.cn/index.html#/?shareType1&shareCodeC-96-H7jap1U 每日可签到,日常的提问次数基本满…

浅谈ChatGPT与企业数字化转型

ChatGPT作为当今一个现象级的爆款概念,它的出现,会与企业数字化碰撞出怎么样的花火? 很多数字化转型中的企业,咨询师,也都把目光转向ChatGPT,以及ChatGPT背后的大模型。也许,ChatGPT会给数字化…

ChatGPT介绍详解

目录 前言 ChatGPT是什么? ChatGPT为什么这么强 GPT系列发展历程 能力诱导微调 结合人类反馈的强化学习(RLHF) ​编辑 大模型使用范式 情境学习​编辑 思维链 ​编辑 Zero-shot Cot​编辑 Planning 大模型关键技术 仍存在问题​编辑…

ChatGPT技术原理

ChatGPT技术原理 ChatGPT技术原理概要第一阶段:冷启动阶段的监督策略模型第二阶段:训练回报模型,reward model第三阶段:强化学习增强预训练模型的能力 ChatGPT技术相关简介L2R(learning to rank) 相关引用 ChatGPT技术原理概要 第…

基于DeepSpeed训练ChatGPT

基于DeepSpeed训练ChatGPT 最少只需一张32G GPU,自己也可以训练一个ChatGPT! 最近微软发布了一个基于DeepSpeed的训练优化框架来完成ChatGPT类模型的训练,博主对其进行了研究并通过此博文分享相关技术细节。 一、配置预览 1、开源仓库&…

语言模型 ChatGPT MOSS 使用体验分享

今早起床听闻复旦大学自然语言处理实验室团队发布了国内首个类ChatGPT对话语言模型MOSS。在好奇心的驱使下,我向贵实验室的小伙伴要来内测邀请码试玩了一番,顺便把MOSS与ChatGPT的试玩结果进行了对比,以下是部分对话历史记录: 目录…

简评ChatGPT

朋友发来两幅图片,内容是让ChatGPT介绍我(庄晓立/LIIGO),结果闹了大笑话。 这第一幅图,它介绍的内容完全与我无关,我无从知道是否真的有这个与我同名同姓的人,也无从知道其事迹是否真实&#x…

ChatGPT的评估指标有哪些?微调与上下文学习是否存在相似性?

NLP 分很多的任务,不同的任务有不同的指标来度量模型质量,比如AUC,Precision/Recall是分类模型的度量指标。 ChatGPT可以看作一个生成式语言模型,简单说就是给它输入一段文字,它会输出另一段文字,当然输出和…

如何评价一个新技术——以 ChatGPT 为例

开源社KAIYUANSHE 近期微信公众号订阅功能做调整啦! 没有被星标的账号在信息流里可能不显示大图了! 快星标⭐我们,就可以及时看到发布的文章啦! STEP01 点击右上角标志 STEP02 点击【设为星标】 缘起 2015 年的时候,我…

对于chatGPT的评价-ChatGPT的内容生成

chatGPT的优缺点 ChatGPT是一种基于深度学习技术的自然语言处理算法,其相比传统的自然语言处理算法具有很多优势。下面是ChatGPT的优点和缺点: 优点: 可适应多种任务:ChatGPT是一个通用的自然语言处理算法,可以适应多…

建立自己的ChatGPT:LLama私有化部署及测试

大语言模型(LLM)现在非常流行,可惜ChatGPT等都不开源。大家没法搭建一个自己的环境来感受以下。幸好Meta开源了LLama,这是LLama的介绍: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/ 具体技术…

windows下免费本地部署类ChatGpt的国产ChatGLM-6B

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 Chat…

ChatGPT是怎么实现的?为什么它这么有效?

ChatGPT 能够自动生成类似于人类写作的文本,这一点非常引人注目,也令人意外。但它是如何实现的?为什么它能够如此出色地生成我们认为有意义的文本?我的目的是在这里概述ChatGPT内部的运行情况,并探讨它能够如此出色地产…

ChatGPT这么强大吗

ChatGPT和它带来的AI时代是一次新的科技革命,AI时代就此拉开序幕,我们必须紧跟时代,否则就会被时代抛弃。本星球分享chatgpt的最前沿应用和实战案例,同时会定期邀请业内大佬做分享。 为什么AI时代很恐怖,现在我们看到的…

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

< 每日闲谈&#xff1a;你真的了解 “ ChatGPT ” 嘛 &#xff1f; > &#x1f449; 前言&#x1f449; OpenAI的创立&#x1f449; ChatGPT有何过人之处&#xff1f;> 效果演示 &#x1f449; OpenAI看家之作 — GPT自然语言模型> GPT发展史> 里程碑-GPT3> …