我不谈ChatGPT

article/2025/4/20 9:08:22

(1)数据

有两个未经证实的传闻:

  • 1、客服问答:80%用户问的问题都是那20%常见问题,但是就是这样,占用了客服人员80%的工作量和工作时间

  • 2、资讯搜索:谷歌一位员工说,在互联网上,60%的内容都是重复的,都是被人复制来复制去的

这就是我们现实世界的信息,以及现实世界的用户。所以人工智能代替人是不可能,但要对付这帮用户,应该还是比较有余的。

(2)框架

框架目前在开源界都是比较成熟的:

  • 问答与会话框架

  • 意图识别方法

  • 情感分析框架

  • 搜索引擎、推荐引擎

  • 文本摘要方法、文本生成方法

这些年,这些技术都进展不大,大家搞来搞去都还是卡在了海量的有质量的数据采集-标注-训练-微调上了。一句话:有多少数据就有多少智能,有多少人工就有多少智能。现在的人工智能玩的就是简单粗暴的工程暴力美学:大数据-大算力。

想想也对啊。这一届(第三次)的人工智能热潮,原本就起源于图像:

  • 2012年李飞飞在谷歌的资助下搞ImageNet图像大数据集

  • 2012年辛顿团队以高分打破ImageNet SOTA记录

  • 2014年GAN发明

  • 2016年YOLO目标检测算法发明

  • 2018年Transformer发明

  • 2020年CLIP发明

  • 2022年扩散模型应用到图像生成

用一句话来说就是:2012-2022这十年,前五年就是图像识别,后五年就是图像生成。

在NLP领域只有Open AI一家公司在孤行。2020年发布的GPT-3偏重NLG:摘要与生成。2022年发布的ChatGPT偏重NLU:问答与会话。其实大家也不用太惊讶ChatGPT,本身并不复杂也并不先进,重要点就在于有钱:大数据-大人工标注-大算力训练。

在框架上,谷歌和Facebook相映生辉。在算法上,谷歌和Open AI相映生辉,大家在分类的思路上或回归的思路上不断换姿势,但刷来刷去本质上不外乎是数据对儿-翻译模型原理,Transformer这块万能砖的长度也不外乎就是250个Segment(这可追溯到上世纪90年代的LSTM Segment长度),这就是我们第三次人工智能热潮的进步。

(3)多模态

从2020年开始流行多模态,也不外乎是数据对儿对齐,共享特征。

过去问答与会话,都是纯文字输入和输出居多。现在有了多模态,不仅输入可以吃多媒体数据,而且输出方面也是图文并茂:有了2D的数字人,有人脸、有表情、有手势、有身体姿势。你看过去的文字小冰,现在也升级成有虚拟形象的:华智冰。

(4)元宇宙

一切都在朝向元宇宙的方向上狂奔,在VR元宇宙世界中,2D变3D。现在人们还做不到真人形象的数字人,还只是卡通形象,未来一定是3D真人形象。

静态的3D逼真,那就用虚幻游戏引擎生成。动态的3D逼真,那就用图像生成大模型。

交互,就用ChatGPT大模型。中国人最擅长山寨,所以我相信到2023年6月,中国肯定一堆公司(比如智源、鹏城、之江、百度、阿里、腾讯、华为等等)会发布并开源中文海量数据的ChatGPT大模型。而且到时候一定会有若干个打着高科技旗号的创业公司把免费开源的ChatGPT包装个App的壳然后骗上千万风险投资。

而且中国人也会以此为基础进行魔改:再注入语音识别-语音转文字-语音合成(文字转语音),再注入机器翻译。毕竟这两个技术也已经很成熟了,我前段时间尝试抖音和科大讯飞的语音技术感觉成熟度挺高了,集成进来就行了嘛。

这样,一个有表情有手势有身体姿势的真人3D,能直接语音对话交流而且能自动翻译。

(5)商用

元宇宙毕竟是个人休闲娱乐。如何把ChatGPT应用于商业,如网上销售和网上客服。

我过去写过CRM 40年:

  • 1984年Dell用IVR电话呼叫中心开始做个人电脑的线上销售,Dell不开线下销售门店。

  • 1994年Siebel把Dell的这套范式迁移到企业产品的销售,发布了SFA产品,引爆了CRM这个词。

  • 2004年Salesforce上市。

  • 2014年内容营销的HubSpot上市。

  • 2024年CRM的当红炸子鸡到底会是谁呢?我猜的就是Gong这家公司。

而我们中国嘛,不流行网上电子邮件营销-网上销售-网上客服。我过去就说过:

  • 电话容易被录音,IM容易被截屏和转发。不能打电话、不能发IM,必须线下面见

  • 电子邮件是为了留痕追责,纸质签字盖章是为了不让电脑篡改。(这让我想起了中国用顺丰人肉传递纸质合同和发票、日本人现在还普遍用传真机+盖章签字、美国人电子邮件搞定且没有发票)

中国人企业对企业的商业场景只能锁死在私密绑定:

  • 喝醉酒探底线:一个永远喝不醉的,是令人恐惧的

  • 玩麻将品性格:人性,权钱色名利气,每个人都有软肋

  • 一起洗澡坦胸露怀:每个人脱了光鲜亮丽的衣服,露出真实的身体缺陷和身体隐私部位

  • 一起玩大保健共投名状:互相握把柄,谁也跑不了谁

但要把ChatGPT这种通用大模型应用于某个具体领域或行业,不外乎还是得重新采集具体领域或行业的大数据,加工成数据对儿,进行数据标注-数据对齐,进行大算力预训练炼丹,进行观测-微调-提示调优。也就是说,过去该做的,未来还是一步不落的还得做。想省?没门儿。

a05df3d04fba4e2eb4e070c8819b8863.jpeg


http://chatgpt.dhexx.cn/article/LBUwTjcx.shtml

相关文章

网络疯传华为面试题:800公斤牛,过承重700公斤的桥,有答案了?

前不久,华为一道面试题流传于网络:一头牛重800千克,一座桥承重700千克,牛怎么过桥? *图:源自网络,如侵删 面对这种看似无聊却又考验思维能力和底层逻辑的面试题,你会怎么回答&…

爆发前夜!华为阿里版ChatGPT!

本文经授权转载自微信公众号:51CTO技术栈,作者 | 徐杰承,审校 | 云昭 “你训练的大模型涌现了吗?”“还没有。好难受。”一时间成为了最近AI赛道玩家的一个爆热梗。 不管承不承认,相信每个玩家都不愿意输掉这场激烈的竞…

ChatGPT做到人人都可以配置思科华为网络设备

最近有个一个想法,chatgpt能不能帮忙配置网络设备,于是我开始在网上找了个拓扑图。 然后我将拓扑图及需求,以prompt的形式发送给chatgpt,然后chatgpt根据我的要求,将所有节点的配置全部输出了出来,真是一个…

震惊!火爆全网的ChatGPT背后使用的数据库居然是……

摘要:ChatGPT承认了自己背后使用的数据库是Cassandra。 OpenAI最近发布的AI驱动的智能聊天机器人ChatGPT在互联网上掀起了一阵风暴,热衷于尝试这一新AI成果的网民不在少数。ChatGPT针对网友广泛的问题提供了非常有针对性的回答,其不可思议的能…

ChatGPT将颠覆我们生活?

一款由OpenAI开发的消费级别的强人工智能应用ChatGPT横空出世! ChatGPT推出仅两个月,月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序。 关于ChatGPT,马斯克在去年12月就曾公开表示称:ChatGPT好得吓人&am…

终于,乔姆斯基出手了:追捧ChatGPT是浪费资源

编辑:蛋酱、泽南 Colorless green ideas sleep furiously. 人类语言语法的基础不可能是基于统计意义的。 ChatGPT 掀起了科技领域最新的一轮军备竞赛,但留给 AI 领域的议题还有很多:ChatGPT 是一种真正的创新吗?是否意味着初步的通…

语言学巨头乔姆斯基评ChatGPT:缺乏任何智能的关键能力,追捧就是浪费资源

编|蛋酱、泽南源|机器之心 Colorless green ideas sleep furiously. 人类语言语法的基础不可能是基于统计意义的。 ChatGPT 掀起了科技领域最新的一轮军备竞赛,但留给 AI 领域的议题还有很多:ChatGPT 是一种真正的创新吗&#xff…

最新ChatGPT GPT-4 相似匹配Embedding技术详解(附ipynb与python源码及视频讲解)——开源DataWhale发布入门ChatGPT技术新手从0到1必备使用指南手册(一)

目录 前言最新ChatGPT GPT-4 相似匹配Embedding技术详解1. 何为Embedding2. 相关API2.1 LMAS Embedding API2.2 ChatGPT Style 3. Embedding应用3.1 QA3.2 聚类3.3 推荐 相关文献 参考资料其它资料下载 前言 如果您想提高ChatGPT中文本处理的效率和精度,那么Embedd…

ChatGPT的前世今生

作者🕵️‍♂️:让机器理解语言か 专栏🎇:NLP(自然语言处理) 描述🎨:让机器理解语言,让世界更加美好! 寄语💓:🐾没有白走的…

苹果公司限制员工使用AI工具ChatGPT和GitHub Copilot

​关注文章下方公众号,即可免费获取AIGC最新学习资料 导读:苹果公司最近发布了一份内部备忘录,禁止员工使用生成式AI平台(包括ChatGPT和GitHub的Copilot等)用于工作任务。 本文字数:600,阅读时…

通俗易懂的ChatGPT的原理简介

简介: 本文介绍了ChatGPT的原理及应用。ChatGPT是基于GPT模型的自然语言处理技术,可以进行语言理解、文本生成、对话生成等多种应用。其基本原理是通过训练大规模语料库中的数据,生成模型,从而实现自然语言处理的任务。本文着重介…

接入ChatGPT应用被苹果阻止更新,要求改成17限

萧箫 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT开放API消息才出来,就有应用安排上了。 然而,苹果却把这次更新阻止了! 理由是人工智能可能会产生不适合所有受众的内容: 要么增加内容过滤功能,要么把APP适用人群改到1…

ChatGPT 发展历程、原理、技术架构详解和产业未来

👇快来关注我 作者:陈巍博士 原文链接: https://zhuanlan.zhihu.com/p/590655677 本文转自公众号 Python开发者 去年12月1日,OpenAI推出人工智能聊天原型ChatGPT,再次赚足眼球,为AI界引发了类似AIGC让艺术…

ChatGPT开源系列

目录 进化树 从GPT-4 可以看出未来 LLM 的哪些趋势?未来的研发方向和优化策略是什么? 模型 Stanford Alpaca 可以借鉴的点 llama.cpp 验证阶段已完成 nebullvm-chatllama(待定) 可以借鉴的点 OpenChatKit 可以借鉴的点&a…

ChatGPT发展历程、原理、技术架构详解和产业未来

‍‍ 作者简介: 陈巍 博士,存算一体/GPU架构和AI专家,高级职称。中关村云计算产业联盟,中国光学工程学会专家,国际计算机学会(ACM)会员,中国计算机学会(CCF&…

IDE装上ChatGPT,这款编辑器真的做到可以自动写代码了!

介绍 Cursor 是集成了 GPT-4 的 IDE 工具,目前免费并且无需 API Key,支持 Win、Mac、Linux 平台,可以按要求生成代码,或者让 AI 帮助优化代码,分析代码。Cursor目前已经集成了openai的GPT-4,它或将彻底改变…

IDE + ChatGPT,这款编辑器真的做到可以自动写代码了

介绍 Cursor 是集成了 GPT-4 的 IDE 工具,目前免费并且无需 API Key,支持 Win、Mac、Linux 平台,可以按要求生成代码,或者让 AI 帮助优化代码,分析代码。Cursor目前已经集成了openai的GPT-4,它或将彻底改变…

全球最大ChatGPT开源平替来了!支持35种语言,写代码、讲笑话全拿捏

【导读】刚刚,LAION发布了世界最大ChatGPT开源平替——OpenAssistant。网友上手实测后,纷纷表示这是开源的胜利。 世界最大的ChatGPT平替来了! OpenAssistant是一个开源的对话模型,基于Pythia和LLaMA微调而来,主要用…

ChatGPT插件系统正式开放,不用写代码,人人都是程序员

整理 | 褚杏娟、核子可乐、凌敏 当地时间 3 月 23 日,OpenAI 宣布正式上线了以安全为核心的 ChatGPT 插件系统。OpenAI 插件将 ChatGPT 连接到第三方应用程序,之后 ChatGPT 便能够与开发人员定义的 API 进行交互,从而增强 ChatGPT 的功能并允…

【ChatGPT】使用 Cursor !其中集成了免费的 GPT-4 帮我写代码,写文章,聊天(ChatGPT)

官网是 cursor.so,下载后安装即可使用,无需科学上网。 Github: https://github.com/getcursor/cursor 现在速度又快还免费,只希望收费晚点来。 使用过程中如果一次回复的字数太多了会戛然而止,这时候跟他说“上面的代码没写完,请写完”就可以了。 目录 一、GPT-4在代码…