解密大模型与文心一言

article/2025/11/9 22:47:50

3147c797b73d6f162d9b32382beb0454.gif

近日,百度集团副总裁袁佛玉受邀出席数字纵深论坛并进行“解密大模型与文心一言“主题分享。

数字纵深论坛由北京大学光华管理学院数字教育中心主办,专注于分享科技前沿与商业洞见。

以下为分享精华回顾:

大家都能感受到,ChatGPT和百度文心一言这样的大模型非常火。今天我们就聊一聊,它爆火背后到底是什么原因?接下来还会发生什么?我们每个人、每家企业如何参与其中?

这个现象的发生,有一部分是在大家的设想之中,也有一部分在大家意料之外。甚至说,由于技术的快速发展,即使是身在其中的企业,对它的认知也在不断迭代中。很多新生事物的发展,有很大的不确定性,我们往往对它的发展方向有个大致的判断,然后需要在实践中探索获得积极反馈,才能不断地往前走,这就是“反馈驱动创新”的理念

我们也希望跟大家一起,在新一波人工智能产业化浪潮中,共同去推动一些创新,推动人工智能技术的落地。

接下来,我重点讲一下大模型。这是当下最热、最前沿的人工智能发展方向。

ChatGPT爆火,AGI曙光初现

有媒体报道说:没有任何一次产业方向,行业这么快地达成共识。全球所有的大公司,都在往同一个方向去做——预训练大模型。

我们定义当下是人工智能发展的“拐点”,而不是“终点”。不是说,ChatGPT或者文心一言就是最终形态;而是说,它是人工智能发展到这个阶段产生的一个现象级产品。接下来,还会有非常多现象级的产品出现,还会有更多的突破发生。

b8e5d095e662cecfd8fa5f915a1a898e.png

这种基础设施级、操作系统级的创新,又意味着什么?让我们先回看一下历史——上面这张图,左边是中国过去40年GDP的增长曲线图;右边是过去2000年世界人均GDP的增长曲线图。我们可以看到,在人类发展历史中,有很长一段时间,人均GDP是不怎么增长的。但在最近的大约250年,GDP有了高速的、指数级的增长。这个增长就是人类历史上的三次科技革命带来的,是创新驱动增长,科技创新驱动了大的增长。

所以,对于当下我们所经历的现象,本质上是我们正在经历第四次工业革命。人工智能是第四次工业革命的核心驱动力量,标志性技术就是深度学习算法。这项技术能够驱动的经济增长,会比很多人想象得更大。当下大家看到的是一些热门的应用方向,但是接下来,它会重塑整个经济、社会、产业和人们生活的方方面面。

大模型智能涌现,人工智能迎来拐点

e94b4dade96f0f30b94e7bfc8bf12fba.png

那为什么是今天?为什么是现在?

其实人工智能已经跌宕起伏,火了几十年。它有过很多次被社会层面认知,受追捧,然后又冷却,又重新再受追捧。大家应该都记得,当年Google的AlphaGo在围棋上打败李世石,就引发了巨大的关注。

那么, 当下这波人工智能大浪潮有什么不同?我们知道,人工智能有三要素:算力、算法、数据。今天,这三个要素的齐头并进,让人工智能技术产生了本质性的改变,来到了一个临界点。

算法上的突破是最显著的,大模型背后核心技术就是深度学习算法。数据上看,2020-2025 年,全球数据平均增速预计达到23%。而且数据是越用越多,大量企业的数字化,还会不断产生更多的数据。在算力方面,2006年-2020年,芯片计算性能提升了600多倍,未来可能还会有更大的突破。今天大家还在讨论算力卡脖子,我们认为,到一定阶段算力也许都不是问题。

算力、算法、数据三方面共同的狂飙突进,成就了今天人工智能的拐点来临。

18430fc2b573e129ec8b4e6d0c821ed2.png

大模型带来了更高的生产效率:一是更少的训练数据。预训练开发模式可以把训练数据量减少90%;二是更少的算力投入,通过端到端训练和微调,算力投入可以减少90%;三是更短的开发周期。模型开发时间可以下降85%,从1周缩短到1天。

文心大模型

人工智能时代,应用会基于大模型来进行开发。

百度的文心大模型,是由百度智能云的AI大底座训练出来的。同时,AI大底座又包含了文心大模型的能力,并服务千行百业。

百度智能云的AI大底座,是全栈自研的,是一个全要素、端到端的AI基础设施,包括了推理芯片昆仑芯、基于产业实践的深度学习框架飞桨、文心大模型,还有上层的产业应用。

在这四层架构上,都能做端到端的优化,性能和效果、效率就能达到极致。比如说,千卡的加速比可以提升90%,资源的利用率可以提升70%,开发效率可以提升100%。

当我们讲百度文心大模型,我们要强调的是,它是产业级的知识增强大模型。

“产业级”,指的是我们的文心大模型是来自产业,应用于产业的大模型。它是在产业实际应用中真正产生价值的一个模型,这是我们非常有特色的一个地方。业界一些大模型,其实是既没有应用场景,也没有真正的用户和客户。

“知识增强”,指的是我们的文心大模型,它不仅从无监督的语料中学习知识,还通过百度多年积累的海量知识中学习。这些知识,是高质量的训练语料,有一些是人工精标的,有一些是自动生成的。比如搜索和点击数据,信息流上打的标签,这些都是经过大量的规则和模型训练优化过的数据。再比如,我们有全世界最大的中文知识图谱数据,有5500亿事实,这些都可以作为大模型的输入。文心大模型参数量非常大,达到了2600亿。

全球性AI再造拉开序幕

云计算游戏规则根本性改变

c2bf974d0c5b6ad61b53b97c7924e4db.png

大模型浪潮,带来了全球性的AI再造。那它的本质是什么呢?是生产经营效率和用户体验效率的“双效”提升,这将加速社会的 “智能化跃迁”。

一个是从供给端来看,生产经营的效率将会得到极大提升。大模型和生成式AI已经可以帮我们写代码、写合同、写PPT。而接下来,多模融合的生成式AI,则会更深入地重塑我们生产的全流程。

另一个是从需求端来看,用户体验的效果将会得到极大提升。基于生成式AI的各种数字人,或者叫做个性化助理,会帮助我们解决健康、理财、法律等一系列问题;人和机器的交互界面也会更加自然、友好。除了生成文字之外,未来通过plug-in,就是接口的方式,你跟它讲讲话,它就可以上携程,帮你把酒店机票都订完了。对用户来讲,这个体验变得非常好,不用在各种APP之间跳转。

人工智能可以把所有的行业再造一遍。过去拥有优势的企业,可用它来巩固自己的优势。过去优势不很明显的企业,则有机会在新的阶段,用它来建立自己独特的竞争优势。

数以千计的创业公司,也正在用生成式AI来改造千行百业。全球性的AI再造已经势不可挡。每个企业需要重新思考,自己的优势是什么、如何用AI来放大这个优势。

文心一言大语言模型,会带来哪些创业机会、投资机会?我们认为,至少有三方面的机会。

一是新型云计算公司。我们认为,它适合少数大型科技公司,因为它需要大量的技术创新和突破+大量的人才+超大规模的数据+超大规模的算力,然后才能打磨出大语言模型,成本非常高。也没有必要每个公司都去搞一个大语言模型。大模型做得好的公司,它就会成为下一代的云计算领导者。

二是行业模型精调,是中间层,适合一些高科技创业公司,它可以基于通用大模型做一些有创造性的工作。除此之外,还有大型的集团型企业、集团中心、产业园区,也可以作为中间层的玩家。这几类公司,可以构建它所在行业的行业大模型,然后形成行业的数据闭环,根据业务需求对大模型进行精调,激发出大模型在行业里面的特定能力。

三是应用开发。这对所有的企业来说都有机会。那么这一层需要的核心能力是什么呢?是能够充分理解什么是大模型,然后对大模型充分利用,同时也对自己所在的场景,有产品能力和创新能力。

我们认为模型即服务,就是MaaS,它将撬动万亿级的市场。

中国的产业链非常丰富,我们本土产业会产生很多真实的场景和数据,这会反过来推动我们自己的大语言模型,不断地迭代和优化,最后会产生更大的价值,我们对此非常有信心。

在人工智能时代,我相信一定会出现杀手级的应用、现象级的新的产品,大家会不断地看到一个一个里程碑事件的发生。基于大语言模型的超级应用,未来创造的价值可能是移动互联网的10倍。

*本文由北大光华数字教育中心依据百度集团副总裁袁佛玉现场分享整理

bf5ab85f562e0aff6c22d2cea0218f12.png

356650fc5754cedb8abe8ff6c063d1d0.png

d943a1a04d1316028c499be98bc5b941.jpeg

b4ff3fbe420c9470943dd0005aa886b7.jpeg

6da5dba48442e2218d311c0159e0d189.jpeg

点击“阅读原文”,立即合作咨询


http://chatgpt.dhexx.cn/article/IXvPC86W.shtml

相关文章

chatgpt赋能Python-python3_7如何下载

Python3.7如何下载?详细步骤分享! Python是一门当今最热门、最常用、最易学的编程语言之一,且拥有庞大的社区和强大的库支持。在这篇文章中,我们将会详细介绍如何下载Python3.7版本,让大家能够轻松上手Python编程。 …

摆平Win2008与VPC2007的诡异冲突

摆平 Win2008 与 VPC2007 的冲突 话说上个周末,参加完51CTO组织的虚拟化技术沙龙,俺和老方,老胡,小废物等人杀奔西直门的红顶老汉烧鸡公,席间觥筹交错,一顿狂磋。说句题外话,这个鸡的味道真是不…

NeurIPS 2020 | 基于协同集成与分发的协同显著性目标检测网络

论文题目:CoADNet: Collaborative Aggregation-and-Distribution Networks for Co-Salient Object Detection 论文链接:https://proceedings.neurips.cc/paper/2020/file/4dc3ed26a29c9c3df3ec373524377a5b-Paper.pdf 论文代码:https://githu…

(附源码)基于spring boot 青少年公共卫生教育平台的设计与实现 毕业设计 643214

Springboot青少年公共卫生教育平台 摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对青少年公…

IT服务管理的指挥与智慧

IT服务管理的指挥与智慧 在当今动荡不宁、不断变化的 IT 环境中,IT服务管理(ITSM)的重要性不言而喻,它通过保证关键业务系统和服务的可用性和可靠性,为整个企业提供至关重要的支持。随着技术变得越来越复杂&#xff0c…

php比特教务选排课系统的设计与实现毕业设计源码301826

比特教务选排课系统的设计与实现 摘 要 随着人类向信息社会的不断迈进,风起云涌的信息时代正掀起一次新的革命,同时计算机网络技术高速发展,网络管理运用也变得越来越广泛。因此,建立一个B/S结构的比特教务选排课系统来管理选课信…

Springboot爱护大自然的设计与实现 毕业设计-附源码231643

爱护大自然 摘 要 热爱大自然,保护自然环境,是人们处理与自然关系过程中应当遵守的基本行为准则。第一,热爱大自然,是人类社会赖以生存和发展的物质条件。自然界一切对人类社会生活有益的存在物,如山川草木、飞禽走兽、…

python面向对象案例步骤分析_Python面向对象之继承原理与用法案例分析

本文实例讲述了Python面向对象之继承原理与用法。分享给大家供大家参考,具体如下: 目标 单继承 多继承 面向对象三大特性 封装 根据 职责 将 属性 和 方法 封装 到一个抽象的 类 中 继承 实现代码的重用,相同的代码不需要重复的编写 多态 不同…

中国多媒体与网络教学学报杂志中国多媒体与网络教学学报杂志社中国多媒体与网络教学学报编辑部2022年第6期目录

中国多媒体与网络教学学报杂志中国多媒体与网络教学学报杂志社中国多媒体与网络教学学报编辑部2022年第6期目录 实践研究_案例精选 找春天 左文慧; 1-515 长方体和正方体的认识 史颂; 6-912 测定空气中氧气的含量 彭洪;肖启友; 10-12 基于单元要素 设计智趣活动…

基于MATLAB的静态手势分割与识别研究

一、课题介绍 本课题设计了手势的分割与识别程序系统,结合 MATLAB软件对采集的目标图像进行识别。结合基于运动的手势分割与基于肤色的手势分割2种手势分 割方法,提取运动肤色区域,通过计算此区域的均值与方差矩阵更新高斯模型,设…

吉林建筑大学电气与计算机学院院长,吉林建筑大学城建学院市政与环境工程学院来我校计算机学院调研“学习筑梦”行动开展情况...

6月21日上午,吉林建筑大学城建学院市政与环境工程学院党委副书记、副院长王洪平、学办主任、辅导员和学生党员一行9人来访我校计算机学院。计算机学院党委副书记王俊成,学办主任兼分团委书记马立明等热情接待了来访嘉宾,双方就“学习筑梦”行…

计算机专业在法国好就业吗,对法国计算机专业留学热门院校的推荐与就业分析...

法国计算机专业总体介绍: 在法国从高中到博士阶段,共有5000余种计算机专业课程。有公立大学或者高等专业学院课程;有长期或短期课程;也有免费,付费或者学徒课程,对于计算机专业课程的选择是十分丰富的。 法国公立大学 随着法国大学…

ubc计算机专业课程介绍,温哥华UBC大学的计算机专业介绍

英属哥伦比亚大学 (University of British Columbia ,简称 UBC ,又名 " 卑诗大学 ") 是一世界级顶尖研究型大学,它庞大而又秀丽,坐落于风光如画的温哥华市,同时它也是加拿大最难申请的大学以及淘汰率最高的大…

中国计算机专业的大学生相比于美国差在哪里?

链接:https://www.zhihu.com/question/31074647 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 作者:邦彦https://www.zhihu.com/question/31074647/answer/50552556 学生太多,老师太少。想起了那个梗…

国外是怎么学习计算机的?

大家好,我是厂长。 随着自己持续的创作,关注的粉丝也不断增长,这些增长的粉丝不仅有来自国内的朋友,还有不少在国外留学的同学。 微信的好友列表里就有在德国、英国、日本、美国等国家留学的同学,每次遇到这些网友&…

在美国大学计算机专业都学什么?

作者简介:祁一鸣,2016年4月加入携程,任机票研发部技术专家,同时负责携程App国际机票预定主流程技术团队。毕业于美国常春藤名校 Dartmouth College 本科,曾先后在硅谷的Oracle、Yahoo!和Salesforce总部效力过。从scrat…

外国大学计算机专业学什么?信息技术专攻网络计算

信息技术(荣誉)理学士,专攻网络计算 亚太科技大学APU 亚太科技大学在2021年QS亚洲大学教师国际名列前10名的私立大学。APU在国际学生排名第一,入境交流第一,并在排名前50名的大学中。APU在2021年年QS大学排名中名列前…

计算机c就业,留学美国:高薪好就业Computer Science(计算机科学)CS专业详解

原标题:留学美国:高薪好就业Computer Science(计算机科学)CS专业详解 计算机科学专业是理工科类留学最热门的专业之一,而且CS专业也一向是高薪、好就业的代名词,根据Payscale数据显示,美国计算机科学硕士毕业平均薪资达…

大学英语专业有计算机课吗,加拿大留学,温莎大学英语计算机专业了解一下

原标题:加拿大留学,温莎大学英语计算机专业了解一下 对于留学申请人来说,多年来计算机专业一直是热度不减。而在近些年,也有很多学生和家长更为看好加拿大的教学质量和未来的工作环境。加拿大在计算机科学领域的科研、开发和教学实…

计算机专业大学如何自学?常用网站和工具

有问题欢迎评论或私信我 耗时5小时,第一个B站视频,满足分享欲 计算机专业现状 or 困境?如何自学?常用网站科普!_哔哩哔哩_bilibili 👆发了个视频,结合文章中的链接,保存到自己浏览…