近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉...

article/2025/10/11 0:54:43

来源:大数据文摘

本文约3300字,建议阅读5分钟。

本文为清华大学大数据研究中心联合大数据文摘发起的年度白皮书《顶级数据团队建设全景报告》系列专访的第四篇内容。《报告》囊括专家访谈、问卷、网络数据分析,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。前往文末参与填写问卷,将获得《报告》完整版~

去年6月,联想集团公开宣布,成立数据智能业务集团 (Data Intelligence Business Group,DIBG),由蓝烨担任高级副总裁,直接向杨元庆汇报。同时,联想集团副总裁田日辉负责数据智能业务集团的产品和生态业务,汇报给蓝烨。

在当时写给数据智能业务集团的内部信中,联想集团董事长兼首席执行官杨元庆表示,“在大数据积累的基础上成立联想数据智能业务集团,是为了加速智能化变革,是实施联想行业智能(Smart Verticals)战略的重要举措。”

这也是一直被外界誉为信息化标杆企业的联想,向数据智能领域延伸业务的一次重要的商业布局。

其实联想内部广义上的信息化早在2000年左右就开启了。经过20多年的信息化实践和积累,联想目前的大型主系统有上千套,整个公司服务器加起来有上万台,数据链量级已经达到十几个PB。

同时,联想在全球都运营着庞大的上下游生态,在全球两百多个国家和地区同步进行用户服务与体系构建,目前有50多家上游企业,2000多家下游渠道企业。

经过一年的发展,联想数据智能业务集团发展如何?联想集团的数据平台构建与数据团队建设又有怎样的进展?针对以上问题,上个月,我们对联想数据智能业务集团产品及生态总经理田日辉先生进行了一次专访。

三阶段数据团队建设,打造全价值链数据智能平台

在成立数据智能业务集团之前,联想内部的数据团队其实已经初具规模,团队建设也不是一蹴而就的。

自2011年联想开始应用大数据至今,联想的数据平台建设主要可以划分成三个阶段:

  • 第一阶段:企业内部先进数据应用建设;

  • 第二阶段:在内部和外部构建平台;

  • 第三个阶段:构建上下游企业的数据智能生态。

2011年到2015年是联想数字团队建设的起步阶段。当时的数据团队还主要是服务联想内部拓展数据的应用,因此数据团队的规模很小,只有十几个人,四年后慢慢扩展到一百多人。

田日辉告诉我们,当时团队研发中国第一款安卓系统手机乐phone,通过应用商店、SBK模拟器、开发环境与数据分析工具等来构建一套大数据体系,进而帮助应用商店开发者收集相关使用数据。联想的数据团队最早就是从此入手,帮助应用商店的开发者分析月活、日活与产品质量等数据,持续不断优化这些智能应用。

田日辉表示,在初期内部硬件的生产上,联想就对于信息化比较重视,是国内首批使用ERP的企业之一,因为自2004年收购IBM 的PC业务后,全球化运作对信息系统的要求较高,IBM原本的很多系统被逐渐废掉,联想也构建了自有系统,提升效率。

之后随着这些应用的深入,大数据不仅能在应用层对产品提供优化,企业内部大量的运营数据,对企业产品研发、供应链管理、市场营销还有很多影响,使得数据应用可以扩展到整个延产供销服务全价值链。

2016年到2019年下半年,联想开始进入了数据团队建设的第二阶段,开始把数据应用大规模进行平台化和推广,并开始将能力对外输出,拓展给外部用户,并在公司内部构建平台。

这一阶段,联想开始有计划的建设全公司“人人都能使用”的数据平台,“这个过程中,公司内部核心策略就是人人都是分析师。”

田日辉提到,数据团队负责建平台,把核心数据和公用数据帮用户整理好;业务人员(IT部门、业务部门等)完成平台分析工作,大量人员参与进来,使得业务经验能够与数据分析方法更好结合起来,以自服务式应用致力于解决数据科学家缺失的难题。数据团队开发平台性产品之后,在公司内部先部署与使用,比较成熟之后,再服务外部客户(汽车、石化、钢铁等企业)。外部客户因为和与内部的应用模式有所不同,有很多创新的需求和应用点,通过反馈去优化产品,增加内部应用平台的功能特性,并建立内外部互动模式。

而到了现在,联想数据团队建设已经进入了构建生态化阶段。联想所处的行业生态链中,上下游企业都处于数据智能转型时期,联想数据团队现在已经构建了上下游合作伙伴都能利用的智能化应用平台。平台除了提供算法工具之外,还预置了多年积累的分析数据模型,包括预测、仓储优化、用户画像、精准营销等,使合作伙伴能够很快地使用,把数据与业务模型对接,实现业务价值闭环。上下游企业可以选择用联想平台去做智能化软件,也可以使用联想的产品构建私有平台。下游大量中小型制造业企业受限于信息化成本,在数字化转型过程面临很多挑战,建立生态系统可以使其直接使用经过实践验证的平台。

联想希望在对外服务的同时,也能够建立起生态系统,服务更多的尤其是中小企业客户,推动中国智能制造快速转型。

      

内外部数据治理结合,优化数据平台结构

细数数据团队建设的三个阶段,田日辉对第二个阶段的印象最为深刻。

和很多业务部门较多的集团型企业一样,业务规模如此庞大的联想也面临着数据分散在不同的业务系统中,难以整合的痛点。数据团队建设在初具规模之后的最重要任务,就是建立起一个更完善的企业级数据分析平台,把这些内部分散的数据以集中的方式进行整合管理并科学地利用起来。

正如上文提到,联想注重业务与数据团队的紧密结合,内部的数据团队与不同业务部门分工合作。因此从2016年开始,联想就开始把联想几十年信息化中的大小数据系统整合起来,形成企业整体数据湖,并构建统一的数据模型。

数据团队在中央提供分析算法工具,积累推广模型,提供复杂建模过程的二线帮助并举办培训活动,辅助业务部门采取自助式的服务。

田日辉给我们举了个销量预测的例子,说明联想数据智能团队内部是如何使用内部流程化工具为业务部门提供辅助的。

联想生产销售各种复杂的设备,因此销量预测是多层次的,总销量预测会分不同地区和不同产品线。在不断发展中,数据团队把预测模型放到平台上,通过几轮配型后,进行模型积累。平台本身提供很多分析和算法工具,使业务人员运用不同的数据级,使用自动化机器学习工具测试不同的算法,并给出最优结果,同时根据业务实践来判断哪个参数和配置最符合要求。

由于相关数据表极其庞大,可能会存在一些数据冲突,因此公司级大平台可以进行统一数据治理,让所有人的分析工作达到比较好的效果。

要做一个有效的预测或者优化,数据链,尤其数据的广度是非常关键的,因此联想也引入了很多外部数据。在内部平台建设的同时,联想接入大量外部数据进行合作。合作的供应商、市场预测部门、客户满意度调查,各种产品质量反馈等数据都会作为外部数据汇总进来。

内部的数据平台建设逐渐成熟后,联想的数据团队也开始将数据能力输出给提供商与服务提供商,更需要深入理解客户业务和机理模型。

对于外部行业客户,联想内部的数据科学家在专业知识理解方面相对薄弱。在进入行业初期,团队与客户的行业专家一起做项目,客户对企业的数据积累情况与行业的机理模型更清楚,而团队对数据与算法比较清楚。渐渐,客户本身会具备数据使用能力,团队也会积累一些所谓的行业专家,进而把应用模型带给其他客户。由于很多案例和应用框架可以复用,团队也一直在尝试加强对行业的理解,建立一些行业专家人才队伍。

因此,田日辉对于意向进入数据科学领域的高校学生,也提出了一些行业知识的期待。

“掌握新技术有较好的基础,且自学能力与使用能力强。但是应该更多理解企业的运营模式,业务需求和机理模型,多参加一些真正与实战相结合的活动,或到企业里面参与一些实际的工作与项目。”

      

明确团队绩效指标,“不是一件难事” 

很多团队关心数据团队本身的商业影响力及其产生的价值,相比一些传统的部门,数据团队的价值比较难估计与量化。

但在联想内部,估算产出投入与价值却并不是一个很困难的事情。

田日辉提到,由于在第二阶段建设了全集团统一的数据平台,只需要了解公司内外对于数据平台的调用有多少,并且在平台内的操作帮助业务部门创造了多少价值即可。

具体来说,团队关键KPI有用户数,产生的价值量等。由于最终的应用由业务部门完成,完成这个项目后,它的质量提升了多少,它的预测精准度提高了多少,意味着多少业务价值,都是很明显的。

到了第三阶段,对于上下游企业来说,外部企业客户最直接的价值就是其购买产品与服务花费的数额,且客户对于投入产出比的敏感性,这个指标也是很容易衡量的。

举个例子,2017年底联想开始与中国顶尖的石化企业合作,一起做催化裂化装置的工艺参数优化。最后联想的投入是客户出资的五六倍,但是团队也乐于与跟客户一起,把石化行业的标杆客户拿下,这件事对企业有非常大的业务价值,且这类价值比较容易衡量。

今年的疫情期间,虽然全球经济都受到了影响,但是田日辉的团队并没有改变原有的发展路线图和考核标准。

田日辉告诉我们,从用户使用的角度来说,云模式的产品无论从分析还是从报表各方面,基本上没有太大的影响。中央的数据团队虽然在家里远程办公,数据用户也在家里办公,但是整个平台运转还是很正常。

疫情对团队业务本身供应链会有一些影响,即用户的需求。由于疫情影响,客户对联想的产品,无论是业内产品还是云服务的产品,以及数据智能转型服务这些产品的需求,都是有所提升的。联想的私有云给外部客户提供的服务略有影响,体现在团队帮助客户来构建私有云之后,在建设初期,需要做用户访谈和数据治理,和云业务部门有比较多的沟通,这些项目会受一定的影响,但是比例不是很大。在面对疫情等重大社会事件下的经济现状中,田日辉也希望团队保持积极心态,推定数据平台与服务升级,寻求稳定发展。

我的公司是否需要独立的数据团队?

我该何时、怎么样建设自己的数据团队?

数据团队的价值如何衡量?

疫情之下,数据团队又受到哪些影响?

一起透析数据团队建设全景!

扫码填写问卷▼

编辑:文婧


http://chatgpt.dhexx.cn/article/LO55jZbx.shtml

相关文章

谷俊丽:基于大数据的深度学习

嘉宾介绍:谷俊丽,博士学历,毕业于清华大学-美国University of Illinois Urbana-champaign大学,在清华期间作为核心人员研发过超长指令字数字信号处理器,在美期间曾参与UIUC超级计算机上的研究工作,并工作实…

MyBatis从入门到精通(1):MyBatis入门

作为一个自学Java的自动化专业211大学本科生,在学习和实践过程中”趟了不少雷“,所以有志于建立一个适合同样有热情学习Java技术的参考“排雷手册”。 最近在读刘增辉老师所著的《MyBatis从入门到精通》一书,很有收获,于是将自己学…

给力!低代码开发平台广州流辰信息科技助您增辉创价值!

低代码平台开发公司流辰信息深耕行业多年,一直以市场为导向,凭借敏锐的市场洞察力砥砺前行、拼搏进取,提升研发创新能力,广州流辰信息科技与各新老客户朋友风雨同舟,携手共创宏伟新蓝图! 一、熔铸前沿科技 …

汇聚数据库创新力量,加速企业数字化转型

2022年12月29日,以“汇聚数据库创新力量,加速企业数字化转型”为主题的openGauss Summit 2022在线上举行。会上,openGauss社区理事会理事长江大勇对外公布了最近社区及生态进展,并宣布推出资源池化架构,实现软硬融合&a…

【金猿人物展】龙盈智达首席数据科学家王彦博:量子科技为AI大数据创新发展注入新动能...

‍ 王彦博 本文由龙盈智达首席数据科学家王彦博撰写并投递参与“数据猿年度金猿策划活动——2022大数据产业趋势人物榜单及奖项”评选。 ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 回顾2022年大数据行业发展,令人感触最深的是数字经济时代对“数据安全”和…

MyBatis从入门到精通(一):MyBatis入门

最近在读刘增辉老师所著的《MyBatis从入门到精通》一书,很有收获,于是将自己学习的过程以博客形式输出,如有错误,欢迎指正,如帮助到你,不胜荣幸! 1. MyBatis简介 ​ 2001年,Clinton …

沈定刚,雷柏英,李超 | Cell Press Live:人工智能在医学影像中的应用

交叉学科 Interdisciplinary 医学影像是临床医疗诊断的重要依据之一。近些年来,随着信息技术的飞速发展,人工智能即AI也更加广泛地应用于医学影像的处理分析中,包括对图像的分割分类及预测等。AI提高了诊断的精准程度和效率,同时也…

汇纳科技张宏俊:加强布局AI大数据,为实体商业服务

数字经济是继农业经济、工业经济之后的主要经济形态,更是稳定经济,推动经济转型的最强劲动力之一。在今年两会政府工作报告中,数字经济的关注程度远比以往更高,首次以“单独成段”的方式进行表述,并重点明确了“深入实施创新驱动发展战略,巩固壮大实体经济根基”。 从中不…

【Java架构:基础技术】一篇文章搞掂:MyBatis

本文篇幅较长,建议合理利用右上角目录进行查看(如果没有目录请刷新)。 本文主要总结于刘增辉的《MyBatisc从入门到精通》一书,有兴趣的朋友可以自行研读 建议仔细研读官方文档: http://www.mybatis.org/mybatis-3/zh/ …

Oracle的minus使用

Oracle的minus使用 minus 连接两个结果集,最终生成一个结果集。 功能是:第二个结果集,不会出现在最终结果集中; 如果第一个结果集的内容,在第二个结果集之内有包含,则包含的部分在最终结果集被舍弃。 其实…

MySQL MINUS-差集 [猿教程]

https://yuanjiaoc.com/tutorial/article/10143 在本教程中,您将了解 SQL MINUS 运算符以及如何在 MySQL 中使用 join 模拟 MINUS。 请注意,MySQL 不支持 MINUS 运算符。本教程向您展示如何使用连接子句在 MySQL 中模拟 MINUS 运算符。 SQL MINUS 运算符…

oracle函数之 minus

“minus”直接翻译为中文是“减”的意思,在Oracle中也是用来做减法操作的 Oracle的minus是按列进行比较的,所以A能够minus B的前提条件是结果集A和结果集B需要有相同的列数,且相同列索引的列具有相同的数据类型。此外,Oracle会对m…

Sql server中intersect, minus的用法

Sql server中intersect, minus的用法 一,Intersect Intersect常用来选择两个表格中相关联的事物,它是对两个SQL语句所产生的结果作处理的.它的作用有点像and的用法,就是说所选择的这个值要存在于第一句和第二句才会被选择出,上面…

编译原理 C-Minus 语法分析(Flex / Bison)

C-Minus 源代码 语法分析 文章目录 C-Minus 源代码 语法分析一、实现目标二、实现过程1. 综述2. 实现功能介绍(1)检测词法错误(2)检测文法错误(3)生成语法分析树 3. 代码详解(1)synt…

编译原理 C-Minus 代码生成(Flex / Bison)

C-Minus 源代码 代码生成 文章目录 C-Minus 源代码 代码生成一、实现目标二、实现过程(一)内容综述(二)代码分析1. 中间代码的表示2. 中间代码生成与优化3. 目标代码生成 三、结果分析1. 测试内容一2. 测试内容二 四、源代码放送s…

minus

minus指令是运用在两个SQL语句上,它先找出第一个SQL语句所产生的结果,然后看这些有没有在第二个SQL语句的结果中。如果有的话,那这笔资料就被去除,而不会在最后的结果中出现。如果第二个SQL语句所产生的结果并没有存在于第一个SQL…

MySql中的minus用法

MySql中的minus用法 在DB2和Oracle中,我们经常会用到minus这个函数,但是MySql中是没有minus的,那么要怎么办呢? 下面以一个小栗子来说下: 用例基础 表信息 mysql> show tables; ---------------- | Tables_in_tes…

MINUS 使用

1. sql minus运算符简介 除了union,union all和intersect运算符之外,sql还为我们提供了minus运算符,用于从另一个结果集中减去一个结果集。 以下是minus运算符的语法。 selectid froma minus selectid fromb;要使用minus运算符&#xff…

流形学习的解释

作者:知乎用户 链接:https://www.zhihu.com/question/24015486/answer/194284643 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 最近发现我的这篇回答被人洗稿(未署名&#xff…