大数据交易的“上海模式”,底气在哪里?

article/2025/10/29 7:12:07

长春甲骨文华育兴业校区整理自:胡世龙


如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学家,希望能让你们了解这些神奇的人和他们的神秘事儿,为你们一窥数据科学的未来与未知。


汤奇峰,学管理出身,曾任谷歌中国区大客户部总经理,自此和技术、数据、市场结下不解之缘。‘数据科学50人’选择汤奇峰作为访谈对象,源于其在数据交易领域的最新市场化探索——目前他带领着年轻的上海数据交易中心,试图从技术、市场维度,探索出一套具有上海特色的数据交易商业新模式。


▍长春甲骨文华育兴业“数据孤岛”越来越大了?


最近,知名独立媒体人、零点咨询创始人袁岳在一场演讲中针对国内的数据开放现状发表了一番感慨:“我们今天依然没有大数据,只有大的数据孤岛。每一个人都抱着自己的数据,实际上还是一个数据孤岛,而且孤岛比以前更大了。”


这种看法,点出了国内大数据应用方面的一大“软肋”:企业往往对自家的数据“看得很紧”,只想从别人那里得到数据,却不愿意拿出数据。其结果就是很多数据都被锁在了“笼子里”,没能发挥更大的融合的价值。


怎样让数据更高效地流通融合?在大数据业界,已经开始尝试一种商业化模式:成立数据交易中心或是交易所,加速大数据的合法买卖和流通,也就是说,你可以在交易中心合法买到其他公司提供出来的合法数据。


2015年以来,从贵阳、到武汉,再到上海、重庆、杭州、哈尔滨等地,数据交易机构、公司的数量逐渐多了起来。这其中,既有政府许可的、也有民资的各类创业公司(以API接口作为交易方式)。


民资背景的大数据交易平台“发源地大数据”创始人马建军较为乐观,他透露,2015年以来,大数据交易的市场规模扩大了将近10倍,预计2017年的交易额有200亿元左右。“总体上是一片蓝海”。


在马的认知中,政府许可的机构以及民资背景的企业各有优势,而政府许可的交易机构可能会在政策层面参与地更深。


DT君的问题也恰恰在于此。政府许可的数据交易机构的数据交易模式是怎样的?会从实际层面为打破“数据孤岛”带来哪些改变?进一步开花结果的障碍在哪里?带着这些问题,DT君专访了上海数据交易中心CEO汤奇峰,希望一探大数据交易行业的现状、了解行业的困局与方向。


长春甲骨文华育兴业 政府支持的机构,怎么做数据交易?


去年12月刚入选“2017年上海领军人才培养计划”百人名单的汤奇峰,是大数据应用企业晶赞科技(上海数据交易中心的技术支持方及股东之一)的创始人。他掌舵的上海数据交易中心,是一家由政府许可并批复、国资民资共同参与的混合所有制企业。目前,该中心也是“大数据流通与交易技术国家工程实验室”的承担单位、国家大数据交易标准化试点单位。


2016年4月,上海数据交易中心正式挂牌,中心是上海市大数据发展“交易机构+创新基地+产业基金+发展联盟+研究中心”五位一体规划布局内的功能性机构,承担着促进商业数据流通、跨区域的机构合作和数据互联、政府数据与商业数据融合应用等工作职能。


(图片说明:由上海数据交易中心承担建设的上海大数据应用展示中心)


相对于2015年4月成立的中国首个大数据交易所——贵阳大数据交易所,以及之后陆续推出的10多家类似机构,上海数据交易中心并非国内最早。但作为一种新生的商业模式,在公司成立之初,汤奇峰还是花了很多时间向外界解释:什么是数据交易?公司的模式是什么?


汤曾向媒体举了这样一个例子:张先生是一位厨师,正打算从金融企业借钱买一款手机,金融企业必然要做风险评估。第一步,金融企业需要判断张先生是否真要拿钱去买手机。这个时候,大数据可以知道,张先生最近是否访问过京东、苏宁等购物网站;第二步,金融企业还需要判断张先生是否真的是厨师。这时候,同样是通过大数据,可以了解到张先生是否连续在固定地址上班;第三步,还可以看张先生的手机号码是新开通的还是老用户,有没有固定的社交圈,甚至他在航空公司的旅行记录,还可以帮助确定其收入。


对于上述例子中的这一类金融企业来说,以往要获得各种数据,需要到处“拜码头”,寻求数据合作。但成立数据交易中心后,分散在各处的数据源可以在这里集中起来交易。在交易的过程中,还要对数据是否涉及用户隐私问题进行评估(必要时要对数据脱敏处理)、数据的确权、定价、数据质量的认定等一系列工作。工作虽然复杂,但因为集中化,因此往往效率更高。


出于对数据安全、隐私和风险评估等方面的考虑,上海数据交易中心目前采取的是会员制,交易并不对个人开放,而只是面向企事业单位。所有有意向的成员,第一步都需要提交申请材料,通过审核之后才能获取成员账号。而不管是数据的供应方还是需求方,都需要承担相应的权利和义务。


对于数据的供应方,需要按照一定的标准,对数据的属性进行准确描述,然后才会进行挂牌。而数据的需求方则可以在交易平台查询、选择数据供应方的可供应产品。


至于数据的定价,需要经过供应方密封递价进行竞价,需求方择优选定之后,才会生成数据商品订单。


“数据交易在国内总体上还是比较新的事物,但已经有越来越多的企业开始接受这种模式。”汤奇峰向DT君表示。


对大企业之间来说,可能会有数据互换的需求,而对于更多的中小企业,对于数据价值的认识本身也在提升,“让数据变现”成了很多企业愿意尝试的。


长春甲骨文华育兴业 “上海模式”有何不同


对于上海数据交易中心这类由政府许可的机构来说,在大规模市场化之前,先建立一套交易的准则,更注重数据的安全、隐私的保护,是其主要特点之一。


这样的事情,各地的类似数据交易中心也都在做。上海的优势和独特之处又在哪里?


面对DT君这样的提问,汤奇峰的回答也很干脆:上海这座城市,就是最大的优势所在。


他坦承,上海数据交易中心成立的时间并不早,但在数据的流通方面,早在2012年上海就已经有相关的研究。而上海一贯的特点是“谨慎而务实”,做了充分讨论,但步子在最初并没有迈大。


“尽管上海并不是第一个成立数据交易中心的,但为什么国家会把大数据流通和交易技术的实验室放在上海数据交易中心?我之前去项目现场答辩的时候,就强调了这样的因素:上海人才和科研机构众多,多年来在信息系统上已经产生了重要的基础和支撑。要想在数据交易和流通方面有所突破,普惠整个行业,把大旗交给上海是再合适不过了。”他进一步补充。


上海的天然优势有不少。比如,上海本身是金融的中心、航运的中心,比较早地感受到了数字时代,一是数据资源丰富,二来从市场的迫切性来讲,也有数据资源重新配置的需求。而在其他经济本身不太活跃的地区,对数据要素的需求显然也是不太活跃的。


而在上海数据交易中心的一整套模式和做法上,也有着上海这座商业城市的鲜明特点。


先是公司的性质,不同于国内其他数据交易中心要么由民资、要么由国资主导,上海数据交易中心的成立则是由政府许可并批复,企业来共同参与,属于国有控股混合所有制企业。在发起单位中,既有上海市信息投资股份有限公司、中国联通、中国电子等国企,也有如晶赞科技、万得、万达信息这样的民营企业。用汤奇峰的话来说,“政府牵头、民企也参与,既兼顾了数据交易的公信力,也更有效率。这就是大数据交易的‘上海模式’。”


另外一方面则是其浓厚的技术特色。虽然各地的数据交易中心都在做自己的研究,但各自的方向和侧重点有所不同。和国内其他数据交易中心的重心要么侧重市场拓展,要么是行业整合等“对外”事务上不同,上海数据交易中心的技术色彩更浓。


在国家设立的11家大数据领域的国家工程实验室中,上海数据交易中心承担的实验室是唯一一家以大数据流通与交易技术为重点方向的。


(图片说明:上海数据交易中心目前是大数据流通与交易技术国家工程实验室的承担单位。)


说到交易技术,很多人可能不太理解,但这却是和每个人密切相关。比如,在数据传输流通中,最令人担忧的往往就是个人信息是否安全。而通过一系列交易技术,能够实现对个人信息的保护。


去年9月,上海数据交易中心和公安部第三研究所共同研发、推出了数据流通xID标记技术。这种技术组合了数据分类规则、不可逆标记生成、传输控制等多项技术,使得交易数据无法识别个体且不能复原个人信息,形成的无特定标识的个体标记数据。


同时,基于真实应用场景,在数据流通规则控制下,在线实现数据的合规按需获取。


有了这类技术,数据流通中的个人信息安全就有了保障。


除了技术,上海数据交易中心还有一大特色:“不做产品”。


所谓不做产品,指的是不做标准化的产品,而是更关注基于场景的应用。目前,上海数据交易中心提供的服务主要聚焦市场营销、金融风控这两大应用板块。“没有应用场景的数据流动本身就是非常流氓的做法,因为数据流动会产生很多社会、法律问题,对于数据流通的边界需要有预先的感知,我们觉得在什么场景下使用是非常重要的。”汤奇峰称。


长春甲骨文华育兴业 “解决数据孤岛并不难,难的是思维转变”


2015年,在贵阳实现了中国首批大数据交易,据《贵州商报》当时的报道,在首批数据交易中,卖方中出现了腾讯的身影,而买方则包括京东。


在某些特别的资本运作或商业联盟下,部分拥有丰富数据资源的科技巨头对数据交易这种模式,似乎并不排斥。但在促进数据流通的过程中,对于更多的企业来说,所谓的“数据的孤岛效应”是个绕不过去的槛。


一般而言,很多企业都比较在意数据的权属,不太放心将自己的数据拿出来交易给别人,但对别人的数据却都虎视眈眈。


发源地大数据创始人马建军此前向DT君表示,除了政府层面促进各个部门的数据开放,以及大企业出于对各类数据的巨大需求,有可能会互换数据外,如何让更多的中小企业也参与数据的共享、融合,是“数据孤岛”最大的问题所在。


而在汤奇峰看来,要解决这样的问题,让更多的企业愿意拿出数据,思维的转变是重要一步。


汤奇峰觉得,单纯就数据交易来讲,孤岛的问题并不难解决,因为企业所需要的数据的供应商往往不是唯一的。


他举例说,比如中国民航信息集团(中航信)拥有一部分国人乘坐航班的数据,通过中航信也许可以获得这部分数据。但是中航信并不是唯一的供应商。


尽管不是每个企业都愿意拿出数据,但是也有一些公司在业务发展过程中,思维会比较开明,觉得既然数据是资源,那么就应该在流动过程中发挥价值,让其“变现”。


比如,有一些航空公司在想清楚这个问题之后,就可能会把数据拿出来。如果有一两家这样的航空公司,再加上机场方面的一些数据,是可以拼接出一份完整度较高的数据的。


因此,汤奇峰认为,数据的来源是完全可替代的。


“我觉得其实所谓数据孤岛不是数据的孤岛,而是数据思维的孤岛,当企业真正想清楚了,问题就简单了。你需要别人在数据方面帮助你的同时,其实你也需要对别人做相应的支撑,要有相应的社会角色。数字经济本身就是一种分享经济,这种数据的分享,当然不是没有代价的。”他说。


除了数据的分享,要打破数据思维的孤岛,促进数据的流通,加强企业内部的数据治理也是重要一步。


“很多时候,有些企业会感叹说没有数据,其实企业对于自己的内部有什么数据并没有进行梳理。”


在汤奇峰的观察中,一些企业的内部数据往往就已经能解决很多问题,而且现在很多企业本身也不是孤零零地存在,而是在整个供应链的链条上。即便企业本身数据不多,跟上下游的企业也是可以谈数据合作的。


长春甲骨文华育兴业 行业发展的最大挑战在法律的“缺位”


在上海数据交易中心网站提供的资料中,展示了其自行编制的一系列适用于其平台的规范化的交易准则和标准文件,比如《数据互联准则》、《个人数据保护原则》、《流通数据处理准则》、《流通数据禁止清单》等。


DT君发现,像是《流通数据禁止清单》中,就包含了涉及特定个人、特定企业权益、或者是危害社会稳定等数据类型。而在《个人数据保护原则》中,也强调了数据的持有人应该自觉维护数据主体的合法权益。


之所以列出这么多的准则,在很大程度上和适用法律的不明确有关。


汤奇峰表示,对于数据交易中心这类机构来说,发展遇到的最大挑战就在于对法律的把握。目前,国内没有出台个人信息保护法,因此,在数据的流通过程中,企业方对于哪些数据不能流通、哪些环节和应用的场景可能和法律有冲突,会出现一些不太容易把握的情况。


“其他像是商业机密数据的问题,都已经有刑法或其他法律的规范。目前对整个行业影响最大的就是在个人信息这一块”。


尽管面临挑战,汤奇峰还是在专访的尾声中表示看好数据交易行业的前景。


他最后说道:“在人类没有发现石油之前,当然没有人去使用石油。数据也是一样,当你有数据的意识之后,对数据的使用就会产生较强的需求,自然会形成一个数据资源配置的市场。”


结束专访的DT君不免唏嘘,数据孤岛的破与立实际上对于不同的人,站在不同角度看,有很不同的状态,但对于大部分人与商业体而言,孤岛效应依旧存在。大数据产业早已是国家战略,而交易流通依旧面临技术、商业关系以及思维等阻碍。作为“数据科学50人”的又一访,我们领略了数据交易人的故事,局内人无不是“路漫漫其修远兮,吾将上下而求索。”


http://chatgpt.dhexx.cn/article/0HDgOHWQ.shtml

相关文章

云栖大会人脸识别闸机【技术亮点篇5】--人脸识别闸机采用海康威视摄像头

云栖大会人脸识别闸机【技术亮点篇5】–人脸识别闸机采用海康威视摄像头 艾力奋会展服务公司为云栖大会提供的人脸识别闸机,装有海康威视的摄像头。 海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,针对公安、交通、司法、文教卫、…

海康威视相机概述

海康威视相机概述 1. 海康相机的命名规则2. 海康威视相机系列3.常用的几款型号 海康机器人网站:https://www.hikrobotics.com/cn 1. 海康相机的命名规则 2. 海康威视相机系列 CE系列经济型 CE系列是主打高性价比的经济型系列产品,像素覆盖面很广。以卷…

【漏洞复现】海康威视iVMS综合安防系统任意文件上传漏洞复现 (在野0day)

文章目录 前言声明一、产品简介二、漏洞概述三、影响范围四、漏洞验证五、漏洞利用六、修复建议 前言 海康威视iVMS综合安防系统存在任意文件上传漏洞 ,攻击者可通过构造特定Payload实施对目标的攻击。 声明 本篇文章仅用于漏洞复现与技术研究,请勿利用…

实现暂停一秒输出的效果_HID控制器与海康威视人脸识别amp;测温门禁一体机实现联动的改造方法...

本文介绍了传统门禁系统与海康威视人脸识别&测温门禁一体机通过修改线路实现人脸测温卡控制门禁系统的方法。 v 实现功能: 可实现人脸认证卡认证双重认证; 可实现体温控制,体温超限人员无法进入; v 实现原理&#xff1a…

Python函数的参数传递细节

一、C/C中的函数参数传递 在C/C的函数参数传递大家都很好理解,在定义时的参数就是形参,调用时输入的就是实参,下面用代码来理解值传递、地址传递(引用传递): 1.1 值传递 void find(int x){} int z 1; y …

python中参数传递

在编程语言中,函数的参数传递有两种情况: 按值类型传递 num 10 def double(arg):argarg*2print(arg)double(num)调用该函数,传入一个变量,其实传入的是该变量的一个副本,该变量在函数中发生变化,不影响函…

Python参数的传递

一、参数的传递 函数的参数传递本质上就是:从实参到形参的赋值操作。Python中“一切皆对象”,所有的赋值操作都是“引用的赋值”。所以,Python中参数的传递都是“引用传递”,不是“值传递”。 具体操作时分为两类: …

python传参数的方法

Python的参数传递是通过传参指针来完成的,当参数指针指向了另一个变量时,它就会被传递给它。这种传递方式与 Java或C#中的传参方式是类似的,在 Python中,参数可以是一个字符串,也可以是一个对象。这个方法的好处是它不…

python中参数的传递

一、函数的参数传递本质上就是∶从实参到形参的赋值操作。Python中“一切皆对象”,所有的赋值操作都是‘引用的赋值”。所以,Python中参数的传递都是“引用传递”,不是“值传递”。具体操作时分为两类︰ 1.对“可变对象”进行“写操作”&…

Python函数参数传递

Python函数参数传递 一、前言二、了解形式参数和实际参数1.通过作用理解2.通过比喻来理解形参和实参 三、位置参数1.数量必须与定义时一致2.位置必须与定义时一致 四、关键字参数五、为参数设置默认值六、可变参数1.*parameter2.**parameter 一、前言 在调用函数时,…

计算机毕业论文外文翻译是什么,毕业论文的外文翻译是什么

毕业论文的外文翻译是什么 此栏目涵盖有关于外文翻译和毕业论文的范例,免费给你学论文的外文翻译是什么提供有关参考资料。 摘要:文章从成人学生知识基础、指导教师、写作过程监控等方面,分析了成人高校学生在毕业论文写作中存在的伪造、抄袭、专业水平低…

关于android的外文论文,毕业论文外文翻译-Android开发

毕业论文外文翻译-Android开发 (11页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.90 积分 毕业设计(论文)外文翻译 毕业 论文题目 基于 Android 手机通讯录的设计与实现 作 者 姓 名 所学专业…

在哪能查到英文论文?

不论是撰写英文论文还是引用外文文献,写论文的过程中想必缺不了检索合适的英文论文这个步骤,在本篇内容里,不仅教会你如何查到英文论文,还要教会你怎么样快速找到合适的英文论文!听起来是不是令人心驰神往,…

计算机毕业论文外文译文,计算机毕业论文外文文献译文

计算机毕业论文外文文献译文 外文文献原文What is ASP.NET? ASP.NET is a programming framework built on the common language runtime that can be used on a server to build powerful Web applications. ASP.NET offers several important advantages over previous Web…

如果想要直到一篇外文论文的质量

首先在CCF A类中寻找 然后view这篇论文,然后点击这篇论文所属的期刊名称2处 就可以看到引用得分和影响因子了,3处 文献鸟自动推送:https://www.storkapp.me/main.php 文献鸟使用的教学视频:https://www.bilibili.com/video/BV1tf4…

关于php的外文论文,php毕业设计外文翻译--通过PHP访问MySQL(适用于毕业论文外文翻译+中英文对照).doc...

[摘要]PAGE 原文:? ? Getting PHP to Talk to MySQl Now that you’re comfortable using the MySQL client tools to manipulate data in the database, you can begin using PHP to display and modify data from the database. PHP has standard functions for…

都有哪些查找和下载英文文献的方法?

很多朋友在查找文献的时候,都不知道该从哪里找,也不知道从哪里下载,怎么下载,尤其是想要查找英文文献。其实查询和下载英文文献无非以下三种方式: 选择一些比较权威,内容丰富,基本覆盖所有学科…

面向对象实现游戏聊天中的敏感词屏蔽功能,将敏感词汇用星号***替换

import java.util.Scanner;//新建一个类 public class Replace {// 定义一个字符串String commons;// 建一个替换的方法public void replace() { //控制台输入Scanner sc new Scanner(System.in);// 提示输出(为方便功能实现,此处提示内定的敏感词汇&am…

腾讯敏感词汇大全_腾讯数平精准推荐 | OCR技术之识别篇

腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐、海量大数据挖掘等领域的技术研发与落地。 在社交广告推荐领域,团队自研的深度在线点击率预估算法及全流程实时推荐系统,持续多年提升社交广告点击率。图像作为当前社交广告最重要的展示形式,文字识别、物体识别等…