阿里数据产品经理工作(总结篇):数据PD,做牛做马

article/2025/9/25 17:02:44

送给真正的互联网人一顿干货早餐

【小咖导读】文自 听雨-悟禅 博客,PD(指产品经理,下同)本身就是在做牛做马,关系圈异常复杂。数据PD也不例外。而且打交道的人更多。以下是作者用PPT绘制的数据产品经理关系圈。

科普:

PD:对于WEB产品设计人员而言,它的意思是“产品设计人员”,即produce designer。

PD:在IT企业中,一般是Product Director(产品主管)或Project Director(项目主管)的意思

如何做一个好的数据产品经理?

PD(指产品经理,下同)本身就是在做牛做马,关系圈异常复杂。数据PD也不例外。而且打交道的人更多。以下是我用PPT绘制的数据产品经理关系圈。如果你也做过数据产品的产品经理(好拗口),相信也有同感。既然要和这么多人打交道,要推动数据产品的上线,数据产品经理自然有着一定的要求。

我的体会如下——也借此去鞭策自己在朝这个方向努力:

1.要极其熟悉公司业务及动向。

所以要了解公司的商业模式、战略、以及业务流程、要考核的各种指标,以及指标背后的业务含义等。这一点,再了解都不够。

2.要了解数据分析。

好的数据PD,即使不做数据PD,也应该是个数据分析师。数据PD的一大要务就是将数据分析做成可复制,可自动运转的系统。虽然有数据分析师们围绕在自己周围,但是自己也要清楚业务的问题,分别要看什么数据,或者当数据出现后,意味着业务出现了什么问题或者会出现什么问题。这一点,要向最好的数据分析师们看齐。

3. 要了解数据仓库及商务智能。

这两个关键词背后都是庞大的体系,恐怕我短短半年的转岗时间太短,虽然能够对别人讲解一通商务智能产品的架构。嘴里虽然会抛出若干个类似于汇总,钻取,度量,指标,维度,缓慢变化维,层次,属性,仪表盘等等术语,但是也不支持多几层的知识钻取,遇到异常问题,也不知道该从什么地方分析原因。幸而身边有数据仓库的同事,可以多多学习。这一点,没有天花板。

而商务智能,做为一门学科,起源于20世纪90年代,它的出发点是帮助用户更好地获取决策信息,最初商务智能的动机是为用户提供自助式的信息获取方式,这样,用户就可以不用依赖于IT部门去获取定制的报表。(引自《信息仪表盘》一书P41)。而如今,商务智能除了提供信息,更主要的是降低用户获取数据的门槛,提升数据的实时性等方面。从降低用户获取数据的门槛一个方向,我们就可以做很多事情,比如如何设计信息仪表盘(designing of information dashboard)?如何让数据以更亲和的更直观的方式展示(数据可视化)?如何能够让用户离线访问?如何能够实现警戒数据的主动发送?这一点上,花多少功夫都不多。

4. 要精通数据产品开发流程。数据开发+产品开发。

数据PD的最终目的是要做数据产品。这里要拆开看,其一,数据产品本身也是在线可供用户实现的产品,既然是产品,产品的整套研发思路和普通的产品没有太大区别,用户是谁,他们需求是什么,满足需求需要什么feature

list,每个feature list的资源评估以及优先级如何,产品的生命周期如何?这是产品开发。然后他是个数据产品,意味着这比普通的产品,多了更多的要求。在数据这个内核之外,它需要各种feature list,如订阅,搜索,自定义,短信接口,邮件接口等。但是数据这个内核,也需要一套数据开发流程。

比如:

数据源——是否足够,是否稳定

数据PD需要足够了解目前的业务处理系统建设情况,以及数据源的积累程度,用以判断数据产品的建设时间是否合适。不合适的时机会导致项目组的重复劳动和残缺的数据产品诞生。数据产品是用以支持监控,分析,决策的,而业务处理系统的定位在于提升工作效率,解放工作人员手脚。业务系统采集的数据未必满足所有分析需要。比如或许领导要分析大量攀升的退换货的详细原因,而业务系统目前并没有要求用户在申请退换货的时候选择原因或只有输入而非标准化选项,负责退换货出力的员工也只有在excel里登记原因,而不是录入到系统里。所以可能会导致需求方要看的数据提供不出来,那么数据pd就有必要反向驱动数据源得以采集。

分析模型的设计—— 分析模型的好与不好,其实决定了数据产品的成败。

在项目中,可以由BI的数据分析师们担纲此职责,也可以由数据PD担纲,更多则由双方一起确认,内容以数据分析师们为主,功能评估及优先级、项目计划和协调、统筹以数据PD为主。所以数据PD要更加清楚数据分析师们所需要的需求是否能够实现,背后的商业价值如何,并与数据开发、产品开发保持比数据分析师们更加通畅的合作关系,能够借力进行可行性和资源的评估。

有的时候,我们不是没有数据,而是有了太多的数据,不知道怎么去看。如果只是抛给用户一堆数据,很难想象用户会如何去解读它。以前做交互设计的时候,我们流行一句话:把用户当成傻瓜。

而数据平台,因为可能本身就要求有一定的使用门槛,所以想成不会互联网的傻瓜不太现实,那么我们就要想成“用户是不懂数据的傻瓜”。他们或许也能通过一串串数据体悟到什么,但是如果是一条上升的退款率趋势线,或许他们会体悟到更多——毕竟,上和下本身就是直观的。然后再想一下,如果将这条线上加上一条警戒点的线,他们会知道从什么时候开始数据是异常的。再然后,就要设想,当他发现从7月12日数据上升后,想干什么?他会不会想了解是哪个行业上升了?他会不会想了解是那个渠道上升了?那么,就要提供行业和渠道的选项或者对比给他。

再然后,当他过问了这个行业的负责人后,负责人想不想再了解是哪个供应商或者哪类商品上升了?那么要如何将这些维度、层次都融合在一起,同时又能将用户非常方便地去用呢?分析模型的建设至关重要,也可以说,分析模型是前期需求分析的最有价值的产物。分析模型应该会包含几点:

主题的划分:

整块分析会划分成什么主题,比如销售可能会分成销售走势及构成分析,行业排名,商品排名等

度量及指标:

分析主题会涉及到的度量及指标的算法、定义等(这通常会产生一份指标以及维度的定义及描述文档)

维度:

要分别从什么维度去看这些指标和度量,如时间,渠道,这些维度是要筛选还是要对比

钻取:

这些维度本身有没有层次,需要不需要进行钻取,如渠道可钻取到渠道类型,行业可钻取到子行业,商品类目可钻取到商品叶子类目等

输出:

分析需要用何种图表进行展现

数据的ETL开发

数据的清洗,转换,装载流程占用了数据产品开发的大半资源,不规范的数据源会导致这一块的资源更大程度的占用。比如同样是供应商编码,系统之一称为供应商编码,系统二命名为供货商编码,系统三命名为供应商ID,这三个系统同时是公司的系统,这种情况虽然想起来匪夷所思,但是现实情况却也存在。虽然ETL开发是DW开发工程师在做,但是作为数据PD,焉能对这些工作缺乏了解,对ETL工程师反馈的问题,缺乏认知,不理解对于项目的潜在风险是什么?而且更多时侯,当遇到数据不规范,不统一的问题,数据PD需要反向驱动业务系统进行数据规范性建设,无论是功能上,还是驱动直接的使用方——如负责录入数据的行业小二,建立一套录入规范。这些工作看似和数据PD无关,我们大可以推脱说:那没办法,这是数据源的问题,不是我们功能的问题。但是,用户是有权利选择使用不使用你的数据产品的,当数据产品提供的数据不值得信赖的话,无疑是自取灭亡。一旦用户对数据不信任,再想挽留他们,是很难的。即使有很多“无能为力”的借口,我们也不能坐观其变。

前端交互与体验的优化

虽然内容定义好了,但是那么多度量、指标、维度、钻取,如何划分信息层级,如何划分栏目,如何设计用户的行为路径?这些就不是数据分析师们的重要工作范畴。而是交互设计师?鉴于很多数据产品项目可能会没有交互设计师,所以数据PD应该对内容进行封装,进行信息架构、页面布局以及图表各种功能设计。设计,然后撰写详细的功能需求文档,交付给产品开发,前端开发以及数据开发,以及前端展现开发四种类型的开发人员。

数据产品的功能描述文档,除了产品开发部分,其他的就是在描述“内容”,即分析模型,除了主题、度量、维度、钻取、筛选、输出图表类型,有些内容还需要详细定义到

“排序方式” 等等细节,这就case by case来看了。

环境,技术,工具

或许做一个普通的产品,你把需求描述清楚,与产品开发工程师确认好可行性,接受资源评估就OK了。但是数据产品,受制于所部署的环境,所选型的工具,如Oracle,IBM的Cogos,以及SQL Server。其他的产品我不知道怎么样,我们用的是Oracle BIEE。那么作为数据PD,是否需要了解BIEE能够提供的功能是哪些呢?看文档,请教别人,不能知其不可而为之。另外,也需要逐渐摸透BIEE的坏脾气,实现不了的功能,无法克服的难点等。这一点,也需要继续了解,继续学习。

心得总结篇

下面,谈几点我的心得总结,或许还显得稚嫩,但是自己所得,要远远比看别人文章或者看书得来的深刻,记录下来,以便于后续校验。

1. 数据产品的价值

2. 数据产品的用户

3. 数据产品架构

4. 数据产品风险

5. 数据产品VS业务系统

6. 数据产品项目流程

7. 数据产品交付物

更多推荐

回复“51”:目前最好的关于用户运营文章:用户运营的定义、演变和方法论

回复“52”:百度移动云高级美女产品经理:O2O日趋火爆,下个估值过亿的上门美业将花落谁家?

回复“53”:为什么我们都来北上广?此生若得安稳,谁愿颠沛流离!--PMcaff献给所有奋斗的互联网人

回复“54”:2015版App推广全攻略:你所不知道的撕逼营销,事件营销和PR传播。

回复“55”:火爆了,5000位来自百度阿里腾讯Amazon的产品经理疯抢的课程现场。

回复“56”:微视已死,腾讯战略放弃微视,大牛纷纷离职,PMcaff--行业内部解读。

回复“57”:Uber产品经理首次在中国自述产品理念:我们看中的并非只是钱。

回复“58”:产品经理们是如何越过 iOS 沙盒机制的?

回复“59”:如何避免开发一款失败的产品?

回复“60”:你可能不知道的学习的15个APP设计技巧!

原创或推荐文章请发送至邮箱:xiaoxi@pmcaff.com

pmcaff合作媒体:Chinaz


http://chatgpt.dhexx.cn/article/VAcsfxO6.shtml

相关文章

DevOps笔记-05:IT行业中BA、SM、PO、PM、PD、Dev、Ops、QA都是什么角色

1、BA (1)定义 BA是Business Analys缩写,即业务需求分析师。在互联网公司里,BA的角色就是产品经(PM),只是BA要承接某个很具体的业务或者领域,比如银行也有自己的IT部门,银行IT里的产…

Java空指针异常:NullPointerException

Java空指针异常(NullPointerException):空指针异常属于运行时异常(RuntimeException),即:编译会通过,但运行时会报异常。当你调用某个实例对象的方法时,如果该实例对象是…

什么是空指针异常

日常开发过程中,最常见的异常莫过于NullPointerException,之前的时候,只是知道去找到报错的位置,然后去解决它,最近有空学习C语言,就去深究了下NullPointerException异常的本质。 发生NullPointerExceptio…

空指针异常的原因分析

空指针异常的原因分析: 1.当一个对象不存在时又调用其方法会产生异常obj.method() // obj对象不存在 2. 调用空对象的方法时就会抛出 NullPointerException 空指针异常 (对象自己new 或是spring管理的要加Autowired注解) 3.如果该对象是由spring容器进行依赖注入(DI…

如何有效的避免空指针异常

空指针异常如何避免,听听老司机分享一些条件反射式的使用经验。 | 喜欢听我叨叨的,直接看视频 | 01 开篇 空指针异常在新手程序员里面非常常见,不只是新手,所有初级、中级甚至是高级都不可避免。 本期主题的由来是因为有这样一位…

关于Integer的空指针异常

关于Integer的空指针异常 问题来源 当用Integer来接收数据后,需要将数据与0进行比较,看是不是0,但是如果Integer接收的数据是null的时候,就会报空指针异常。 public static void main(String[] args) {Integer a null;System.…

如何解决空指针异常

NPE异常相信 Java 程序员都很熟悉,是 NullPointerException 的缩写;最近业务需求开发的有点着急,测试环境就时不时的来个NPE异常,特别的头疼;作为出镜率最高的异常之一,一旦入行Java开发,可以说…

Java 空指针异常的若干解决方案

Java 中任何对象都有可能为空,当我们调用空对象的方法时就会抛出 NullPointerException 空指针异常,这是一种非常常见的错误类型。我们可以使用若干种方法来避免产生这类异常,使得我们的代码更为健壮。本文将列举这些解决方案,包括…

NullPointerException(空指针异常)

NullPointerException(空指针异常)对象为Null还拿来使用,就会出现此异常。 多的不说少的不聊,直接上代码!!! public class Main {public static void main(String[] args) {String str1 "";String str2 n…

Java中的空指针异常

Java中的空指针异常 一、什么是空指针异常? 1.1 异常的分类 NullPointerException是RuntimeException的一个子类,这是运行时异常,在编译时期不会触发。 1.2 空指针异常引入 Java是没有指针的,所以我们常说"Java 指针&quo…

PageRank算法介绍

互联网上有数百亿个网页,可以分为这么几类:不含有用信息的,比如垃圾邮件;少数人比较感兴趣的,但范围不是很广的,比如个人博客、婚礼公告或家庭像册;很多人感兴趣的并且十分有用的,比…

PageRank 算法(从原理到实现)

spark 系列 Spark 核心原理及运行架构 Spark RDD详解 Spark 常用算子大全 Spark SQL 详解 Spark GraphX 图计算入门基础 Spark PageRank 算法——从原理到实现 Spark PageRank spark 系列前言算法来源算法原理排名泄露排名下沉排名上升算法证明 PR值计算方法幂迭代法特征…

浅谈PageRank算法

TOC[目录] PageRank 是 由佩奇(Larry Page)等人提出 的 Google 最为有名的技术之一 PageRank 是一种基于随机游走 的 评价网站权值的算法 总之, PageRank 是一种十分重要的算法 不管在学术界 还是在产业界 Node Similarity(节点相似度) 假设在一个图G(V,E)中研究两…

PageRank算法 到 textRank

1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里佩奇和谢尔盖布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该 算法也成为其他搜索引…

PageRank算法浅析

转载请注明出处!!!http://blog.csdn.net/zhonghuan1992 本文是根据 Topic-Sensitive PageRank Google’s PageRank:The Math Behind the Search Engine http://blog.csdn.net/hguisu/article/details/7996185 http://blog.codinglabs.…

PageRank 算法详解

转载自:https://blog.csdn.net/m0_37786726/article/details/79864012 参考文献:https://blog.csdn.net/androidlushangderen/article/details/43311943 链接分析 在链接分析中有2个经典的算法,1个是PageRank算法,还有1个是HITS…

数据挖掘十大算法:PageRank算法原理及实现

一、PageRank的概念 PageRank,网页排名, 是一种由根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一, 它由Larry Page 和 Sergey Brin在20世纪90年代后期发明,并以拉里佩吉(Larry Page&#xf…

PageRank 算法及实例分析

本文一部分是针对图的PageRank 的实现,以及具体数据集的分析过程的记录。 另一部分是BFS的实现,并记录每一层的节点数。 数据集下载地址 soc-Slashdot0811 、 roadNet-CA 、 soc-LiveJournal1 1. java 实现代码 Main.java import java.util.List;pu…

PageRank算法(二)

原文地址:https://blog.csdn.net/monkey_d_meng/article/details/6556295 说明:这是我学习过程中看到对PageRank来龙去脉解释非常清晰的博客,博主很厉害,大家可以关注一下原创作者! 一、PageRank算法的简单举例 Goo…

PageRank 算法实现

大数据管理与分析实验报告 实验一 大数据系统基本实验 实验二 文档倒排索引算法实现 实验三 PageRank 算法实现 实验目的 PageRank 网页排名的算法,曾是Google 发家致富的法宝。用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度。通过对PageRank 的…