数据分析师需要具备哪些能力

数据分析师的工作内容主要如下:

 

1. 定义一个或多个关键指标来判断业务的好坏(指标通常和KPI或ROI有关);

 

2. 对指标进行操作性定义,也就是现有业务的哪些数据(或者数据表的字段)组合起来(可以理解为一个方程)可以计算出该指标;

 

3. 结合业务发现影响该指标的那些因素,如果业务指标是因变量y,那么影响因素就是多个自变量x(或者机器学习中的多个特征),并筛选出那些重要的影响因素(尤其是对y的贡献大且业务上可控的因素);

 

4. 在时间、人群、产品、营销等维度上细分,横向不同细类下以及纵向时间维度上影响因素x和业务指标y的关系(或者细类的分布和变化趋势等),基于业务上的考量对各细类分出优劣并给出解释,然后找到从劣到优的转移路径(也就是业务上可以操作的拉升KPI的点);

 

5. 给出具体的可执行的方案(符合SMART原则),推动落地实施(可能要和商务、产品、运营、技术等合作),最后评估方案对关键指标的影响效果以及ROI等方面的考量(实际上3,4,5是一个“循环”操作)。

 

至于这个过程中,怎么去采集数据、清洗数据、怎么计算、用什么软件、选择什么模型等都是方法问题,没有唯一的方法也没有最好的方法,整个过程通常以结果为导向,以解决业务问题为首要目标。



数据分析师需要的核心能力包括业务理解、方法理论、技术实现3个方面。

 

1 业务理解

 

行业理解:比如电商主营业务是卖货(C端)以及提供在线货架管理(B端),然后延伸服务(比如金融、自营品牌等),目前国内市场的top3是天猫、京东、唯品会,三家的业务模式又各有不同;

 

产品模式:卖给谁(用户人群有啥特点)?卖什么(主营产品或服务)?在哪卖(交易场景是啥)?这3点对应的是人、货、场;

 

关键指标:只有被量化以及对比适合的参照点才能知道业务的好坏,推荐《精益数据分析》这本书,涉及互联网的主要商业模式以及相应的关键指标解读;

 

2 方法理论

 

业务知识:产品的主干转化环节(枝干环节如何拆分)、如何监测用户数据(e.g.埋点)等,以及运营的主要形式及目的(用户运营重生命周期转化,内容运营重活跃,产品运营重产品转化,活动运营重交易或传播),运营相关的书籍,推荐黄有璨的《运营之光》以及李少加的《进化式运营》;

 

数学知识:概率统计、线性代数、常用的机器学习算法等专业知识都要知道的,理论上讲,这些知识知道的越清楚,使用得越熟练,工资就越高。不一定要做到能推导公式,但至少也要理解各类算法的大致原理、优缺点、使用前提及场景等;

 

通用能力:比如思维方法(e.g.数据分析常用思维)、沟通技巧(e.g.表达的框架)、项目管理等,关于通用能力这块,推荐看《12个工作的基本》和《商业模式新生代》,可以辅助构建自己的能力体系;

 

其他专业:跨专业的知识不仅有利于工作中理解用户、产品、营销等,也能让自己在生活中多多收益,推荐科特勒的《营销管理》,如果对心理学感兴趣的话,《心理学导论:思想与行为的认识之路》和《心理学与生活》是不错的入门读物,当然,跨专业的知识也可以直接和合作的业务方请教学习;

 

3 技术实现

 

流程:比如数据分析的常见的SEMMA、CRISP-DM流程,涉及到数据采集、清洗、整合、转化、建模、评估、上线等环节,每个环节还可以细分操作方法,比如数据采集可以分为网络爬虫、问卷调研、用户访谈、产品埋点等(详情见数据获取)。对应到具体的工作内容,可能就有更多细化的操作,比如需求处理流程、报表开发流程、模型上线流程等;

 

工具:分析软件(Excel/R/Python/SAS等)、可视化软件(PowerBI/Tableau等)、大数据平台(Hive/Spark等)、机器学习框架(Tensorflow/Mahout等)等,趁手的工具一定要熟练使用(详情可参见数据分析常用工具)

 

架构:使用工具来搭建整合数据分析流程的系统或者数据产品,这是比较高阶的能力,架构不仅要掌握全面且熟练的技术,还依赖于对过往工作经验的总结,从中提炼“模式”和“标准”,将标准化的某项技术或者分析思路用规则化的编程语言实现,最终形成一个适用于多个场景(迁移性)的产品。

 

数据分析的两个主要分支方向——分析和挖掘,不管是哪个方向,基本的数学知识和机器学习算法都属于必备技能:

 

分析偏业务

 

自上而下的“理论”或者业务驱动;

 

和产品、运营打交道比较多(工作输出对接主要就是这两类同事);

 

一般title是“数据分析师”、“数据产品经理”、“运营分析师”、“商业分析师”等;

 

通常要求会Excel/R/Python/SAS、Tableau/PowerBI等软件,会使用常见的算法,了解产品和运营的分析思路,能输出产品或运营优化方案并促进落地等;

 

挖掘偏技术

 

自下而上的数据驱动以发现更优模式;

 

通常对接数据平台或者对算法依赖非常重的业务(比如风控);

 

title里通常带有关键字“开发”、“研发”、“算法”、“挖掘”、“工程”、“大数据”等;

 

能力上通常要求能使用大数据依赖的操作系统(Linux/shell等)、大数据软件(Spark/Hadoop/Storm等)、开发语言(C/C++/Java/Scala等)、机器学习框架(Tensorflow/Mahout等),然后就是要熟悉数据结构、算法(数学算法和计算机算法)。

 

最后,分享几点工作上的小Tips:

 

接数据需求时,一定先和业务方确定目的或者业务价值,不仅有助于理解业务方向,也能挡掉一部分不靠谱的需求(话说我曾经态度和善地接了很多这种需求,这种需求,只有苦劳,没有功劳);

 

懂业务是分析师值钱的点之一,和业务方保持紧密联系,听听他们的思路和见解,这是很好的学习机会。如果只是“被动”处理需求,而很少“主动”和业务方沟通,对业务的理解可能就没那么深,可以参考车品觉老师在《决战大数据》中提到的“混、通、晒”;

 

摆正自己的工作角色,提防“乙方心态”,不能想着搞完需求就完事了,和业务方的合作不是一次性买卖,站在他们的角度想问题不仅能理解业务方向,还能理解数据分析解决的问题以及带来的价值(以免怀疑自己是在打酱油);

 

要有一定的“翻译”能力,如何对一个指标下操作性定义(量化),如何把业务语言转化为技术语言(再转化成计算机代码),或者把数据分析结论转化为业务方听得懂、用得着的信息;

 

沟通能力很重要,包含但不限于口头表述、PPT演示、结构化表达等,一方面沟通的时间成本很高(超哥说,时间是人类唯一宝贵的资源),另一方面沟通能力是外显的职业能力(大家看得到),建议阅读《金字塔原理》;



 0
 0
 分享
评论图片
评论