编辑:[db:作者] 时间:2024-08-25 06:09:29
我竟一时语塞,不是由于不知做了什么事;而是由于我们彷佛做了各种各样的事(掩护指标体系、做专题剖析、建数据表、培植数据产品、等等不一而足),但却很难大略明了的见告我妈“我在做什么?有什么代价?”。顿时觉得有点沮丧,由于“一件事情如果我没办法跟我妈讲清楚,解释我自己没有思考清楚。
”。“‘数据岗的职能是什么(做什么事情)?(对公司)贡献了什么样的代价?’是一件非常主要的母题”我说时来不及思虑,但思虑之后,还是这样说。
由于一旦思考清楚这个母题,对个人而言,就可以回答个人发展与职业方案的问题;对组织而言,就可以回答能力发展与组织培植的问题。为什么这么说?
图1:个人与组织待解的问题
由于事情的最小单元是一个个的任务。相似的任务聚合在一起,形成了职能;干系的职能组合起来形成了岗位。干系的岗位组合在一起,形成了部门;所有的部门组合在一起,构成了组织。
图2:知识技能、职能岗位、部门组织之间的关系
而对个人而言,待完成的任务,决定了所需的知识技能;以是弄清楚数据岗的职能,以及自己想要履行的职能,就可以明白自己要节制哪些知识与技能。即,办理了个人发展的问题。从承担单一职能,到承担多个职能(职责扩大化),到职能丰富化,进而到承担紧张的协作职能(管理职能),便是职业方案与职业发展的一种路径图。
而对组织而言,明确哪些是需履行而目前未履行好的数据职能,就能明确能力发展的方向;对职能的重组和对岗位的重组,使得整体的事情更加顺滑、高效,便是一定程度上的组织培植。
PS:这里以职能为紧张的颗粒度,是由于:不同的组织由于实际状况的不同,对付相同名称的岗位,会设计不同的岗位职能。
“数据剖析岗”在目前阶段便是一个非常范例的例子,在有些组织,这个岗位会归属与独立的数据部门,而有些组织内它会归属于业务部门(产品/营销/研发/等等)。在有的组织内部,对产品、运营等等岗位有不低的数据能力哀求;而在有些组织内,则并非如此。这些征象的实质是不同的岗位设计,不同的职能组合。
这也是为什么,有的同学说,在他们公司,数据剖析师从不跑SQL;有的同学说,数据剖析师要懂数据产品设计;有的同学说,数据剖析师要熟习各种算法;等等。这些同学说的都对,都是实际情形;但这不虞味着数据剖析师什么都要会,什么都要懂,什么都要做。
一、核心职能:数据岗位的核心职能是什么?谈到数据岗的事情有哪些,大家的脑海里肯定会浮现出特殊多的词:ETL、取数、做报表、专题剖析、指标体系。绩效管理,不一而足…… 但是究竟什么才是数据岗的核心职能?如何通过一句话总结性地见告父母,我们在做什么事情呢?
图3:数据岗的事情事变
好好认为,数据岗的核心职能有两个:① 产出数据资产;② 提升信息的代价密度。
数据资产:所谓数据资产,是个人/企业所掌握的,预期会带来未来经济利益的数据资源。这种资源可以是以物理形式存储,例如文档资料;也可以是以电子的办法记录,例如电子文件。代价密度:所谓代价密度,是指一个数据集预期可带来的经济收益,与其数据量的比值。这里的数据集,可以是51字节的一句商业判断,也可以是3M的数据剖析报告,也可能是PB/EP级别的数据库。我们不妨一起来考验一下这个定义:
图4:范例数据事情的职能归属
“千举万变,其道一也。”——《荀子》
现在,我们弄清楚了数据岗的两个核心职能。那么这两个核心职能对付组织(企业)而言,有什么样的代价呢?
给大家分享一些最近整理的数据剖析资料,全部打包好了,直接领。二、生产关系:数据职能对付组织而言贡献了什么代价?
两个核心职能,对应了组织的两个核心能力:
“产出数据资产”是一个量化业务的过程,对应着组织“业务数据化”的能力。“提升信息的代价密度”是一个驱动业务的过程,对应着组织“数据业务化”的能力。简而言之,数据职能在组织中贡献的代价便是:量化业务与驱动业务。
图5:数据职能的代价
这么说轻微有点抽象,这里以问答社区(知乎)为例,简要解释一下“业务数据化”与“数据业务化”的含义。
大家可以轻微回顾一下:当我们在访问问答社区(刷知乎)时,都会产生哪些行为?
大略列举一下,例如:阅读、播放、点击、滑动、跳转、点赞(双击屏幕即刻体验)等等。这些用户的行为,都可以归属为知乎运营业务中的一部分。
而知乎记录这些“用户行为”的过程便是一种“业务的数据化”。但如果仅仅是用一个又一个的分区,记录这些行为日志,只是产生了数据,而没有产生代价。
当知乎加工、剖析、利用这些数据进行产品设计,对用户进行信息推送时,就完成了一个“数据业务化”的过程。
图6:“业务数据化”与“数据业务化”案例示意
在上述的例子中,相较于数据业务化,业务数据化彷佛是一个相较而言比较大略的能力,涉及的紧张事情事变便是数据埋点和落库。
但实际上“业务数据化”并不大略。仅仅是一个页面的PV的统计,就要考虑、是否弹窗、用户是否切换Tab、是否最小化窗口,等等实际操作场景;终极,可能要经由永劫光的多次迭代,才能得到一个较好的埋点标准。
通过“业务数据化”和“数据业务化”,组织可以建立起一个正向的闭环数据流。在这个正循环的过程中,数据越用越多、越用越好。
图7:闭环数据流
三、知识技能:各岗位有哪些数据类事情,须要哪些知识技能?在明确了数据职能在组织中的代价之后,我们末了来回答关于个人职业发展的问题:数据剖析如何入门?数据岗须要储备哪些知识与技能?如何发展?我们常说,有些事是我们善于的,有些事是我们热爱的,有些事是这个天下所须要的。而我们职业发展的目标便是找到这三者的交集。
图8:职业发展的目标
以是:
首先我们要弄清楚组织须要各个岗位做什么事情。在理解事情内容之后,我们就可以对自己是否感兴趣做一个初步的判断。当然很多时候,还须要通过考试测验的办法,去探索自己的兴趣。然后,我们根据事情的内容来补充自己的知识与技能,逐步从入门到精通。1
数据岗位的事情内容
前文提到, 公司的目标是通过“业务数据化”与“数据业务化”建立起一个正向的、闭环的数据流。而数据岗的事情内容,抽象而言,便是支撑起全体数据流运转;详细而言可以分为:生产数据、处理数据和消费数据三大模块。
下图大略示意了,不同岗位在数据流中所处的位置:
图9:不同岗位在数据流中所处的位置
PS:以上仅为示意,不同企业可根据实际状况进行调度。
由于很多同学,对数据剖析师的事情非常感兴趣。这里以阿里集团为例,大略先容一下中台数据剖析师日常的事情内容。
在阿里巴巴,中台数据剖析师的日常事情中,紧张的交付物有6类:
开拓新的数据源产出表资产沉淀剖析方法论搭建与掩护指标体系培植与掩护数据产品输出商业洞察图10:数据剖析师日常事情中的紧张交付物
开拓新的数据源:例如,信息爬取、竞对剖析等。产出表资产:例如,在DWD(明细数据层)的根本上,建立DWM(数据中间层)和DWS(数据做事层)的数据表。沉淀剖析方法论:例如,指标拆解、非常监控、因果推断等。搭建与掩护指标体系:例如,指标设计、指标体系培植等。培植与掩护数据产品:例如,指标管理系统、数据报表、数据看板、剖析引擎等。关于“临时取数需求”,好好将其归属与“数据产品”这一个事情分类下。这是由于:找剖析师跑SQL取数的根本缘故原由,在于数据产品没有培植好,或是没有建立起良性的互助机制。进而导致了各方须要“绕道”数据剖析师这个“产品”来取数。
输出商业洞察:如剖析报告等。这里再大略先容下其他岗位的事情:
○ 数仓工程师的紧张事情包括生产与加工数据。
生产数据:比如埋点设计,将业务事实转化为数据落表等。加工数据:比如数据管理,通过ETL的流程,担保数据的质量。或是数据架构设计,使得数据的存储、加工、调用等有保障的同时,掌握本钱与风险等。○ 算法工程师的紧张事情包括加工和消费数据。
加工数据:比如用户打标,通过算法对用户原始的数据信息进行加工,进而给用户打上标签,描述TA现在可能的状态,或是未来可能发生的行为。消费数据:比如算法推举,基于用户的历史数据,给出推举。或是时序预测,对未来的业务状况进行预测,进而作为决策的依据。○ 用户研究岗的事情内容涉及莅临盆和消费数据。
生产数据:比如调研问卷、焦点访谈等。消费数据:比如消费者洞察报告、UI设计建议等。其他岗位,好好在此就不一一列举解释了,由于不同的公司,对相同岗位也会有不同的职能安排。以上先容也仅为抛砖引玉,还望有不同意见的同学,不吝见教。但方法是可以复用的。当你在开展事情时,可以剖析一下,你所在的公司的数据流情形,以及不同的岗位,在全体数据流中承担的职责与贡献的代价。
希望以上的先容,能让大家对数据岗的日常事情有一个简要的理解。
2
数据岗所需的知识与技能
就事情内容而言,这中台数据剖析师的事情既涉及到“业务数据化”(开拓数据源、表资产),也涉及“数据业务化”(指标体系、剖析方法论、数据产品、商业洞察)。以是说,所需的知识与技能是比较广域的。根据这6类事情内容,我们来逐一梳理一下数据剖析岗所需的专业知识与技能:
通用的职业技能,如沟通办法与方法、韶光管理、预期管理等,好好在此不多赘述。
开拓新的数据源
知识方面:学习搜索技能、积累公开数据源的路径、节制竞对剖析的方法论。如有余力,可以学习一些用户研究干系的知识,如调研问卷设计、访谈设计等。技能方面:如有余力,节制一些初步的爬虫技能;至少知道什么信息可以通过网页爬取的办法得到。产出表资产
知识方面:学习根本的数据库干系知识。有志于更深入理解数据资产管理的同学,可以《数据中台》 与《大数据之路》为切入点。技能方面:节制SQL。在有根本编程与数据库知识打底的情形下,可以直接通过牛客的SQL题库边练边学。搜索引擎是一位很好的老师,何况事情之后也大多数时候是面向Google编程。如果暂时还没有根本的编程知识,可以考虑通过北京理工大学,嵩天教授的《Python措辞程序设计》入门。学习曲线非常适中。
沉淀剖析方法论
知识方面:须要有一些数学/统计学的根本知识,并且节制一些通用的逻辑思维方法,如金字塔事理等。如有余力的,可以学习一些算法模型干系的知识,如回归、分类、聚类等。技能方面:节制一些处理数据的工具,如Excel、Python等。搭建指标体系
可参考之前的推文《终于有人把怎么搭建数据指标体系给讲明白了》。当然最主要的,依旧是理解业务。那么怎么理解“理解业务”这件事呢?
好好也没有想到一个非常好的形式上的定义。这里好好给一个举例式的定义:如果你是一个保险从业者,最基本的哀求是知道“一张保单是如何流转的”。如果你是一个电商从业者,最基本的哀求是知道“消费者从上岸到交易完成的全体链路是怎么样的”。
沉淀数据产品
知识方面:节制一定的数据可视化干系的知识,在此推举电子工业出版社出版的《数据可视化》。对付数据管理干系的知识,可以参照上文提到的《数据中台》 与《大数据之路》;如要更加深入的参与数仓培植,可参阅Kimball的《数据仓库工具箱》技能方面:节制至少一样BI看板设计工具,如FineBI等。如有余力可以学习一些产品设计事理,如尼尔森十大可用性原则等。输出商业洞察
知识方面:可参照《「经营剖析报告」怎么做?》。技能方面:节制一些基本的PPT制作方法,即担保一定的都雅性、又提升事情的效率,最主要的是担保信息通报的有效性与高效性。当然,在实际事情中,直接套用模板是非常省事的。文末分享PPT模板,记得领取哦!转载/好好的数据剖析师
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/xyj/150725.html
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com