对于每一个数据分析师来说,业务实践数据的分析都是重中之重,这已经大家默认的共识了。但是,怎样将业务实践带入到数据分析中呢?这个问题却没有得到大多数人的共识。 其中,
对于每一个数据分析师来说,业务实践数据的分析都是重中之重,这已经大家默认的共识了。但是,怎样将业务实践带入到数据分析中呢?这个问题却没有得到大多数人的共识。
其中,有一种看法是说,参加数据建模比赛可以实现数据业务化。当然,参加数据建模比赛,是很多数据爱好者共同追捧的赛事。其中,比赛时会给到参赛者很多真实的业务数据,能在很大程度上,帮助数据分析师们提升自身的数据分析技能。
然而,这并不是数据业务化处理模式。下面,就来为大家简单介绍一下数据业务化的定义及建模等内容。
数据业务化
所谓的数据业务化,就是在实际业务环境中,给已有数据赋值,从而提升产品的商业价值。简单来说,就是通过已有的运营数据,找出数据中的规律,总结出改进方向,从而指导产品的销售、包装等各个方面的策略,从而提升产品的商业价值。
这里所谓的找出数据中的规律,总结改进方向,可以从两个层面来理解:一是数据智能化,二是数据创新化。前者主要利用大数据技术,持续提升产品的用户体验,如推荐系统、信用评级等。而后者主要在于有效积累数据,用于新业务的开展。
从这个角度看,数据业务化至少包括3个关键环节,包括数据业务定义、数据分析与建模、数据业务实施。
(1)数据业务的定义
在现实生活中,数据可能不是大家主要关注的对象,大家真正关心的其实是业务。因为,只有业务满足了公司的基础需求,企业才能存活。
然而,不可忽视的一点是,只要有业务产生,就会有与之匹配的各类数据产生。如果不分析这些产生的数据,只埋头做业务,在体量较小的情况下,是能维持正常的业绩的。但若一个企业寻求发展,那么,势必需要数据分析。因为,人的经验很多情况下是不准确的。因此,数据分析是助力企业核心业务发展的重要因素。
在这个前提下,一个数据分析师到一家新的企业后,很少有人能告诉你该分析什么数据,更不会有人告诉你如何从企业老旧的数据系统中得到有用的数据。因为,他们只会告诉你他们关心什么业务,希望提升多少业务指标。
由此,你也能得出一个结论,那就是你需要把业务问题定义为数据可分析问题。
(2)数据分析与建模问题
先来给大家分享一个小故事,然后我们再来进入主题。
例:一个做外卖的平台的朋友,提出这样一个问题:他们一个客户非常认可他们的数据价值,希望通过外卖平台的数据,帮助店铺提升餐品的好评率,从而促进成单率。
这就是一个很典型的业务问题了。但是,这个问题怎么用数据分析的方式来处理呢?
首先我们要做的,就是将它通过数据对业务需求进行清晰定义。比如,餐品原来的好评率是80%,将它提升至90%,这样就会好处理很多。
可事实上,我们要得出80%这个结论,其实是很难的。因为,一个餐品的品质怎么叫“好”,怎么叫“坏”?因此,我们需要一个清晰定义的标准,并为之得出一个业务认可的因变量Y。
然而,无论你如何定义Y,都不可避免地会介入主观认知。因此,在这类复杂业务场景中,是没有唯一正确答案,即便是任何数据建模比赛,也无法模拟出结论。
那么,在这种情况下,难道我们就真的无法做出数据分析了吗?
事实上,并不是这样的。一旦业务问题被定义为数据可分析问题,它的核心业务诉求就会变得清晰,就可以构成了因变量Y。此外,相关的业务知识被头脑风暴,就构成了解释性变量X。从Y、X出发,我们可以通过各种回归分析模型、机器学习模型来做对应的分析。
各类回归模型,或其他机器学习中的算法模型甄选出合适的数据分析模型,从而拟出适用于前业务需求的精准化模型,为业务数据智能化提供更好的有效预测。
(3)数据业务实施
在数据分析和建模流程处理完成后,接下来,我们就要把这些结论转化成现实环境下可以被实施的产品中。然而,这一步是比较困难的。在现实的业务场景中,即使模型做得很好,但是最后如何同业务结合,变成可执行的产品,仍然是极具挑战的事情。
因为,这里面涉及了很多企业资源、法律法规、政策制度、生活传统等问题。
例:国外的很多搬运工人都是按照既定的量给货车装卸货物的。即,企业核算了任务量和交货日期后,就会计算每个工人每天的工作量(件数)等,按照当地的劳动标准,给工人任务量。因此,工人基本不会提早完成任务。
而在国内,我们更习惯“早点做完早点休息”,因此,很少有企业会告诉工人每天的工作数量,也不会因为工人提前完成任务而少付工资。
由此,我们不难看出,这里面主要困难就是数据业务的合理实施。所以,前面我们说,这么复杂的事情,不是任何数据建模比赛可以模拟的。
归纳总结
简单总结一下,数据业务化的核心是让数据产生价值。为此,需要三个环节:
1)将业务问题定义为数据可分析问题;
2)对数据可分析问题做分析建模;
3)对最后的分析结果和模型进行业务实施。
另外,参加数据建模比赛能够对2)提供很大的帮助;但是对1)和3)帮助甚微。而最具挑战、最有价值的,恰恰是1)和3)。
(责任编辑:中博IT教育)