很多做数据的,常常会被业务尴尬的问到:“分析结果我们看到了,但这个结果想要告诉我们什么”?这个问题也可以理解为,你做的报表做的报告,“如何具备对分析结果的洞察能力”?
洞察Insight,通俗的理解就是,企业从自身的业务逻辑去解读数据现象的能力。同样一份数据,具备不同业务经验的人解读起来得到的结论也各有不同。当分析结果被人诟病没有Insight时,往往表达的是以下几个意思:
1、分析结果与我们的业务有什么关系吗?
2、分析结果我们是看到了,但是导致这个结果的原因是什么呢?
3、看来我们的业务的确出现了问题,可我们应该怎么改进呢?
4、为什么分析结果与我业务经验得到的结果不一致?
5、分析结果会对我未来的计划造成哪些影响呢?
当数据技术人员,比如数据科学家面对这些质疑的时候,往往第一反应会想,如何基于基于更大的数据做复杂分析、或再用R建立一个新的模型、又或者需要做一些“教师”信号来训练深度网络……但通常都是工程狮的角度,从业务角度出发思考问题?不存在的。
如此,巨大的沟通鸿沟出现在业务需求者与数据科学家中间,我代表人类说 Insight,而你代表计算机说 Deep Learning 。
要消除这道鸿沟,让数据产生洞察,需要建立一种业务人员与计算机都可以理解的知识体系:
1、用“业务的语言”去解释数据
数据分析应用的核心基础在于,业务的数据化和数据的业务化,通俗来讲,就是把销售,市场,售后等商业过程中的数据记录下来,再对这些数据用业务的语言进行解释,让业务决策人员可以理解,业务流程可以应用起来。我们常说的用户画像,就是一种对用户行为数据的业务语言解释。例如,在营销场景中,用户浏览了某产品三次,意味着该用户对该产品的购买倾向增加。
而业务部门不同,对于同数据的描述方法也不尽相同。例如,“安装师傅挺好的,只是这个声音堪比鼓风机啊,只能说一等价钱一等货吧!麻烦配送人员了!”。这样一条评论,对于售后部门,就是一条正面评价,而对于产品设计部门,就是一条负面评价,且负面内容具体描述的是产品性能上的噪音问题。
因此同一条评论、用户行为等过程数据,通常需要打上多种标签,同时要把标签之间的语义关系表达出来,这样的方式近似人类语言中的概念与知识体系。学术界称之为“知识图谱”。
2、发现数据中的特征作为新的知识
简单的统计方法,发现的仅仅只是浅显的客观事实,但对于企业的业务决策优化,无法提供结论或建议。例如,把人口统计学分析与微博数据结合起来,证明某个品牌的女性用户占比大大超过男性,建议采用一些受女性欢迎的KOL作为传播自媒体。但女性比例并不是该品牌的特征,而是所有这个行业的共性。
再例如,某主题公园对用户口碑的分析,二月份负面评价比例持平,并没有引起足够重视。但如果对负面评价深入分类,就会发现二月份餐饮的负面批评与过去的六个月对比,呈显著上升。因此二月份的负面评价特征与餐饮直接形成了相关性对应。从而得到了春节期间,餐饮部门管理不善的结论。
因此,不仅仅是简单的统计,而是通过一些“特征抽取”算法,找到两个现象之间的相关性、相似性、因果性等特征,才能让业务人员得到新的知识。
3、从问题出发,去探索答案
有经验但不懂业务需求的分析师,往往喜欢把记忆中的分析维度与当前可以获得的数据结合起来,来验证一些业务假设或者既定的猜想。
分析中常见的人口统计学、转化率、关键词云等分析维度,分析师采用的是“验证式”的分析方法,而业务人员的思考模式更近似于“探索式分析”,想要知道分析结果背后的诱因或会有多少关联因素会受其影响,从问题出发,去找到答案。
例如,通过监测,数据提示竞争对手上市了新款,并且销售与好评最近3天表现一直在上升,从这个数据出发,我们可以探索,该款产品的设计要素与价格,直接与企业的那些品牌产生竞争,同期内,我们的策略与口碑表现对比如何?竞争对手的这个产品,好评在哪些方面,是哪些产品要素导致了这些好的口碑?是否值得我们跟进?
这种探索分析的方式,利用了数据挖掘的手段,更加符合人类的思考与推理方法,更容易得到有效的、可行动的结论。
4、让数据分析过程透明化
无论是分析人员、还是业务决策人员,人们总是更加倾向于自身经验的判断,如果整个数据的流程是一个黑盒子,必然无法对分析的结果进行解释,也就降低了数据分析的可信力。因此需要让整个分析过程透明化,可以追溯并可以反馈。
5、让数据管理人员,分析人员与业务人员在同一个体系下协同工作
数据决策过程需要多种背景,多种角色的人员参与,程序猿、分析狗与营销喵,分别负责处理数据、生成分析报告,产生业务决策三种不同的任务。处于不同的工作环境,甚至不在一家公司。通过一个在线的协同系统将三者置于同一套界面、语言和流程下,不仅仅有利于大家更加具象的进行交流,减少信息漏斗,提高沟通效率。也有利于业务知识的传递与沉淀,企业不会因为某个人的变动而造成业务的停滞,业务知识才是企业真正的商业壁垒。