文 | 帆软数据应用研究院 李向川
大数据分析和数据分析是有区别和联系的。这里重点关注两者的是技术要求、使用场景、业务范围等方面的区别和联系。重点要区分理论研究和实际应用两方面区别和联系。
什么是数据分析?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,为提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 数据分析包含“数据”和“分析”两个方面一方面包括收集、加工和整理数据,另一方面也包括分析数据,从中提取有价值的信息并形成对业务有帮助的结论。 数据分析的成果通常以分析报告的形式呈现。对于数据分析报告,分析就是论点,数据就是论据,两者缺一不可。
传统数据分析与大数据分析的三方面异同:第一,在分析方法上,两者并没有本质不同。 数据分析的核心工作是人对数据指标的分析、思考和解读,人脑所能承载的数据量是极其有限的。所以,无论是“传统数据分析”,还是“大数据分析”,均需要将原始数据按照分析思路进行统计处理,得到概要性的统计结果供人分析。两者在这个过程中是类似的,区别只是原始数据量大小所导致处理方式的不同。
第二,在对统计学知识的使用重心上,两者存在较大的不同。 “传统数据分析”使用的知识主要围绕“能否通过少量的抽样数据来推测真实世界”的主题展开。“大数据分析”主要是利用各种类型的全量数据(不是抽样数据),设计统计方案,得到兼具细致和置信的统计结论。
第三,与机器学习模型的关系上,两者有着本质差别。 “传统数据分析”在大部分时候,知识将机器学习模型当黑盒工具来辅助分析数据。而“大数据分析”,更多时候是两者的紧密结合,大数据分析产出的不仅是一份分析效果测评,后续基于此来升级产品。在大数据分析的场景中,数据分析往往是数据加墨的前奏,数据建模是数据分析的成果。
参考文献 [1] 毕然, 袁晓洁. 大数据分析的道与术[M]. 电子工业出版社, 2016.
|