描述性分析就是用少数几个数值(比如平均值、中位数等)描述一系列复杂数据所表达的信息,比如描述数据的整体分布情况、波动情况、数据异常情况。
对一个数据集来说,Excel和Python都有简单的方法显示数据的基本信息。以鸢尾花数据集为例。
1、Excel
1.1在“数据”选项卡下,选择“数据分析模块”。
有的电脑或office版本并不直接显示Excel"数据分析模块",我们可以通过以下步骤加载激活该模块:
- 单击“文件”选项卡,单击“选项”,然后单击“加载项”类别。
- 在“管理”框中,选择“Excel 加载项”,再单击“转到”。
- 在“加载宏”框中,选中“分析工具库”复选框,然后单击“确定”
1.2 选择“描述统计”
1.3结果输出
可以看出,输出数据基本的统计指标。
2、Python
在Python中也可以轻松得到这样的结果
3、FineBI
FineBI中有多种方法查看数据统计信息
3.1 在FineBI中导入数据集,直接点击字段,预览下方会自动出现校验数据。
其中数值字段,显示该列“求和”、“平均”数值,文本/日期字段,显示该列“去重计数”数值。
3.2 想得到Excel和Python类似的结果,选择数值型特征,使用“列转行”
修改字段名称。
3.3 分组汇总,按“特征”分组,把“特征值”拖到汇总栏,分别修改为“求和”、“中位数”等。
4、总结
描述性数据分析主要获得各个指标的统计信息, 以找出这些数据的内在规律。
|