Statistics-2-数据可视化

一、概念

频率

一个种类在一群中出现的次数。

相对频率

一个种类在一群中占有的比率,用小数点的形式表示。

百分比

把相对频率乘以100%,所得出的表示形式。

二、形式

2.1、表格

统计数据时,不可避免的会用到表格,表格可以更方便的计算各个分组的百分比,但是采用何种维度来整理,这就要看想要的信息或结论是什么。

如果想了解国家维度的学生人数和比例,就可以采取左边详细的形式;

如果想了解洲际维度的统计,则可采取简略统计的形式。

当需要整理一堆数据时,先不要在乎数据的表格行数,而应该先关注想得到什么信息和关注的维度,然后做出对应的表格。

2.2、直方图

图像亦可更清晰的展示数据的样子和各自的比例大小,更便于查看分组的分布。

  • 横轴,统计区间,也就是自变量,应该是数字,且可以量化
  • 竖轴,频率统计,也就是因变量

直方图的组距选择是关键,也就反映了想统计的维度

直方图分类

  • 正偏斜分布

    图像的大部分数据偏左分布。

  • 负偏斜分布

    图像的大部分数据偏右分布。

  • 正态分布

图形基本呈现左右对称的样子,图形呈现中间高,两头低的样子

2.3、柱状图

柱状图可以很清晰的展示几个类型的数量差别,但是不像直方图那样可以更改组距,柱状图只是把这些分组用柱形的高低来表示。

直方图的横轴是数据,不可更改前后顺序;

柱状图的横轴是地区或分类,且可更改前后顺序。

大爷给小弟的零花钱
显示 Gitment 评论