判断数据属于何种分布可以通过观察直方图、qq图、箱线图等图形以及计算偏度、峰度等统计量来完成。其中,偏度是描述数据分布对称性的指标,若数据分布对称则偏度值为0,若右侧尾部较长,则偏度值为正,若左侧尾部较长,则偏度值为负;峰度是描述数据分布尖峭程度的指标,若数据分布比正态分布更尖峭,则峰度值为正,若数据分布比正态分布更平缓,则峰度值为负。
例如,当数据分布呈现正态分布时,其直方图呈现钟形,qq图呈现一条直线,箱线图中各个部分大小大致相等,并且偏度和峰度值均接近于0。而当数据分布呈现偏态分布时,其偏度值为正或负,可通过直方图、qq图、箱线图等图形观察到数据分布的左右偏斜程度,例如右偏分布的直方图呈现左侧较短、右侧较长的不对称性。当数据分布呈现峰态分布时,其峰度值为正或负,可通过直方图、qq图、箱线图等图形观察到数据分布的尖峭或平缓程度。