统计函数在数据分析和科学计算中非常重要,Python 的 statistics 模块提供了一些常用的统计函数,用于计算数据集的中心趋势、散布度和相关性等。以下是一些常用的 statistics 模块函数及其解释、数学公式以及代码示例:
继续阅读标签归档:statistics
总体方差,总体标准差,样本方差,样本标准差
下面是总体方差、总体标准差、样本方差和样本标准差的计算方法及示例。
总体方差和总体标准差
总体方差
总体方差(Population Variance)是所有数据点与总体均值之间差值的平方的平均值。公式如下:
\( \sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i – \mu)^2 \)
总体标准差
总体标准差(Population Standard Deviation)是总体方差的平方根。公式如下:
\( \sigma = \sqrt{\sigma^2} \)
样本方差和样本标准差
样本方差
样本方差(Sample Variance)是所有样本数据点与样本均值之间差值的平方的平均值,但为了校正估计的偏差,分母用 (n-1) 而不是 (n)。公式如下:
\( s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i – \bar{x})^2 \)
样本标准差
样本标准差(Sample Standard Deviation)是样本方差的平方根。公式如下:
\( s = \sqrt{s^2} \)
示例
假设有一组数据:[ [2, 4, 4, 4, 5, 5, 7, 9] ]
- 计算总体均值:\( \mu = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5 \)
- 计算总体方差:
\(
\sigma^2 = \frac{(2-5)^2 + (4-5)^2 + (4-5)^2 + (4-5)^2 + (5-5)^2 + (5-5)^2 + (7-5)^2 + (9-5)^2}{8}
\)
\(
\sigma^2 = \frac{(-3)^2 + (-1)^2 + (-1)^2 + (-1)^2 + 0^2 + 0^2 + 2^2 + 4^2}{8}
\)
\(
\sigma^2 = \frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8} = \frac{32}{8} = 4
\) - 计算总体标准差:
\(
\sigma = \sqrt{4} = 2
\) - 计算样本均值:样本均值和总体均值相同,仍然是5。
- 计算样本方差:
\(
s^2 = \frac{(2-5)^2 + (4-5)^2 + (4-5)^2 + (4-5)^2 + (5-5)^2 + (5-5)^2 + (7-5)^2 + (9-5)^2}{7}
\)
\(
s^2 = \frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{7} = \frac{32}{7} \approx 4.57
\) - 计算样本标准差:
\(
s = \sqrt{4.57} \approx 2.14
\)
综上所述,对于数据 [ [2, 4, 4, 4, 5, 5, 7, 9] ],我们有:
- 总体方差:4
- 总体标准差:2
- 样本方差:4.57
- 样本标准差:2.14
代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
import statistics # 数据集 data = [2, 4, 4, 4, 5, 5, 7, 9] # 计算样本均值 mean = statistics.mean(data) print("样本均值:", mean) # 计算样本方差 sample_variance = statistics.variance(data) print("样本方差:", sample_variance) # 计算样本标准差 sample_std_dev = statistics.stdev(data) print("样本标准差:", sample_std_dev) # 计算总体方差 population_variance = statistics.pvariance(data) print("总体方差:", population_variance) # 计算总体标准差 population_std_dev = statistics.pstdev(data) print("总体标准差:", population_std_dev) |
运行上述代码将得到以下输出:
1 2 3 4 5 |
样本均值: 5 样本方差: 4.571428571428571 样本标准差: 2.138089935299395 总体方差: 4.0 总体标准差: 2.0 |