← К списку уроков
Статистика·Лёгкий·5 мин

Описательная статистика: среднее арифметическое

Когда среднее работает, когда обманывает.

Формула

$$\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$

Сумма всех значений / количество.

SQL

SELECT AVG(amount) FROM orders;

Python

df['amount'].mean()
import numpy as np
np.mean(values)

Когда среднее «работает»

  • Симметричное распределение (рост, IQ, температура)
  • Без сильных выбросов

Когда среднее «обманывает»

  • Доходы (один Билл Гейтс портит весь офис)
  • Время сессии (несколько форgot-laptop юзеров с 24h тянут среднее)
  • Скошенные данные → используй медиану

Совет

Всегда показывай mean + median в отчётах. Если они близки — распределение симметричное. Если сильно расходятся — есть выбросы, расследуй.