Статистика·Лёгкий·5 мин
Описательная статистика: среднее арифметическое
Когда среднее работает, когда обманывает.
Формула
$$\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$
Сумма всех значений / количество.
SQL
SELECT AVG(amount) FROM orders;
Python
df['amount'].mean()
import numpy as np
np.mean(values)
Когда среднее «работает»
- Симметричное распределение (рост, IQ, температура)
- Без сильных выбросов
Когда среднее «обманывает»
- Доходы (один Билл Гейтс портит весь офис)
- Время сессии (несколько форgot-laptop юзеров с 24h тянут среднее)
- Скошенные данные → используй медиану
Совет
Всегда показывай mean + median в отчётах. Если они близки — распределение симметричное. Если сильно расходятся — есть выбросы, расследуй.