Статистика·Средний·6 мин
Нормальное распределение и правило 3 сигм
Колокол Гаусса. Почему он везде.
Форма
Симметричный «колокол». Параметры:
- μ (mu) — среднее = вершина колокола
- σ (sigma) — std dev = ширина
Правило 68-95-99.7
┌─68%─┐
┌──────95%──────┐
┌────────99.7%────────┐
─μ-3σ −2σ −σ μ +σ +2σ +3σ→
- 68% значений в μ ± σ
- 95% — в μ ± 2σ
- 99.7% — в μ ± 3σ
Где встречается
- Рост / вес людей
- Ошибки измерений
- Средние оценки (CLT — центральная предельная теорема)
Зачем знать
- Контроль качества — если деталь сильно за 3σ, это брак
- A/B-тесты — основа t-test предполагает нормальность
- Конфиденс-интервалы — стандартная формула
μ ± 1.96σ(95% CI)
Проверка нормальности
- Q-Q plot (scipy.stats.probplot) — если точки на прямой, данные нормальные
- Shapiro-Wilk test (scipy.stats.shapiro) — для маленьких выборок