← К списку уроков
Статистика·Средний·6 мин

Нормальное распределение и правило 3 сигм

Колокол Гаусса. Почему он везде.

Форма

Симметричный «колокол». Параметры:

  • μ (mu) — среднее = вершина колокола
  • σ (sigma) — std dev = ширина

Правило 68-95-99.7

        ┌─68%─┐
       ┌──────95%──────┐
      ┌────────99.7%────────┐
─μ-3σ  −2σ  −σ   μ   +σ  +2σ  +3σ→
  • 68% значений в μ ± σ
  • 95% — в μ ± 2σ
  • 99.7% — в μ ± 3σ

Где встречается

  • Рост / вес людей
  • Ошибки измерений
  • Средние оценки (CLT — центральная предельная теорема)

Зачем знать

  1. Контроль качества — если деталь сильно за 3σ, это брак
  2. A/B-тесты — основа t-test предполагает нормальность
  3. Конфиденс-интервалы — стандартная формула μ ± 1.96σ (95% CI)

Проверка нормальности

  • Q-Q plot (scipy.stats.probplot) — если точки на прямой, данные нормальные
  • Shapiro-Wilk test (scipy.stats.shapiro) — для маленьких выборок