Статистика·Лёгкий·5 мин
Меры разброса: размах и IQR
Насколько данные «разбросаны». Зачем не только среднее.
Размах (Range)
Range = Max - Min
Самый простой показатель разброса. Но чувствителен к выбросам.
Зарплаты [180, 200, 220, 250, 5000] → range = 4820. Огромный, но из-за одного директора.
IQR (Interquartile Range)
Q3 − Q1, где:
- Q1 — 25-й перцентиль (нижняя четверть)
- Q3 — 75-й перцентиль (верхняя четверть)
IQR показывает разброс средних 50% данных. Игнорирует выбросы.
q1, q3 = df['salary'].quantile([0.25, 0.75])
iqr = q3 - q1
Boxplot — визуализация IQR
|---[Q1==[Median]==Q3]---| ← квартили + усы
⊙ ← выбросы (>1.5 * IQR от Q3)
Когда что использовать
- Range — для quick-check
- IQR — стандартный метод устойчивый к выбросам
- Std dev (следующий урок) — для статистических тестов