Дисперсия
Дисперсия — это статистическая мера, которая описывает степень разброса или дисперсии числовых значений вокруг среднего (среднего арифметического) значения набора данных. Дисперсия показывает, насколько далеко в среднем различные значения отклоняются от среднего значения, что делает её важным показателем для оценки вариабельности или разброса данных.
Дисперсия используется для измерения разброса вариаций.
Пример 1: Дисперсия (Variance)
Ситуация: Оценка успеваемости студентов по математике в классе.
Данные: Оценки студентов: 80, 85, 90, 95, 100.
Расчёт дисперсии:
- Найдём среднее значение (среднюю оценку): (80 + 85 + 90 + 95 + 100) / 5 = 90.
- Найдём разницу между каждой оценкой и средним значением, а затем возведём эти разницы в квадрат:
- (80 — 90)^2 = 100
- (85 — 90)^2 = 25
- (90 — 90)^2 = 0
- (95 — 90)^2 = 25
- (100 — 90)^2 = 100
- Сложим эти квадраты и разделим на количество оценок:
- (100 + 25 + 0 + 25 + 100) / 5 = 50.
Дисперсия: 50.
Пример 2: Квартиль (Quartile)
Ситуация: Оценка распределения доходов в группе людей.
Данные: Доходы (в тыс. долл.): 20, 25, 30, 35, 40, 45, 50, 55, 60.
Расчёт квартилей:
- Отсортируем данные по возрастанию.
- Найдём медиану (второй квартиль, Q2): 40.
- Первый квартиль (Q1) — медиана первой половины данных: 30.
- Третий квартиль (Q3) — медиана второй половины данных: 50.
Квартильное разбиение: Q1 = 30, Q2 = 40, Q3 = 50.
Пример 3: CPK (Process Capability Index)
Ситуация: Оценка производственного процесса по созданию деталей.
Данные: Средний размер детали: 50 мм, верхний предел спецификации (USL): 52 мм, нижний предел спецификации (LSL): 48 мм, стандартное отклонение процесса (σ): 1 мм.
Расчёт CPK:
- (USL — Средний размер) / (3σ): (52 — 50) / (3 * 1) = 2 / 3 ≈ 0.67.
- (Средний размер — LSL) / (3σ): (50 — 48) / (3 * 1) = 2 / 3 ≈ 0.67.
CPK: Минимальное значение из двух рассчитанных: 0.67.
Пример 4: Мода (Mode)
Ситуация: Анализ наиболее популярных оценок студентов по математике в классе.
Данные: Оценки студентов: 80, 85, 90, 85, 100, 90, 90.
Поиск моды:
- Наиболее часто встречающееся значение: 90.