Дисперсия

Дисперсия — это статистическая мера, которая описывает степень разброса или дисперсии числовых значений вокруг среднего (среднего арифметического) значения набора данных. Дисперсия показывает, насколько далеко в среднем различные значения отклоняются от среднего значения, что делает её важным показателем для оценки вариабельности или разброса данных.

Дисперсия используется для измерения разброса вариаций.

Пример 1: Дисперсия (Variance)

Ситуация: Оценка успеваемости студентов по математике в классе.

Данные: Оценки студентов: 80, 85, 90, 95, 100.

Расчёт дисперсии:

  1. Найдём среднее значение (среднюю оценку): (80 + 85 + 90 + 95 + 100) / 5 = 90.
  2. Найдём разницу между каждой оценкой и средним значением, а затем возведём эти разницы в квадрат:
    • (80 — 90)^2 = 100
    • (85 — 90)^2 = 25
    • (90 — 90)^2 = 0
    • (95 — 90)^2 = 25
    • (100 — 90)^2 = 100
  3. Сложим эти квадраты и разделим на количество оценок:
    • (100 + 25 + 0 + 25 + 100) / 5 = 50.

Дисперсия: 50.

Пример 2: Квартиль (Quartile)

Ситуация: Оценка распределения доходов в группе людей.

Данные: Доходы (в тыс. долл.): 20, 25, 30, 35, 40, 45, 50, 55, 60.

Расчёт квартилей:

  1. Отсортируем данные по возрастанию.
  2. Найдём медиану (второй квартиль, Q2): 40.
  3. Первый квартиль (Q1) — медиана первой половины данных: 30.
  4. Третий квартиль (Q3) — медиана второй половины данных: 50.

Квартильное разбиение: Q1 = 30, Q2 = 40, Q3 = 50.

Пример 3: CPK (Process Capability Index)

Ситуация: Оценка производственного процесса по созданию деталей.

Данные: Средний размер детали: 50 мм, верхний предел спецификации (USL): 52 мм, нижний предел спецификации (LSL): 48 мм, стандартное отклонение процесса (σ): 1 мм.

Расчёт CPK:

  1. (USL — Средний размер) / (3σ): (52 — 50) / (3 * 1) = 2 / 3 ≈ 0.67.
  2. (Средний размер — LSL) / (3σ): (50 — 48) / (3 * 1) = 2 / 3 ≈ 0.67.

CPK: Минимальное значение из двух рассчитанных: 0.67.

Пример 4: Мода (Mode)

Ситуация: Анализ наиболее популярных оценок студентов по математике в классе.

Данные: Оценки студентов: 80, 85, 90, 85, 100, 90, 90.

Поиск моды:

  • Наиболее часто встречающееся значение: 90.
<