Таблица нормального распределения, Объяснение

Т-критерий Стьюдента за 12 минут. Биостатистика. (Ноябрь 2024)

Т-критерий Стьюдента за 12 минут. Биостатистика. (Ноябрь 2024)
Таблица нормального распределения, Объяснение
Anonim

Формула нормального распределения основана на двух простых параметрах - среднем и стандартном отклонениях, которые определяют количественно характеристики данного набора данных. В то время как среднее означает «центральное» или среднее значение всего набора данных, стандартное отклонение указывает «разброс» или изменение точек данных вокруг этого среднего значения.

Рассмотрим следующие 2 набора данных:

Набор данных 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}

Набор данных 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Для набора данных 1, среднее значение = 10 и стандартное отклонение (stddev) = 0

Для Dataset2 среднее значение = 10 и стандартное отклонение (stddev) = 2. 83

Давайте нарисуем эти значения для DataSet1:

Аналогично для DataSet2:

Красная горизонтальная линия на обоих приведенных выше графиках указывает «среднее» или среднее значение каждого набора данных (в обоих случаях - 10). Розовые стрелки на втором графике показывают разброс или изменение значений данных из среднего значения. Это представлено стандартным значением отклонения 2. 83 в случае DataSet2. Поскольку DataSet1 имеет все значения одинаковые (по 10 каждый) и никаких изменений, значение stddev равно нулю, и, следовательно, не применяются розовые стрелки.

Значение stddev имеет несколько существенных и полезных характеристик, которые чрезвычайно полезны при анализе данных. Для нормального распределения значения данных симметрично распределены по обе стороны от среднего значения. Для любого нормально распределенного набора данных, график графика с stddev по горизонтальной оси и нет. значений данных по вертикальной оси, получается следующий график.

Свойства нормального распределения

  1. Нормальная кривая симметрична относительно среднего;
  2. Среднее значение находится в середине и делит область на две половины;
  3. Общая площадь под кривой равна 1 для среднего = 0 и stdev = 1;
  4. Распределение полностью описывается его средним значением и stddev

Как видно из приведенного выше графика, stddev представляет следующее:

  • 68. 3% значений данных находятся в пределах 1 стандартного отклонения от среднего (от -1 до +1)
  • 95. 4% значений данных находятся в пределах 2 стандартных отклонения от среднего (от -2 до +2)
  • 99. 7% значений данных находятся в пределах 3 стандартных отклонения от среднего (от -3 до +3)

Площадь под кривой колоколообразной кривой при измерении указывает на желаемую вероятность данного диапазон:

  • меньше, чем X: - e. г. вероятность значений данных меньше 70
  • больше X - e. г. вероятность значений данных больше 95
  • между X 1 и X 2 - e. г. вероятность значений данных между 65 и 85

, где X представляет интересную ценность (примеры ниже).

Построение и вычисление области не всегда удобно, так как разные наборы данных будут иметь разные значения среднего и stddev.Чтобы облегчить единый стандартный метод для простых вычислений и применимости к реальным проблемам, было введено стандартное преобразование в значения Z, которые составляют часть таблицы Normal Distribution Table .

Z = (X - среднее) / stddev, где X - случайная величина.

В основном это преобразование заставляет среднее и stddev стандартизоваться на 0 и 1 соответственно, что позволяет использовать стандартный набор Z-значений (из Normal Distribution Table ), который будет использоваться для легких вычислений , Захват стандартной таблицы значений z, содержащей значения вероятности, выглядит следующим образом:

z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

Найти вероятность, связанную с z-значением 0. 239865 , сначала округлите его до 2 знаков после запятой (т.е. 0. 24). Затем проверьте первые 2 значащие цифры (0. 2) в строках и наименьшую значащую цифру (остальное 0. 04) в столбце. Это приведет к значению 0. 09483.

Здесь можно найти полную нормальную таблицу распределения с точностью до 5 десятичных точек для значений вероятности (в том числе для отрицательных значений).

Давайте посмотрим примеры реальной жизни. Высота отдельных лиц в большой группе следует за нормальным распределением. Предположим, что у нас есть набор из 100 человек, высота которых записана, а среднее и stddev рассчитаны на 66 и 6 дюймов соответственно.

Вот несколько примеров вопросов, на которые можно легко ответить, используя таблицу z-value:

  • Какова вероятность того, что человек в группе составляет 70 дюймов или меньше?

Вопрос состоит в том, чтобы найти суммарное значение P (X <= 70) i. е. во всем наборе данных 100, сколько значений будет между 0 и 70.

Давайте сначала преобразуем X-значение 70 в эквивалентное Z-значение.

Z = (X - среднее) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (круглые до 2 десятичных знаков)

Теперь нам нужно найти P (Z <= 0. 67) = 0. 24857 (из таблицы z выше)

i. е. вероятность того, что индивидуум в группе будет меньше или равен 70 дюймов, составляет 24. 857%.

Но держись - вышеуказанное неполно.Помните, что мы ищем вероятность всех возможных высот до 70 i. е. от 0 до 70. Вышеуказанное просто дает вам часть от среднего значения к желаемому значению (например, от 66 до 70). Нам нужно включить другую половину - от 0 до 66 - чтобы получить правильный ответ.

Так как от 0 до 66 представляет половину части (т. Е. Одно крайнее среднее среднее значение), ее вероятность равна просто 0. 5.

Следовательно, правильная вероятность того, что человек составляет 70 дюймов или меньше = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%

Графически (путем вычисления площади), это две области суммирования, представляющие решение:

  • Какова вероятность того, что человек составляет 75 дюймов или выше?

я. е. Найти Дополнительной кумулятивный P (X> = 75).

Z = (X - среднее значение) / stddev = (75-66) / 6 = 9/6 = 1. 5

P (Z> = 1. 5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%

  • Какова вероятность того, что человек находится между 52 и 67 дюймами?

Найти P (52 <= x <= 67).

P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2. 33 <= z <= 0. 17)

= P (Z <= 0. 17) -p (Z <= -0. 233) = (0. 5 + 0. 56749) - (40905) =

Этот нормальный таблица распределения (и z-значения) обычно находит применение для любых вероятностных расчетов ожидаемых ценовых движений на фондовом рынке для акций и индексов. Они используются в торговле на основе диапазона, определяя уровни восходящего тренда или нисходящего тренда, поддержки или сопротивления и другие технические индикаторы, основанные на нормальных правилах распределения среднего и стандартного отклонения.