Формула нормального распределения основана на двух простых параметрах - среднем и стандартном отклонениях, которые определяют количественно характеристики данного набора данных. В то время как среднее означает «центральное» или среднее значение всего набора данных, стандартное отклонение указывает «разброс» или изменение точек данных вокруг этого среднего значения.
Рассмотрим следующие 2 набора данных:
Набор данных 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Набор данных 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Для набора данных 1, среднее значение = 10 и стандартное отклонение (stddev) = 0
Для Dataset2 среднее значение = 10 и стандартное отклонение (stddev) = 2. 83
Давайте нарисуем эти значения для DataSet1:
Аналогично для DataSet2:
Красная горизонтальная линия на обоих приведенных выше графиках указывает «среднее» или среднее значение каждого набора данных (в обоих случаях - 10). Розовые стрелки на втором графике показывают разброс или изменение значений данных из среднего значения. Это представлено стандартным значением отклонения 2. 83 в случае DataSet2. Поскольку DataSet1 имеет все значения одинаковые (по 10 каждый) и никаких изменений, значение stddev равно нулю, и, следовательно, не применяются розовые стрелки.
Значение stddev имеет несколько существенных и полезных характеристик, которые чрезвычайно полезны при анализе данных. Для нормального распределения значения данных симметрично распределены по обе стороны от среднего значения. Для любого нормально распределенного набора данных, график графика с stddev по горизонтальной оси и нет. значений данных по вертикальной оси, получается следующий график.
Свойства нормального распределения
- Нормальная кривая симметрична относительно среднего;
- Среднее значение находится в середине и делит область на две половины;
- Общая площадь под кривой равна 1 для среднего = 0 и stdev = 1;
- Распределение полностью описывается его средним значением и stddev
Как видно из приведенного выше графика, stddev представляет следующее:
- 68. 3% значений данных находятся в пределах 1 стандартного отклонения от среднего (от -1 до +1)
- 95. 4% значений данных находятся в пределах 2 стандартных отклонения от среднего (от -2 до +2)
- 99. 7% значений данных находятся в пределах 3 стандартных отклонения от среднего (от -3 до +3)
Площадь под кривой колоколообразной кривой при измерении указывает на желаемую вероятность данного диапазон:
- меньше, чем X: - e. г. вероятность значений данных меньше 70
- больше X - e. г. вероятность значений данных больше 95
- между X 1 и X 2 - e. г. вероятность значений данных между 65 и 85
, где X представляет интересную ценность (примеры ниже).
Построение и вычисление области не всегда удобно, так как разные наборы данных будут иметь разные значения среднего и stddev.Чтобы облегчить единый стандартный метод для простых вычислений и применимости к реальным проблемам, было введено стандартное преобразование в значения Z, которые составляют часть таблицы Normal Distribution Table .
Z = (X - среднее) / stddev, где X - случайная величина.
В основном это преобразование заставляет среднее и stddev стандартизоваться на 0 и 1 соответственно, что позволяет использовать стандартный набор Z-значений (из Normal Distribution Table ), который будет использоваться для легких вычислений , Захват стандартной таблицы значений z, содержащей значения вероятности, выглядит следующим образом:
z |
0. 00 |
0. 01 |
0. 02 |
0. 03 |
0. 04 |
0. 05 |
0. 06 |
0. 0 |
0. 00000 |
0. 00399 |
0. 00798 |
0. 01197 |
0. 01595 |
0. 01994 |
… |
0. 1 |
0. 0398 |
0. 04380 |
0. 04776 |
0. 05172 |
0. 05567 |
0. 05966 |
… |
0. 2 |
0. 0793 |
0. 08317 |
0. 08706 |
0. 09095 |
0. 09483 |
0. 09871 |
… |
0. 3 |
0. 11791 |
0. 12172 |
0. 12552 |
0. 12930 |
0. 13307 |
0. 13683 |
… |
0. 4 |
0. 15542 |
0. 15910 |
0. 16276 |
0. 16640 |
0. 17003 |
0. 17364 |
… |
0. 5 |
0. 19146 |
0. 19497 |
0. 19847 |
0. 20194 |
0. 20540 |
0. 20884 |
… |
0. 6 |
0. 22575 |
0. 22907 |
0. 23237 |
0. 23565 |
0. 23891 |
0. 24215 |
… |
0. 7 |
0. 25804 |
0. 26115 |
0. 26424 |
0. 26730 |
0. 27035 |
0. 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Найти вероятность, связанную с z-значением 0. 239865 , сначала округлите его до 2 знаков после запятой (т.е. 0. 24). Затем проверьте первые 2 значащие цифры (0. 2) в строках и наименьшую значащую цифру (остальное 0. 04) в столбце. Это приведет к значению 0. 09483.
Здесь можно найти полную нормальную таблицу распределения с точностью до 5 десятичных точек для значений вероятности (в том числе для отрицательных значений).
Давайте посмотрим примеры реальной жизни. Высота отдельных лиц в большой группе следует за нормальным распределением. Предположим, что у нас есть набор из 100 человек, высота которых записана, а среднее и stddev рассчитаны на 66 и 6 дюймов соответственно.
Вот несколько примеров вопросов, на которые можно легко ответить, используя таблицу z-value:
- Какова вероятность того, что человек в группе составляет 70 дюймов или меньше?
Вопрос состоит в том, чтобы найти суммарное значение P (X <= 70) i. е. во всем наборе данных 100, сколько значений будет между 0 и 70.
Давайте сначала преобразуем X-значение 70 в эквивалентное Z-значение.
Z = (X - среднее) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (круглые до 2 десятичных знаков)
Теперь нам нужно найти P (Z <= 0. 67) = 0. 24857 (из таблицы z выше)
i. е. вероятность того, что индивидуум в группе будет меньше или равен 70 дюймов, составляет 24. 857%.
Но держись - вышеуказанное неполно.Помните, что мы ищем вероятность всех возможных высот до 70 i. е. от 0 до 70. Вышеуказанное просто дает вам часть от среднего значения к желаемому значению (например, от 66 до 70). Нам нужно включить другую половину - от 0 до 66 - чтобы получить правильный ответ.
Так как от 0 до 66 представляет половину части (т. Е. Одно крайнее среднее среднее значение), ее вероятность равна просто 0. 5.
Следовательно, правильная вероятность того, что человек составляет 70 дюймов или меньше = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%
Графически (путем вычисления площади), это две области суммирования, представляющие решение:
- Какова вероятность того, что человек составляет 75 дюймов или выше?
я. е. Найти Дополнительной кумулятивный P (X> = 75).
Z = (X - среднее значение) / stddev = (75-66) / 6 = 9/6 = 1. 5
P (Z> = 1. 5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%
- Какова вероятность того, что человек находится между 52 и 67 дюймами?
Найти P (52 <= x <= 67).
P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2. 33 <= z <= 0. 17)
= P (Z <= 0. 17) -p (Z <= -0. 233) = (0. 5 + 0. 56749) - (40905) =
Этот нормальный таблица распределения (и z-значения) обычно находит применение для любых вероятностных расчетов ожидаемых ценовых движений на фондовом рынке для акций и индексов. Они используются в торговле на основе диапазона, определяя уровни восходящего тренда или нисходящего тренда, поддержки или сопротивления и другие технические индикаторы, основанные на нормальных правилах распределения среднего и стандартного отклонения.
Объяснение снизу вверх и сверху вниз Объяснение
Оба этих подхода используются для выбора акций. Вот посмотрите, как они работают.
С использованием формулы нормального распределения для оптимизации вашего портфеля
Распределение нормальных или колоколообразных кривых может использоваться в теории портфелей, чтобы помочь менеджерам портфеля максимизировать доходность и минимизировать риск.
У меня есть план распределения прибыли с моим бывшим работодателем. Сейчас я пытаюсь купить дом. Могу ли я использовать свои деньги для распределения прибыли, чтобы внести первоначальный взнос в дом?
Планы распределения прибыли - это планы выхода на пенсию с компаниями, которые дают сотрудникам процент от прибыли компании. План распределения прибыли аналогичен 401 (k), поскольку он считается планом с установленными взносами. Единственное отличие состоит в том, что единственным субъектом, вносящим вклад в план, является работодатель - на основе прибыли компании в конце каждого финансового года.