Гипотеза Тестирование в области финансов: концепция и примеры

Всё правоведение за 55 минут (лекция) (Ноябрь 2024)

Всё правоведение за 55 минут (лекция) (Ноябрь 2024)
Гипотеза Тестирование в области финансов: концепция и примеры
Anonim

Ваш инвестиционный консультант предлагает вам ежемесячную схему инвестиций в доход, которая обещает переменную доходность каждый месяц. Вы будете инвестировать в него только в том случае, если вам гарантируется средний доход в размере 180 долларов США. Ваш советник также говорит вам, что за последние 300 месяцев эта схема имела доход со средним значением 190 долларов США и стандартным отклонением в 75 долларов. Должны ли вы инвестировать в эту схему?

Тестирование гипотез приходит на помощь для принятия таких решений.

В этой статье предполагается знакомство читателей с понятиями нормальной таблицы распределения, формулы, значения p и связанных с ней основ статистики.

Подробнее о практических применениях данных для определения риска см. «5 способов измерения взаимного риска фонда».

Тестирование гипотез (или тестирование значимости) - это математическая модель для тестирования претензии, идеи или гипотезы об интересующем параметре в заданном наборе населенностей, используя данные, измеренные в наборе образцов. Вычисления выполняются по выбранным образцам для сбора более решительной информации об характеристиках всего населения, что позволяет систематически проверять утверждения или идеи по всему набору данных.

Вот простой пример: (A) Директор школы сообщает, что учащиеся в школе оценивают в среднем 7 из 10 на экзаменах. Чтобы протестировать эту «гипотезу», мы записываем отметки примерно 30 студентов (образец) из всего учащегося школы (скажем 300) и вычисляем среднее значение этой выборки. Затем мы можем сравнить (рассчитанное) среднее значение выборки с средним (сообщенным) населением и попытаться подтвердить гипотезу.

Другой пример: (B) Годовой доход от конкретного взаимного фонда составляет 8%. Предположим, что взаимный фонд существует уже 20 лет. Мы берем случайную выборку ежегодных доходов взаимного фонда, например, за пять лет (образец) и вычисляем его среднее значение. Затем мы сравниваем (рассчитанное) среднее значение выборки с (заявленной) популяцией, чтобы проверить гипотезу.

Существуют различные методологии для тестирования гипотез. Применяются следующие четыре основных шага:

Шаг 1: Определите гипотезу:

Обычно сообщаемое значение (или статистика претензий) определяется как гипотеза и считается истинным. Для приведенных выше примеров гипотеза будет:

  • Пример A: Учащиеся в школе оценивают в среднем 7 из 10 на экзаменах
  • Пример B: Годовой доход от взаимного фонда составляет 8% годовых

Это указано описание представляет собой Нулевую гипотезу (H 0 ) "и считается предполагаемой истиной. Как и суд присяжных начинается с предположения о невиновности подозреваемого, за которым следует определение, является ли предположение ложным. Точно так же тестирование гипотез начинается с формулировки и принятия «Нулевой гипотезы», а затем процесс определяет, может ли предположение быть истинным или ложным.

Важно отметить, что мы проверяем нулевую гипотезу, потому что есть элемент сомнения в ее действительности. Любая информация, которая противоречит заявленной нулевой гипотезе, фиксируется в альтернативной гипотезе (H 1 ). Для приведенных выше примеров альтернативная гипотеза будет следующей:

  • Студенты оценивают среднее значение не , равное 7
  • Годовой возврат взаимного фонда не равный до 8% годовых

Таким образом, альтернативная гипотеза является прямым противоречием нулевой гипотезы.

Как и в ходе судебного разбирательства, жюри предполагает невиновность подозреваемого (нулевая гипотеза). Прокурор должен доказать другое (альтернативное). Точно так же исследователь должен доказать, что нулевая гипотеза либо истинна, либо ложна. Если прокурор не может доказать альтернативную гипотезу, жюри должно отпустить «подозреваемого» (основывая решение на нулевую гипотезу). Точно так же, если исследователь не сможет доказать альтернативную гипотезу (или просто ничего не делает), то нулевая гипотеза считается истинной.

Шаг 2: Установите критерии принятия решения

Критерии принятия решений должны быть основаны на определенных параметрах наборов данных, и именно там происходит подключение к нормальному распределению.

В соответствии с стандартным постулатом статистики о распределении выборки: «Для любого размера выборки n распределение выборки X̅ является нормальным, если популяция X, из которой выполняется выборка, обычно распределяется. «Следовательно, вероятности всех других возможных образцов , которые можно выбрать, обычно распределяются.

Для e. г. , определите, является ли средняя дневная доходность любых акций, котирующихся на фондовом рынке XYZ, около Нового года превышает 2%.

H 0 : Нулевая гипотеза: средняя = 2%

H 1 : Альтернативная гипотеза: средняя> 2% (Это то, что мы хотим доказать)

Возьмите образец (скажем, из 50 акций из 500) и вычислите среднее значение выборки.

Для нормального распределения 95% значений лежат в пределах 2 стандартных отклонений среднего значения. Следовательно, это нормальное распределение и центральное предельное предположение для набора данных выборки позволяют нам установить 5% как уровень значимости. Имеет смысл, так как при этом предположении существует вероятность менее 5% (100-95) получения выбросов, превышающих 2 стандартных отклонения от среднего значения. В зависимости от характера наборов данных другие уровни значимости могут быть приняты на уровне 1%, 5% или 10%. Для финансовых расчетов (включая поведенческое финансирование) 5% является общепринятым лимитом. Если мы найдем какие-либо вычисления, выходящие за пределы обычных 2 стандартных отклонений, то у нас есть сильный случай выбросов, чтобы отклонить нулевую гипотезу. Стандартные отклонения чрезвычайно важны для понимания статистических данных. Узнайте больше о них, просмотрев видео Investopedia по стандартным отклонениям.

Графически это представляется следующим образом:

В приведенном выше примере, если среднее значение выборки намного больше 2% (скажем, 3,5%), то мы отвергаем нулевую гипотезу.Альтернативная гипотеза (средняя> 2%) принимается, что подтверждает, что среднесуточная доходность запасов действительно выше 2%.

Однако, если среднее значение выборки вряд ли будет значительно больше 2% (и останется на уровне около 2. 2%), тогда мы НЕ МОЖЕМ отклонить нулевую гипотезу. Задача заключается в том, как решать такие случаи с близкого расстояния. Чтобы сделать вывод из выбранных выборок и результатов, необходимо определить уровень значимости, что позволяет сделать вывод об нулевой гипотезе. Альтернативная гипотеза позволяет установить уровень значимости или концепцию «критического значения» для решения таких случаев с близкого расстояния. Согласно стандартным определениям «Критическое значение представляет собой значение отсечки, которое определяет границы, за пределами которых менее 5% выборки средства могут быть получены, если нулевая гипотеза верна.Примерное средство, полученное за пределами критического значения, приведет к решению отклонить нулевую гипотезу ». В приведенном выше примере, если мы определили критическое значение как 2. 1%, а рассчитанное среднее составляет 2,2%, тогда мы отвергаем нулевую гипотезу. Критическое значение устанавливает четкую демаркацию о принятии или отклонении.

Дополнительные примеры для подражания. Во-первых, давайте рассмотрим еще несколько ключевых шагов и концепций.

Шаг 3: Рассчитайте статистическую статистику теста:

Этот шаг включает вычисление требуемого числа (фигур), известного как статистика теста (например, среднее значение, z-оценка, значение p и т. Д.) Для выбранного образца. Рассчитываются различные значения, подлежащие вычислению в более позднем разделе с примерами.

Шаг 4: Сделайте выводы о гипотезе

С вычисленным значением (значениями), выберите нулевую гипотезу. Если вероятность получения среднего значения выборки составляет менее 5%, то заключение заключается в отклонение нулевой гипотезы. В противном случае принять и сохранить нулевую гипотезу.

Типы ошибок при принятии решений:

В выборке на основе выборки могут быть четыре возможных результата в отношении правильной применимости для всего населения:

Решение о сохранении

Решение отклонить

> Применимо ко всей совокупности

Правильно

Неверно

(ошибка ТИПА 1 - a)

Не применяется ко всей совокупности

Неверно

(ошибка ТИПА 2 - b)

Исправить

«Правильные» случаи - это те, в которых решения, принятые по образцам, действительно применимы ко всему населению. Случаи ошибок возникают, когда человек решает сохранить (или отклонить) нулевую гипотезу на основе выборочных расчетов, но это решение действительно не применяется для всей совокупности. Эти случаи представляют собой ошибки типа 1 (альфа) и типа 2 (бета), как указано в таблице выше.

Выбор правильного критического значения позволяет исключить альфа-ошибки типа 1 или ограничить их допустимым диапазоном.

Альфа обозначает ошибку на уровне значимости и определяется исследователем. Для поддержания стандартного 5% -ного значения или уровня достоверности для расчета вероятности это сохраняется на уровне 5%.

В соответствии с применимыми критериями принятия решений и определениями:

  • «Этот (альфа) критерий обычно устанавливается равным 0.05 (a = 0. 05), и мы сравниваем альфа-уровень с значением p. Когда вероятность ошибки типа I составляет менее 5% (p <0,05), мы решаем отклонить нулевую гипотезу; в противном случае мы сохраняем нулевую гипотезу. "
  • Технический термин, используемый для этой вероятности, составляет p-value . Он определяется как «вероятность получения результата выборки, учитывая, что значение, указанное в нулевой гипотезе, истинно. Значение p для получения результата выборки сравнивается с уровнем значимости ».
  • Ошибка типа II или бета-ошибка определяется как «вероятность неправильного сохранения нулевой гипотезы, когда на самом деле она не применима ко всей совокупности. «

Еще несколько примеров продемонстрируют этот и другие расчеты.

Пример 1. Существует ежемесячная схема инвестиций в доход, которая обещает переменные ежемесячные доходы. Инвестор будет инвестировать в него только в том случае, если ему гарантируется средний доход в размере 180 долларов США. У него есть выборка за 300 месяцев, которая имеет среднее значение в 190 долларов и стандартное отклонение в 75 долларов. Должен ли он или она инвестировать в эту схему?

Зададим проблему. Инвестор будет инвестировать в схему, если он или она будут уверены в желаемом средневзвешенном значении за 180 долларов. Здесь

H 0 : Нулевая гипотеза: средняя = 180

H 1 : Альтернативная гипотеза: среднее> 180

Метод 1 - Подход к критическим значениям :

Определите критическое значение X L для среднего значения выборки, которое достаточно велико, чтобы отклонить нулевую гипотезу - i. е. отклонить нулевую гипотезу, если среднее значение выборки = критическое значение X L

P (идентифицировать альфа-ошибку типа I) = P (отклонить H 0 , учитывая, что H 0 истинно),

, которое будет достигнуто, когда среднее значение образца превысит критические пределы i. е.

= P (при условии, что H 0 истинно) = alpha

Графически

Принимая альфа = 0. 05 (то есть уровень значимости 5%), Z 0. 05 = 1. 645 (из таблицы Z-таблицы или обычной таблицы рассылки)

=> X L = 180 +1. 645 * (75 / sqrt (300)) = 187. 12

Поскольку среднее значение выборки (190) больше критического значения (187. 12), нулевая гипотеза отвергается, и вывод заключается в том, что среднемесячный доход на самом деле превышает 180 долларов США, поэтому инвестор может рассмотреть возможность инвестирования в эту схему.

Метод 2 - Использование стандартизованной статистики тестов :

Можно также использовать стандартизованное значение z.

Статистика испытаний, Z = (среднее значение выборки - среднее население) / (std-dev / sqrt (количество образцов), т.е.

Затем область отклонения становится

Z = (190-180) / ( 75 / sqrt (300)) = 2. 309

Наша область отклонения с уровнем значимости 5% равна Z> Z 0. 05 = 1. 645

Так как Z = 2. 309 больше чем 1. 645, нулевая гипотеза может быть отвергнута с аналогичным выводом, упомянутым выше.

Метод 3 - вычисление P-стоимости:

Мы стремимся идентифицировать P (среднее среднее> 190, когда среднее = 180) < = P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2. 309) = 0. 0084 = 0. 84%

Следующая таблица для вывода вычислений p-стоимости делается вывод о том, что есть подтвержденные доказательства того, что среднемесячная доходность выше 180.

p-value

Вывод

менее 1%

Подтвержденные доказательства

поддержка альтернативной гипотезы между 1% и 5%

Сильные доказательства

поддержка альтернативной гипотезы > от 5% до 10%

Слабые доказательства

поддержка альтернативной гипотезы более 10%

Нет доказательств

поддержка альтернативной гипотезы Пример 2: заявка на новый брокер (XYZ) что его брокерские ставки ниже, чем у вашего текущего биржевого брокера (ABC). Данные независимой исследовательской фирмы показывают, что средний и std-dev всех клиентов брокера ABC составляют соответственно 18 и 6 долларов США.

Образец из 100 клиентов ABC принимается, а брокерские сборы рассчитываются по новым ставкам брокера XYZ. Если среднее значение выборки составляет 18 долларов США. 75 и std-dev одинаковы (6 долларов США), можно ли сделать вывод о различии в среднем брокерском счете между ABC и брокером XYZ?

H

0 : Нулевая гипотеза: средняя = 18 H

1 : Альтернативная гипотеза: среднее 18 (Это то, что мы хотим доказать) Область отклонений: Z <= - z

2. 5 и Z> = Z 2. 5 (при условии 5% уровня значимости, разделение 2. 5 с каждой стороны) Z = (среднее значение среднего значения) / (std-dev / sqrt (количество образцов)

= (18 75 - 18) / (6 / (sqrt (100)) = 1. 25

Это рассчитанное значение Z падает между двумя пределами, определяемыми

- Z

2. 5 = -1 96 и Z 2. 5 = 1. 96. Это делает вывод о том, что недостаточно доказательств того, что существует разница между ставками вашего существующего и нового брокера.

В качестве альтернативы, Значение p = P (Z1. 25)

= 2 * 0. 1056 = 0. 2112 = 21. 12%, что больше, чем 0. 05 или 5%, что приводит к такому же выводу.

Графически , он представлен следующим образом:

Точки критики для метода гипотетического тестирования:

-

Статистический метод, основанный на предположениях - ошибка, подверженная деталям с точки зрения альфа-и бета-ошибок

- Интерпретация p-value может быть неоднозначным, что приводит к запутанным результатам

The Bottom Line

Тестирование гипотез позволяет математической модели подтвердить заявку или идею с помощью определенный уровень уверенности. Однако, как и большинство статистических инструментов и моделей, это тоже связано с несколькими ограничениями. Использование этой модели для принятия финансовых решений следует учитывать с критичностью, сохраняя при этом все зависимости. Альтернативные методы, такие как Байесовский вывод, также заслуживают изучения для аналогичного анализа.