Регрессионные основы для бизнес-анализа

55 Основы корреляционного анализа (Май 2024)

55 Основы корреляционного анализа (Май 2024)
Регрессионные основы для бизнес-анализа

Оглавление:

Anonim

Если вы когда-нибудь задавались вопросом, как две или более вещи связаны друг с другом, или если вы когда-либо делали своего босса, попросите вас создать прогноз или проанализировать отношения между переменными, тогда регрессия обучения будет быть достойным вашего времени.

В этой статье вы узнаете основы простой линейной регрессии - инструмент, обычно используемый для прогнозирования и финансового анализа. Мы начнем с изучения основных принципов регрессии, сначала узнаем о ковариации и корреляции, а затем перейдем к построению и интерпретации результатов регрессии. Многие программные продукты, такие как Microsoft Excel, могут выполнять все регрессионные вычисления и выходы для вас, но по-прежнему важно изучить основную механику.

Переменные

В центре регрессии находится связь между двумя переменными, называемыми зависимыми и независимыми переменными. Например, предположим, что вы хотите прогнозировать продажи своей компании, и вы пришли к выводу, что продажи вашей компании идут вверх и вниз в зависимости от изменений в ВВП.

Продажи, которые вы прогнозируете, будут зависимой переменной, потому что их ценность «зависит» от стоимости ВВП, а ВВП будет независимой переменной. Затем вам нужно будет определить силу взаимосвязи между этими двумя переменными, чтобы прогнозировать продажи. Если ВВП будет увеличиваться / уменьшаться на 1%, насколько ваши продажи будут увеличиваться или уменьшаться?

Ковариация

Формула для вычисления отношения между двумя переменными называется ковариацией. Этот расчет показывает вам направление отношения, а также его относительную силу. Если одна переменная увеличивается и другая переменная имеет тенденцию к увеличению, ковариантность будет положительной. Если одна переменная поднимается, а другая имеет тенденцию опускаться, то ковариация будет отрицательной.

Фактическое число, которое вы получаете от вычисления этого, трудно интерпретировать, поскольку оно не стандартизировано. Ковариация пяти, например, может быть интерпретирована как положительная взаимосвязь, но сила отношения можно сказать только сильнее, чем если бы число было четыре или меньше, чем если бы число было шесть.

Коэффициент корреляции

Нам нужно стандартизировать ковариацию, чтобы мы могли лучше интерпретировать и использовать ее в прогнозировании, а результат - расчет корреляции. Расчет корреляции просто берет ковариацию и делит ее на произведение стандартного отклонения двух переменных. Это будет связано с корреляцией между значением -1 и +1.

Корреляция +1 может быть интерпретирована, чтобы предположить, что обе переменные движутся совершенно позитивно друг с другом, а -1 означает, что они совершенно отрицательно коррелируют. В нашем предыдущем примере, если корреляция равна +1, а ВВП увеличивается на 1%, тогда продажи увеличились бы на 1%.Если корреляция -1, увеличение ВВП на 1% приведет к 1% -ному снижению продаж - прямо противоположному.

Уравнение регрессии

Теперь, когда мы знаем, как рассчитывается относительная взаимосвязь между двумя переменными, мы можем разработать уравнение регрессии для прогнозирования или прогнозирования желаемой переменной. Ниже приведена формула для простой линейной регрессии. «Y» - это значение, которое мы пытаемся прогнозировать, «b» - это наклон регрессии, «x» - это значение нашего независимого значения, а «a» представляет собой y-перехват. Уравнение регрессии просто описывает зависимость между зависимой переменной (y) и независимой переменной (x).

Перехват или «a» - это значение y (зависимая переменная), если значение x (независимая переменная) равно нулю. Поэтому, если бы не было изменений в ВВП, ваша компания все равно будет делать некоторые продажи - это значение, когда изменение в ВВП равно нулю, является перехватом. Взгляните на график ниже, чтобы увидеть графическое изображение уравнения регрессии. На этом графике имеется только пять точек данных, представленных пятью точками на графике. Линейная регрессия пытается оценить линию, которая наилучшим образом соответствует данным, и уравнение этой линии приводит к уравнению регрессии.

Рисунок 1: Линия наилучшего соответствия
Источник: Investopedia

Excel

Теперь, когда вы понимаете, какой фон, который входит в регрессионный анализ, давайте сделаем простой пример с помощью инструментов регрессии Excel. Мы опишем предыдущий пример попыток прогнозировать продажи в следующем году на основе изменений в ВВП. В следующей таблице перечислены некоторые точки искусственных данных, но эти цифры могут быть легко доступны в реальной жизни.

Год Продажа ВВП
2013 100 1. 00%
2014 250 1. 90%
2005 275 2. 40%
2016 200 2. 60%
2017 300 2. 90%

Просто наблюдая за столом, вы можете видеть, что будет положительная корреляция между продажами и ВВП. Оба имеют тенденцию расти вместе. Используя Excel, все, что вам нужно сделать, - щелкнуть раскрывающееся меню Инструменты , выберите Анализ данных и выберите Регрессия . Всплывающее окно легко заполнить оттуда; ваш диапазон ввода Y - это столбец «Продажи», а ваш диапазон ввода X - это изменение столбца ВВП; выберите выходной диапазон для того, где вы хотите, чтобы данные отображались в вашей электронной таблице и нажмите OK. Вы должны увидеть нечто похожее на то, что приведено в таблице ниже

Статистика регрессии Коэффициенты
Несколько R 0. 8292243 Intercept 34. 58409
R Square 0. 687613 ВВП 88. 15552
Скорректированный

Квадрат

0. 583484

-

-

Стандартная ошибка 51. 021807 -

-

Наблюдения 5

-

-

Интерпретация

Основными результатами, которые необходимо учитывать для простой линейной регрессии, являются R-квадрат , перехват и коэффициент ВВП. Число R-квадратов в этом примере составляет 68. 7% - это показывает, насколько наша модель предсказывает или прогнозирует будущие продажи. Затем у нас есть перехват 34.58, в котором говорится, что если прогнозируется, что изменение ВВП будет равным нулю, наши продажи составят около 35 единиц. И, наконец, коэффициент корреляции ВВП в 88,15 говорит нам, что если ВВП увеличится на 1%, продажи, скорее всего, возрастут примерно на 88 единиц.

Bottom Line

Итак, как бы вы использовали эту простую модель в своем бизнесе? Хорошо, если ваши исследования заставят вас поверить, что следующее изменение ВВП будет определенным процентом, вы можете подключить этот процент к модели и сформировать прогноз продаж. Это может помочь вам разработать более объективный план и бюджет на предстоящий год.

Конечно, это всего лишь простая регрессия, и есть модели, которые вы можете построить, которые используют несколько независимых переменных, называемых множественными линейными регрессиями. Но несколько линейных регрессий более сложны и имеют несколько проблем, которые потребуются для обсуждения другой статьи.