Меню

Оценка регрессий в пакете STATA



Оценка регрессий в пакете STATA

Оценка регрессий в пакете STATA

Для запуска пакета STATA достаточно дважды кликнуть левой кнопкой мышки по значку вашего файла с данными. Откроется 4 окна: Variables, Results, Command, Review.

Откройте необходимый файл с помощью выбора в главном меню команд

Если этот файл не открывается из-за нехватки памяти, то предварительно наберите в командном окне

На месте точек – объем памяти, больший размера открываемого файла.

В окне Variables появятся имена содержащихся в файле переменных,

в окне Command набираются необходимые команды, копируемые в окно Review,

в окне Results после выполнения команды появляются результаты.

Вы можете выбрать удобное расположение окон с помощью пунктов меню Prefs и Window.

Для оценки параметров множественной регрессии следует набрать

reg имя зависимой переменной имена независимых переменных

Имена переменных удобно вносить в уравнение регрессии, просто кликая по ним мышкой.

Общий вид команды для оценки регрессии имеет вид:

reg depvar [indepvars] [if] [in] [, options]

При наборе команд [] ставить не нужно.

Условия if и in выделяют необходимые наблюдения.

Таблица с результатами оцененной регрессии появится в окне результатов.

Таблицы результатов можно копировать из окна результатов, например, в Word – файл с помощью COPY и PASTE. Но проще для сохранения результатов перед оцениванием регрессии открыть лог-файл, кликнув по значку со светофором.

Создание новых переменных в пакете STATA

Для создания новой переменной следует набрать в командном окне

gen имя новой переменной = формулу для новой переменной.

Проверка гипотез о линейных ограничениях на коэффициенты регрессии в пакете STATA

Для проверки гипотезы для коэффициентов регрессии

о наличии линейных связей

(где Q – матрица ранга r, — вектор коэффициентов регрессии, q – k –мерный постоянный вектор)

при альтернативной гипотезе

в командном окне следует набрать:

test (1-ое условие на коэффициенты) (2-ое условие на коэффициенты) и т. д.,

test (price=0) (income=temp)

и сделать вывод с помощью p-value для F – статистики.

Если p-value больше выбранного уровня значимости, то основная гипотеза не отвергается.

RESET — тест Рамсея в пакете STATA

Для проведения теста Рамсея, после оценки параметров уравнения регрессии наберите в командном окне

В выданной таблице результатов используйте p-value для F – статистики.

Если p-value больше выбранного уровня значимости, то основная гипотеза о правильной спецификации исходной модели не отвергается.

Диагностика наличия мультиколлинеарности данных в пакете STATA

Для вычисления одного из главных показателей мультиколлинеарности — VIFов следует после оценки параметров регрессии набрать команду

Диагностика наличия гетероскедастичности данных в пакете STATA

Для проведения теста Уайта после оценки регрессии необходимо набрать в командном окне

estat imtest, white

Для проведения теста Бройша – Пагана после оценки коэффициентов регрессии необходимо набрать в командном окне

В выданной таблице результатов используйте p-value для статистики «хи – квадрат».

Если p-value больше выбранного уровня значимости, то основная гипотеза о гипотеза о гомоскедастичности не отвергается.

Диагностика наличия автокорреляции данных в пакете STATA

Cтатистику Дарбина – Уотсона можно получить, набрав в командном окне

estat dwatson

Для проведения теста Бройша – Годфри следует набрать в командном окне

estat bgodfrey, lags(1/…)

Вместо точек в скобках следует указать количество включаемых лагов.

При диагностике наличия автокорреляции можно провести оценку коэффициентов

методом Прайса – Уинстона, набрав в командном окне

prais имя зависимой переменной имена зависимых переменных

или вычислив стандартные отклонения коэффициентов в форме Невье – Веста

Читайте также:  Итак Тест Что в вас особенного

с помощью команды

Newey имя зависимой переменной имена зависимых переменных, lags(…)

указав необходимое количество лагов в скобках.

Оценка моделей бинарного выбора в пакете STATA

Для оценки модели бинарного выбора используйте команду

logit имя зависимой переменной имена независимых переменных

probit имя зависимой переменной имена независимых переменных

Предельные эффекты объясняющих факторов можно вычислить с помощью команды

Импортирование данных из файла формата Excel

Откройте пустой файл формата STATA, выберите пункты меню Data/Data Editor и в открывшуюся пустую таблицу скопируйте необходимые данные (вместе с названиями соответствующих переменных, желательно написанных латинскими буквами) в формате Excel с помощью пунктов меню COPY, PASTE.

Источник

Тест ошибочной спецификации Рамсея.

Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение

1. Оценивается уравнение регрессии

2. Вычисляются степени оценок зависимой переменной

3. Оценивается уравнение регрессии с этими степенями

4. Проводится оценка улучшения по F-критерию

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т.е. определяют фактическое значение t-критерия Стьюдента

где m b – стандартная ошибка параметра ,

где S остаточная дисперсия на одну степень свободы

Данный критерий затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы (n-2). Этот же результат можно получить после извлечения корня из F-критерия, т.е. t b= . Аналогично для параметра а.

Фактическое значение t-критерия Стьюдента определяется как

Данная формула свидетельствует о том, что в парной линейной регрессии t 2 r=F. Кроме того t 2 b=F, следовательно, t 2 r= t 2 b . Таким образом проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии.

Сравнивая фактическое и критическое (табличное) значения t-статистики – t табл и t факт — принимаем или отвергаем гипотезу H 0.

Если t табл факт, то H 0 отклоняется, т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл > t факт, то гипотеза Н о не откло­няется и признается случайная природа формирования a и b.

66. Типы переменных в эконометрических моделях. Структурная и приве­дённая формы спецификации эконометрических моделей.

Типы переменных: эндогенные – образуются внутри модели. Экзогенные – не зависят от модели, внешние для модели.

Модель, возникающая на этапе спецификации, как правило, имеет структурную форму, отражающую заложенные в модель экономические утверждения. В такой форме эндогенные переменные модели, как правило, не выражены явно через ее экзогенные переменные. При помощи алгебраических преобразований модель от структурной формы может быть трансформирована к приведенной форме, где каждая эндогенная переменная представляется в виде явной функции только экзогенных переменных модели. Приведенная форма модели непосредственно предназначена для прогноза (объяснения) эндогенных переменных при помощи экзогенных переменных. В частном случае структурная форма модели может совпадать с приведенной формой.

Переход от структурной к приведенной форме возможен всегда и однозначно, а обратное неверно. Приведенная форма.

67. Типы переменных в эконометрических моделях. Структурная и приве­дённая формы спецификации эконометрических моделей.

СМОТРИ ВОПРОС 66

Устранение автокорреляции в парной регрессии

Модель называется автокоррелированной, если не выполняется третья предпосылка теоремы Гаусса-Маркова: Cov(u i,u j)≠0 при i≠j.

Автокорреляция чаще всего появляется в моделях временных рядов и моделировании циклических процессов.

Причина – неправильный выбор спецификации модели.

Последствия автокорреляции (оценки коэффициентов теряют эффективность, стандартные ошибки коэффициентов занижены).

Читайте также:  Анализ главы О корени происхождения глуповцев

Для устранения автокорреляции можно воспользоваться процедурой Кохрейна-Орката:

1)По выборочным данным выполняется настройка модели и вычисляется вектор остатков регрессии е.

2)По остаткам регрессии оценивается модель авторегрессии:

3)С оценкой выполняются преобразования (1) и (2).

4)Строится новый вектор остатков, и процедура повторяется (начиная с П.2).

Итерационный процесс заканчивается при условии совпадения оценок на последней и предпоследней итерациях с заданной степенью точности.

Источник

Тест рамсея p value

Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение

1. Оценивается уравнение регрессии

2. Вычисляются степени оценок зависимой переменной

3. Оценивается уравнение регрессии с этими степенями

4. Проводится оценка улучшения по F-критерию

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т.е. определяют фактическое значение t-критерия Стьюдента

где m b – стандартная ошибка параметра ,

где S остаточная дисперсия на одну степень свободы

Данный критерий затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы (n-2). Этот же результат можно получить после извлечения корня из F-критерия, т.е. t b= . Аналогично для параметра а.

Фактическое значение t-критерия Стьюдента определяется как

Данная формула свидетельствует о том, что в парной линейной регрессии t 2 r=F. Кроме того t 2 b=F, следовательно, t 2 r= t 2 b . Таким образом проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии.

Сравнивая фактическое и критическое (табличное) значения t-статистики – t табл и t факт — принимаем или отвергаем гипотезу H 0.

Если t табл факт, то H 0 отклоняется, т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл > t факт, то гипотеза Н о не откло­няется и признается случайная природа формирования a и b.

66. Типы переменных в эконометрических моделях. Структурная и приве­дённая формы спецификации эконометрических моделей.

Типы переменных: эндогенные – образуются внутри модели. Экзогенные – не зависят от модели, внешние для модели.

Модель, возникающая на этапе спецификации, как правило, имеет структурную форму, отражающую заложенные в модель экономические утверждения. В такой форме эндогенные переменные модели, как правило, не выражены явно через ее экзогенные переменные. При помощи алгебраических преобразований модель от структурной формы может быть трансформирована к приведенной форме, где каждая эндогенная переменная представляется в виде явной функции только экзогенных переменных модели. Приведенная форма модели непосредственно предназначена для прогноза (объяснения) эндогенных переменных при помощи экзогенных переменных. В частном случае структурная форма модели может совпадать с приведенной формой.

Переход от структурной к приведенной форме возможен всегда и однозначно, а обратное неверно. Приведенная форма.

67. Типы переменных в эконометрических моделях. Структурная и приве­дённая формы спецификации эконометрических моделей.

СМОТРИ ВОПРОС 66

Устранение автокорреляции в парной регрессии

Модель называется автокоррелированной, если не выполняется третья предпосылка теоремы Гаусса-Маркова: Cov(u i,u j)≠0 при i≠j.

Автокорреляция чаще всего появляется в моделях временных рядов и моделировании циклических процессов.

Причина – неправильный выбор спецификации модели.

Последствия автокорреляции (оценки коэффициентов теряют эффективность, стандартные ошибки коэффициентов занижены).

Для устранения автокорреляции можно воспользоваться процедурой Кохрейна-Орката:

1)По выборочным данным выполняется настройка модели и вычисляется вектор остатков регрессии е.

2)По остаткам регрессии оценивается модель авторегрессии:

3)С оценкой выполняются преобразования (1) и (2).

Читайте также:  Тест драйв анлимитед 2 сколько машин

4)Строится новый вектор остатков, и процедура повторяется (начиная с П.2).

Итерационный процесс заканчивается при условии совпадения оценок на последней и предпоследней итерациях с заданной степенью точности.

Источник

Спецификация эконометрической модели: способы и диагностика отбора экзогенных переменных. Тесты Рамсея и Амемья.

Спецификация модели множественной линейной регрессии включает проверку:

1. правильного выбора экзогенных переменных.

2. корректного выбора формы зависимости мду эндо- и экзогенной переменными.

Для решения 1 задачи различают пропущенные и избыточные экзогенные переменные

Пропущенные переменные – существенные факторы, которые не были включены в эконометрическую модель по ошибке. Опасность наличия пропущенных переменных заключается в смещении оценок параметров при включенных переменных. Признак, по которому определяют пропущенную переменную: Знак “+” у произведения оценки параметра при подозреваемой пропущенной переменной и коэффициента корреляции этой переменной с другими переменными, включенными в модель.

Выбранная модель с пропуском переменной :

, где

Тогда, применяя МНК для оценки усеченной модели получаем формулу смещения оценки ^

Экзогенную переменную относят к избыточным, если она по ошибке включена в эконометрическую модель. Включение избыточной переменной оказывает влияние на уменьшение точности (увеличение дисперсии) оценок параметров модели, что, в свою очередь, вызывает уменьшение t-статистик и коэффициента детерминации.

Если – избыточная, то коэффициент корреляции , тогда будет уменьшаться, а в соответствии с формулой будет возрастать.

Замещающие переменные – обычно бывает полезно вместо пропущенной переменной, которую трудно измерить, использовать некоторый её заменитель.

4 основных качественных правила спецификации экономической модели:

1. Опираясь на эконометрическую теорию, следует ответить на вопрос: «Является ли переменная существенной в модели зависимости с эндогенной переменной?».

2. Осуществить проверку значимого отличия от нуля t-статистик.

3. Осуществить проверку, насколько значимо изменяется коэффициент детерминации при добавлении некоторой переменной в модель.

4. Существенно ли изменяются оценки других переменных после добавления новой переменной в модель.

Кроме отмеченных правил спецификации модели, наиболее из-вестны два следующих количественных критерия спецификации:

Критерий Рамсея (Ramsey):

RESET-тест Рамсея — это обобщенный тест на наличие следующих ошибок спецификации модели линейной регрессии:

  • наличие пропущенных переменных. Регрессия содержит не все объясняющие переменные;
  • неверная функциональная форма. Некоторые или все переменные должны быть преобразованы с помощью логарифмической, степенной, обратной или какой-либо другой функции;
  • корреляция между фактором Х и случайной составляющей модели, которая может быть вызвана ошибками измерения факторов, рассмотрением систем уравнений или другими причинами.

Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение

1. Оценивается уравнение регрессии

2. Вычисляются степени оценок зависимой переменной

3. Оценивается уравнение регрессии с этими степенями

4. Проводится оценка улучшения по F-критерию

Ошибки такого рода приводят к смещению среднего остатков регрессионной модели.

1. Оценивают зависимость в соответствии с выбранной моделью по МНК:

2. Анализируют вид функциональной зависимости остатков и её номинальное приближение включают в модель.

3. Например, с учетом 2) вычисляют величины , конструируют новую модель:

и применяют для ее оценивания по МНК.

4) Сравнивают качество модели по отношению к модели с помощью F-критерия:

Если где M – число дополнительных переменных, включенных в модель ( M=3), k – число экзогенных переменных в то модель плохо специфицирована.

Недостаток: он указывает только на наличие ошибочной спец-ции модели, но не выявляет, сколько и какого рода переменную нужно добавить в модель.

Критерий Амемья (Amemiya):

Решающей функцией F-критерия служит:

Модель, для которой значение AF меньше, является лучше специфицированной.

Этот критерий минимизирует число экзогенных переменных.

Источник