Оценка регрессий в пакете STATA
Оценка регрессий в пакете STATA
Для запуска пакета STATA достаточно дважды кликнуть левой кнопкой мышки по значку вашего файла с данными. Откроется 4 окна: Variables, Results, Command, Review.
Откройте необходимый файл с помощью выбора в главном меню команд
Если этот файл не открывается из-за нехватки памяти, то предварительно наберите в командном окне
На месте точек – объем памяти, больший размера открываемого файла.
В окне Variables появятся имена содержащихся в файле переменных,
в окне Command набираются необходимые команды, копируемые в окно Review,
в окне Results после выполнения команды появляются результаты.
Вы можете выбрать удобное расположение окон с помощью пунктов меню Prefs и Window.
Для оценки параметров множественной регрессии следует набрать
reg имя зависимой переменной имена независимых переменных
Имена переменных удобно вносить в уравнение регрессии, просто кликая по ним мышкой.
Общий вид команды для оценки регрессии имеет вид:
reg depvar [indepvars] [if] [in] [, options]
При наборе команд [] ставить не нужно.
Условия if и in выделяют необходимые наблюдения.
Таблица с результатами оцененной регрессии появится в окне результатов.
Таблицы результатов можно копировать из окна результатов, например, в Word – файл с помощью COPY и PASTE. Но проще для сохранения результатов перед оцениванием регрессии открыть лог-файл, кликнув по значку со светофором.
Создание новых переменных в пакете STATA
Для создания новой переменной следует набрать в командном окне
gen имя новой переменной = формулу для новой переменной.
Проверка гипотез о линейных ограничениях на коэффициенты регрессии в пакете STATA
Для проверки гипотезы для коэффициентов регрессии
о наличии линейных связей
(где Q – матрица ранга r, — вектор коэффициентов регрессии, q – k –мерный постоянный вектор)
при альтернативной гипотезе
в командном окне следует набрать:
test (1-ое условие на коэффициенты) (2-ое условие на коэффициенты) и т. д.,
test (price=0) (income=temp)
и сделать вывод с помощью p-value для F – статистики.
Если p-value больше выбранного уровня значимости, то основная гипотеза не отвергается.
RESET — тест Рамсея в пакете STATA
Для проведения теста Рамсея, после оценки параметров уравнения регрессии наберите в командном окне
В выданной таблице результатов используйте p-value для F – статистики.
Если p-value больше выбранного уровня значимости, то основная гипотеза о правильной спецификации исходной модели не отвергается.
Диагностика наличия мультиколлинеарности данных в пакете STATA
Для вычисления одного из главных показателей мультиколлинеарности — VIFов следует после оценки параметров регрессии набрать команду
Диагностика наличия гетероскедастичности данных в пакете STATA
Для проведения теста Уайта после оценки регрессии необходимо набрать в командном окне
estat imtest, white
Для проведения теста Бройша – Пагана после оценки коэффициентов регрессии необходимо набрать в командном окне
В выданной таблице результатов используйте p-value для статистики «хи – квадрат».
Если p-value больше выбранного уровня значимости, то основная гипотеза о гипотеза о гомоскедастичности не отвергается.
Диагностика наличия автокорреляции данных в пакете STATA
Cтатистику Дарбина – Уотсона можно получить, набрав в командном окне
estat dwatson
Для проведения теста Бройша – Годфри следует набрать в командном окне
estat bgodfrey, lags(1/…)
Вместо точек в скобках следует указать количество включаемых лагов.
При диагностике наличия автокорреляции можно провести оценку коэффициентов
методом Прайса – Уинстона, набрав в командном окне
prais имя зависимой переменной имена зависимых переменных
или вычислив стандартные отклонения коэффициентов в форме Невье – Веста
с помощью команды
Newey имя зависимой переменной имена зависимых переменных, lags(…)
указав необходимое количество лагов в скобках.
Оценка моделей бинарного выбора в пакете STATA
Для оценки модели бинарного выбора используйте команду
logit имя зависимой переменной имена независимых переменных
probit имя зависимой переменной имена независимых переменных
Предельные эффекты объясняющих факторов можно вычислить с помощью команды
Импортирование данных из файла формата Excel
Откройте пустой файл формата STATA, выберите пункты меню Data/Data Editor и в открывшуюся пустую таблицу скопируйте необходимые данные (вместе с названиями соответствующих переменных, желательно написанных латинскими буквами) в формате Excel с помощью пунктов меню COPY, PASTE.
Источник
Тест ошибочной спецификации Рамсея.
Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение
1. Оценивается уравнение регрессии
2. Вычисляются степени оценок зависимой переменной
3. Оценивается уравнение регрессии с этими степенями
4. Проводится оценка улучшения по F-критерию
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.
Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т.е. определяют фактическое значение t-критерия Стьюдента
где m b – стандартная ошибка параметра ,
где S остаточная дисперсия на одну степень свободы
Данный критерий затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы (n-2). Этот же результат можно получить после извлечения корня из F-критерия, т.е. t b= . Аналогично для параметра а.
Фактическое значение t-критерия Стьюдента определяется как
Данная формула свидетельствует о том, что в парной линейной регрессии t 2 r=F. Кроме того t 2 b=F, следовательно, t 2 r= t 2 b . Таким образом проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии.
Сравнивая фактическое и критическое (табличное) значения t-статистики – t табл и t факт — принимаем или отвергаем гипотезу H 0.
Если t табл факт, то H 0 отклоняется, т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл > t факт, то гипотеза Н о не отклоняется и признается случайная природа формирования a и b.
66. Типы переменных в эконометрических моделях. Структурная и приведённая формы спецификации эконометрических моделей.
Типы переменных: эндогенные – образуются внутри модели. Экзогенные – не зависят от модели, внешние для модели.
Модель, возникающая на этапе спецификации, как правило, имеет структурную форму, отражающую заложенные в модель экономические утверждения. В такой форме эндогенные переменные модели, как правило, не выражены явно через ее экзогенные переменные. При помощи алгебраических преобразований модель от структурной формы может быть трансформирована к приведенной форме, где каждая эндогенная переменная представляется в виде явной функции только экзогенных переменных модели. Приведенная форма модели непосредственно предназначена для прогноза (объяснения) эндогенных переменных при помощи экзогенных переменных. В частном случае структурная форма модели может совпадать с приведенной формой.
Переход от структурной к приведенной форме возможен всегда и однозначно, а обратное неверно. Приведенная форма.
67. Типы переменных в эконометрических моделях. Структурная и приведённая формы спецификации эконометрических моделей.
СМОТРИ ВОПРОС 66
Устранение автокорреляции в парной регрессии
Модель называется автокоррелированной, если не выполняется третья предпосылка теоремы Гаусса-Маркова: Cov(u i,u j)≠0 при i≠j.
Автокорреляция чаще всего появляется в моделях временных рядов и моделировании циклических процессов.
Причина – неправильный выбор спецификации модели.
Последствия автокорреляции (оценки коэффициентов теряют эффективность, стандартные ошибки коэффициентов занижены).
Для устранения автокорреляции можно воспользоваться процедурой Кохрейна-Орката:
1)По выборочным данным выполняется настройка модели и вычисляется вектор остатков регрессии е.
2)По остаткам регрессии оценивается модель авторегрессии:
3)С оценкой выполняются преобразования (1) и (2).
4)Строится новый вектор остатков, и процедура повторяется (начиная с П.2).
Итерационный процесс заканчивается при условии совпадения оценок на последней и предпоследней итерациях с заданной степенью точности.
Источник
Тест рамсея p value
Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение
1. Оценивается уравнение регрессии
2. Вычисляются степени оценок зависимой переменной
3. Оценивается уравнение регрессии с этими степенями
4. Проводится оценка улучшения по F-критерию
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.
Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т.е. определяют фактическое значение t-критерия Стьюдента
где m b – стандартная ошибка параметра ,
где S остаточная дисперсия на одну степень свободы
Данный критерий затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы (n-2). Этот же результат можно получить после извлечения корня из F-критерия, т.е. t b= . Аналогично для параметра а.
Фактическое значение t-критерия Стьюдента определяется как
Данная формула свидетельствует о том, что в парной линейной регрессии t 2 r=F. Кроме того t 2 b=F, следовательно, t 2 r= t 2 b . Таким образом проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии.
Сравнивая фактическое и критическое (табличное) значения t-статистики – t табл и t факт — принимаем или отвергаем гипотезу H 0.
Если t табл факт, то H 0 отклоняется, т.е. a и b не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл > t факт, то гипотеза Н о не отклоняется и признается случайная природа формирования a и b.
66. Типы переменных в эконометрических моделях. Структурная и приведённая формы спецификации эконометрических моделей.
Типы переменных: эндогенные – образуются внутри модели. Экзогенные – не зависят от модели, внешние для модели.
Модель, возникающая на этапе спецификации, как правило, имеет структурную форму, отражающую заложенные в модель экономические утверждения. В такой форме эндогенные переменные модели, как правило, не выражены явно через ее экзогенные переменные. При помощи алгебраических преобразований модель от структурной формы может быть трансформирована к приведенной форме, где каждая эндогенная переменная представляется в виде явной функции только экзогенных переменных модели. Приведенная форма модели непосредственно предназначена для прогноза (объяснения) эндогенных переменных при помощи экзогенных переменных. В частном случае структурная форма модели может совпадать с приведенной формой.
Переход от структурной к приведенной форме возможен всегда и однозначно, а обратное неверно. Приведенная форма.
67. Типы переменных в эконометрических моделях. Структурная и приведённая формы спецификации эконометрических моделей.
СМОТРИ ВОПРОС 66
Устранение автокорреляции в парной регрессии
Модель называется автокоррелированной, если не выполняется третья предпосылка теоремы Гаусса-Маркова: Cov(u i,u j)≠0 при i≠j.
Автокорреляция чаще всего появляется в моделях временных рядов и моделировании циклических процессов.
Причина – неправильный выбор спецификации модели.
Последствия автокорреляции (оценки коэффициентов теряют эффективность, стандартные ошибки коэффициентов занижены).
Для устранения автокорреляции можно воспользоваться процедурой Кохрейна-Орката:
1)По выборочным данным выполняется настройка модели и вычисляется вектор остатков регрессии е.
2)По остаткам регрессии оценивается модель авторегрессии:
3)С оценкой выполняются преобразования (1) и (2).
4)Строится новый вектор остатков, и процедура повторяется (начиная с П.2).
Итерационный процесс заканчивается при условии совпадения оценок на последней и предпоследней итерациях с заданной степенью точности.
Источник
Спецификация эконометрической модели: способы и диагностика отбора экзогенных переменных. Тесты Рамсея и Амемья.
Спецификация модели множественной линейной регрессии включает проверку:
1. правильного выбора экзогенных переменных.
2. корректного выбора формы зависимости мду эндо- и экзогенной переменными.
Для решения 1 задачи различают пропущенные и избыточные экзогенные переменные
Пропущенные переменные – существенные факторы, которые не были включены в эконометрическую модель по ошибке. Опасность наличия пропущенных переменных заключается в смещении оценок параметров при включенных переменных. Признак, по которому определяют пропущенную переменную: Знак “+” у произведения оценки параметра при подозреваемой пропущенной переменной и коэффициента корреляции этой переменной с другими переменными, включенными в модель.
Выбранная модель с пропуском переменной :
, где
Тогда, применяя МНК для оценки усеченной модели получаем формулу смещения оценки ^
Экзогенную переменную относят к избыточным, если она по ошибке включена в эконометрическую модель. Включение избыточной переменной оказывает влияние на уменьшение точности (увеличение дисперсии) оценок параметров модели, что, в свою очередь, вызывает уменьшение t-статистик и коэффициента детерминации.
Если – избыточная, то коэффициент корреляции
, тогда
будет уменьшаться, а в соответствии с формулой
будет возрастать.
Замещающие переменные – обычно бывает полезно вместо пропущенной переменной, которую трудно измерить, использовать некоторый её заменитель.
4 основных качественных правила спецификации экономической модели:
1. Опираясь на эконометрическую теорию, следует ответить на вопрос: «Является ли переменная существенной в модели зависимости с эндогенной переменной?».
2. Осуществить проверку значимого отличия от нуля t-статистик.
3. Осуществить проверку, насколько значимо изменяется коэффициент детерминации при добавлении некоторой переменной в модель.
4. Существенно ли изменяются оценки других переменных после добавления новой переменной в модель.
Кроме отмеченных правил спецификации модели, наиболее из-вестны два следующих количественных критерия спецификации:
Критерий Рамсея (Ramsey):
RESET-тест Рамсея — это обобщенный тест на наличие следующих ошибок спецификации модели линейной регрессии:
- наличие пропущенных переменных. Регрессия содержит не все объясняющие переменные;
- неверная функциональная форма. Некоторые или все переменные должны быть преобразованы с помощью логарифмической, степенной, обратной или какой-либо другой функции;
- корреляция между фактором Х и случайной составляющей модели, которая может быть вызвана ошибками измерения факторов, рассмотрением систем уравнений или другими причинами.
Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение
1. Оценивается уравнение регрессии
2. Вычисляются степени оценок зависимой переменной
3. Оценивается уравнение регрессии с этими степенями
4. Проводится оценка улучшения по F-критерию
Ошибки такого рода приводят к смещению среднего остатков регрессионной модели.
1. Оценивают зависимость в соответствии с выбранной моделью по МНК:
2. Анализируют вид функциональной зависимости остатков и её номинальное приближение включают в модель.
3. Например, с учетом 2) вычисляют величины , конструируют новую модель:
и применяют для ее оценивания по МНК.
4) Сравнивают качество модели по отношению к модели с помощью F-критерия:
Если где M – число дополнительных переменных, включенных в модель ( M=3), k – число экзогенных переменных в то модель плохо специфицирована.
Недостаток: он указывает только на наличие ошибочной спец-ции модели, но не выявляет, сколько и какого рода переменную нужно добавить в модель.
Критерий Амемья (Amemiya):
Решающей функцией F-критерия служит:
Модель, для которой значение AF меньше, является лучше специфицированной.
Этот критерий минимизирует число экзогенных переменных.
Источник