7.3. Оценка качества эконометрических регрессионных моделей и прогнозирование на их основе
О качестве моделей регрессии можно судить также по значениям коэффициента корреляции (индекса корреляции) и коэффициента детерминации для однофакторной модели и по значениям коэффициента множественной корреляции и совокупного коэффициента детерминации для моделей множественной регрессии. Формулы расчета этих коэффициентов приведены в § 7.2. Чем ближе абсолютные величины указанных коэффициентов к 1, тем теснее связь между изучаемым признаком и выбранными факторами и, следовательно, с тем большей уверенностью можно судить об адекватности построенной модели, включающей в себя наиболее влияющие факторы.
Для оценки точности регрессионных моделей обычно используются те же статистические критерии точности, что и для трендовых моделей, в частности, средняя относительная ошибка аппроксимации (см. формулу (5.14)). Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение этого критерия со степенями свободы vi = ra-lHV2 = ra-m-l, где п — количество наблюдений и т — число включенных в модель факторов, больше табличного значения критерия Фишера при заданном уровне значимости, то модель признается значимой.При проверке качества регрессионной модели целесообразно оценить также значимость коэффициентов регрессии. Эта оценка проводится по ^-статистике Стьюдента путем проверки гипотезы о равенстве нулю k-ro коэффициента регрессии (k — 1,2,..., т). Расчетное значение ^-критерия с числом степеней свободы (п - т - 1) находят путем деления k-ro коэффициента регрессии на среднеквадратическое отклонение этого коэффициента, которое в свою очередь вычисляется как квадратный корень из произведения несмещенной оценки дисперсии остаточной компоненты и k-ro диагонального элемента матрицы, обратной матрице системы нормальных уравнений относительно параметров модели. Это расчетное значение сравнивается с табличным значением критерия Стьюдента при заданном уровне значимости, и если оно больше табличного значения, коэффициент регрессии считается значимым. В противном случае соответствующий данному коэффициенту регрессии фактор следует исключить из модели, при этом качество модели не ухудшится.
Перейдем к вопросу экономического прогнозирования на основе модели регрессии, при этом будем предполагать, что модель, построенная на базе временных рядов изучаемого показателя и включенных в модель факторов, является адекватной и достаточно точной. При использовании построенной модели для прогнозирования делается также предположение о сохранении существовавших ранее взаимосвязей переменных и на период упреждения.
Для прогнозирования зависимой переменной (результативного признака) на L шагов вперед необходимо знать прогнозные значения всех входящих в модель факторов. Эти значения могут быть получены на основе экстраполяци- онных методов, например, с использованием средних абсолютных приростов факторных признаков; они могут быть также определены методами экспертных оценок или непосредственно заданы исследователем экономического процесса.
Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.Для определения области возможных значений результативного показателя при известных значениях факторов, т.е. доверительного интервала прогноза, необходимо учитывать два возможных источника ошибок. Ошибки первого рода вызываются рассеиванием наблюдений относительно линии регрессии, и их можно учесть, в частности, величиной сред- неквадратической ошибки аппроксимации изучаемого показателя с помощью регрессионной модели. Обозначим эту величину Sy и вычислим ее по формуле, аналогичной (5.15).
Ошибки второго рода обусловлены тем, что в действительности жестко заданные в модели коэффициенты регрессии являются случайными величинами, распределенными по нормальному закону. Эти ошибки учитываются вводом поправочного коэффициента при расчете ширины доверительного интервала; формула для его расчета включает табличное значение t-статистики при заданном уровне значимости и зависит от вида регрессионной модели.
Для линейной однофакторной модели, общий вид которой имеет структуру, аналогичную (7.1), величина отклонения от линии регрессии задается выражением (обозначим его R):
Щп,Ь,а) = 8діа^ + і/п + (хп+1-х)21^(х(-х)2. (7.14)
Здесь п — число наблюдений, L — количество шагов вперед, а — уровень значимости прогноза, xt — наблюдаемое значение факторного признака в момент t, х — среднее значение наблюдаемого фактора, xn+L — прогнозное значение фактора на L шагов вперед.
Таким образом, для рассматриваемой модели формула расчета нижней и верхней границ доверительного интервала прогноза имеет вид:
Uy =yn+L±R(n,L, а), (7.15)
где yn+L означает точечную прогнозную оценку изучаемого результативного показателя по модели на L шагов вперед.
Вопросы и задания 1.
Дайте общее понятие эконометрической модели. Какие виды эконометрических моделей вы знаете? 2.
Чем вызывается явление мультиколлинеарности в многофакторных эконометрических моделях? Как это явление сказывается на качестве моделей и как оно устраняется? 3.
Какие задачи экономического анализа решаются на основе эконометрических моделей регрессии? 4.
Раскройте экономическую интерпретацию коэффициентов парной и множественной корреляции, коэффициентов детерминации, совокупных коэффициентов детерминации. 5.
Поясните экономический смысл коэффициента эластичности и бета-коэффициента. 6.
На основании каких коэффициентов можно проанализировать влияние отдельных факторов в линейных моделях множественной регрессии? 7.
Каким образом может быть оценено качество линейных моделей регрессии? 8.
Раскройте суть получения точечных и интервальных прогнозных значений результативного показателя на основе регрессионных моделей.
Упражнения
1. Данные опроса восьми групп семей о расходах на продукты питания в зависимости от уровня доходов семьи приведены в таблице (числа относительные в расчете на 100 руб. дохода и расхода): Доходы семьи (х) 1,4 3,3 5,5 7,6 9,8 12,0 14,7 18,9 Расходы на продукты питания (у) 1Д 1,4 2,0 2,4 2,8 3,1 3,5 4,0 Требуется: 1)
рассчитать коэффициент корреляции и оценить тесноту связи между доходами семьи и расходами на продукты питания; 2)
построить линейную однофакторную модель зависимости расходов на питание от дохода семьи; 3)
рассчитать коэффициент детерминации, коэффициент эластичности и бета-коэффициент и пояснить их экономический смысл; 4)
найти среднюю по модулю относительную ошибку аппроксимации и оценить точность построенной регрессионной модели.
2. Результаты обследования десяти статистически однородных филиалов фирмы приведены в таблице (цифры условные): № филиала Производительность труда (у) Фондововоору- женность (х,) Энерговооруженность (х2) 1 74 33 56 2 84 34 58 3 73 36 67 4 93 35 70 5 56 33 73 6 71 37 77 7 117 39 78 8 111 42 99 9 135 43 93 10 125 44 96 Требуется: 1)
рассчитать парные коэффициенты корреляции и пояснить их экономический смысл; 2)
найти коэффициент множественной корреляции и совокупный коэффициент детерминации и охарактеризовать степень совместного влияния факторов фондовооруженности и энерговооруженности на производительность труда; 3)
построить модель множественной линейной регрессии производительности труда от факторов фондо- и энерговооруженности; 4)
рассчитать частные коэффициенты корреляции, детерминации, эластичности и частные бета-коэффициенты и с их помощью оценить влияние отдельных факторов (при неизменном значении других).