Подпишись и читай
самые интересные
статьи первым!

Прогнозирование. Доверительный интервал прогноза

Расчеты и проверка достоверности полученных оценок коэффициентов регрессии не являются самоцелью, это лишь необходимый промежуточный этап. Основное – это использование модели для анализа и прогноза поведения изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в полученную формулу регрессии.

Используем полученное в примере 2.1 уравнение регрессии для прогноза объема товарооборота. Пусть намечается открытие магазина с численностью работников х =140 чел., тогда достаточно обоснованный объем товарооборота следует установить по уравнению ŷ (х )= –0,974 + 0,01924×140=1,72 млрд. руб.

Доверительный интервал для прогностического значения у (х )= a 0 +a 1 х определяется по формуле

где t p – критическая граница распределения Стьюдента с n – 2 степенями свободы, соответствующая уровню значимости р . Для получения доверительного интервала воспользуемся выражением (5.2).

Выберем уровень значимости 5%. Число степеней свободы у нас 8 – 2 = 6, тогда по таблице распределения Стьюдента (приложение 1) находим

t 0.05 (6)=2,447.s=Ö 0,008=0,089,

следовательно, с вероятностью 95% истинные значения объемов товарооборота будут лежать в пределах

1,72 – 2,447×0,048<y (x )<1,72+2,447×0,048, или 1,60<y (x )<1,84.

5.8. Практический блок

Пример. Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный и интервальный прогноз методом экстраполяции.

1 . Построить диаграмму рассеяния в EXCELи сделать предварительное заключение о наличии связи.

Таблица 5.6Диаграмма 5.1

x Y
2,1 29,5
2,9 34,2
3,3 30,6
3,8 35,2
4,2 40,7
3,9 44,5
5,0 47,2
4,9 55,2
6,3 51,8
5,8 56,7

Вывод: Из диаграммы 5.1 видно, что связь между факторами x и y

прямая сильная линейная связь .

2. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами х и у .

Таблица 5.7

xy
2,1 29,5 4,41 870,25 61,95 27,91 1,59 0,054
2,9 34,2 8,41 1169,64 99,18 33,46 0,74 0,022
3,3 30,6 10,89 936,36 100,98 36,23 -5,63 0,184
3,8 35,2 14,44 1239,04 133,76 39,69 -4,49 0,128
4,2 40,7 17,64 1656,49 170,94 42,47 -1,77 0,043
3,9 44,5 15,21 1980,25 173,55 40,39 4,11 0,092
5,0 47,2 2227,84 48,01 -0,81 0,017
4,9 55,2 24,01 3047,04 270,48 47,32 7,88 0,143
6,3 51,8 39,69 2683,24 326,34 57,02 -5,22 0,101
5,8 56,7 33,64 3214,89 328,86 53,55 3,15 0,056
ИТОГО: 42,2 193,34 19025,04 1902,04 0,840
Среднее зн. 4,22 42,56 19,334 1902,504 190,204

2.1.Проверим тесноту связи между факторами:

;

Вывод: связь сильная.

2.2.Проверим статистическую значимость по критерию Стьюдента:

1)Критерий Стьюдента: tвыб<=tкр

2)Н о: r=0 tкр=2,31

tвыб=rвыб*

Вывод: таким образом поскольку tвыб=5,84

90% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.

3. Полагая, что связь между факторами х и у может быть описана линейной функцией, используя процедуру метода наименьших квадратов, запишите систему нормальных уравнений относительно коэффициентов линейного уравнения регрессии. Любым способом рассчитайте эти коэффициенты.

Последовательно подставляя в уравнение регрессии из графы (2) табл.5.7, рассчитаем значения и заполним графу (7) табл.5.7.

4. Для полученной модели связи между факторами Х и У рассчитайте среднюю ошибку аппроксимации. Сделайте предварительное заключение приемлемости полученной модели.

Для расчета заполним 8-ую и 9-ую графу табл.5.7.

<Екр=12%

Вывод: модель следует признать удовлетворительной.

5 . Проверьте значимость коэффициента уравнения регрессии a 1 на основе t-критерия Стьюдента.

Решение: Таблица 5.8

2,1 29,5 27,91 2,5281 214,623 170,5636
2,9 34,2 33,46 0,5476 82,81 69,8896
3,3 30,6 36,23 31,6969 40,069 143,0416
3,8 35,2 39,69 20,1601 8,237 54,1696
4,2 40,7 42,47 3,1329 0,008 3,4596
3,9 44,5 40,39 16,8921 4,709 3,7636
47,2 48,01 0,6561 29,703 21,5296
4,9 55,2 47,32 62,0944 22,658 159,7696
6,3 51,8 57,02 27,2484 209,092 85,3776
5,8 56,7 53,55 9,9225 120,78 199,9396
ИТОГО: 42,2 425,6 426,1 174,8791 732,687 911,504
Среднее 4,22 42,56

Статистическая проверка:

Вывод: С доверительной вероятностью 90% коэффициент a 1 - статистически значим, т.е. нулевая гипотеза отвергается.

6. Проверьте адекватность модели (уравнения регрессии) в целом на основе F-критерия Фишера-Снедекора.

Процедура статистической проверки:

:модель не адекватна

Вывод: т.к. Fвыб.>Fкр., то с доверительной вероятностью 95% нулевая гипотеза отвергается (т.е. принимается альтернативная). Изучаемая модель адекватна и может быть использована для прогнозирования и принятия управленческих решений.

7. Рассчитайте эмпирический коэффициент детерминации.

(таб. 3)

Показывает долю вариации.

Вывод: т.е. 80% вариации объясняется фактором, включенным в модель, а 20% не включенными в модель факторами.

8. Рассчитайте корреляционное отношение. Сравните полученное значение с величиной линейного коэффициента корреляции.

Эмпирическое корреляционное отношение указывает на тесноту связи между двумя факторами для любой связи, если связь линейная, то , т.е. коэффициент корреляции совпадает с коэффициентом детерминации.

9 . Выполните точечный прогноз для .

10-12 . Рассчитайте доверительные интервалы для уравнения регрессии и для результирующего признака при доверительной вероятности =90%. Изобразите в одной системе координат:

а) исходные данные,

б) линию регрессии,

в) точечный прогноз,

г) 90% доверительные интервалы.

Сформулируйте общий вывод относительно полученной модели.

-математическое ожидание среднего.

Для выполнения интервального прогноза рассматриваем две области.

1) для y из области изменения фактора x доверительные границы для линейного уравнения регрессии рассчитывается по формуле:

2) для прогнозного значения доверительный интервал для рассчитывается по формуле:

Исходные данные:

2) t=2,31(таб.)

5) : 27,91 42,56 57,02 66,72

6) 19,334-4,22 2)=1,53.

Таблица 5.9

1 2,1 -2,12 4,49 3,03 1,74 2,31 4,68 18,81 27,91 9,10 46,72
4,22 0,00 0,00 0,1 0,32 2,31 4,68 3,46 42,56 39,10 46,02
6,3 2,08 4,33 2,93 1,71 2,31 4,68 18,49 57,02 38,53 75,51
7,7 3,48 12,11 9,02 2,31 4,68 32,43 66,72 34,29 99,15

Вывод: поскольку 90% точек наблюдения попало в 90% доверительный интервал, данная модель и ее доверительные границы могут использоваться для прогнозирования с 90% доверительной вероятностью.

Контрольные вопросы

1. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

2. Виды автокорреляции и их краткая характеристика.

3. Автокорреляция в остатках и порядок её обнаружения.

4. Виды автокорреляции в остатках.

5. Порядок использования критерия Дарбина-Уотсона.

6. Автокорреляция в исходных данных и порядок определения её наличия.

7. Методы устранения влияния автокорреляции на результаты прогнозирования.

8. Обобщенный метод наименьших квадратов (ОМНК).

9. Что понимается под гомоскедастичностью?

10. Как проверяется гипотеза о гомоскедастичности ряда остатков?

11. Оценка качества регрессии. Проверка адекватности и достоверности модели.

12. Значимость коэффициентов регрессии (критерий Стъюдента).

13. Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).

14. Коэффициенты и индексы корреляции. Мультиколлениарность.

15. Оценка значимости корреляции. Детерминация.

16. Средняя ошибка аппроксимации.

17. Принятие решений на основе уравнений регрессии.

18. В каких задачах эконометрики используется распределение Фишера?

19. Таблицы каких распределений используются при оценке качества линейной регрессии?

20. Каковы особенности практического применения регрессионных моделей?

21. Как осуществляется прогнозирование экономических показателей с использованием моделей линейной регрессии?

22. Как можно оценить «естественный» уровень безработицы с использованием модели линейной регрессии?

23. В каких случаях необходимо уточнение линейной регрессионной модели и как оно осуществляется?

24. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

Задания и задачи

1 . Имеются данные о деятельности крупнейших компаний США в 2006г.

№ п/п Чистый доход, млрд долл.США, у Оборот капитала, млрд долл. США, х 1 Использованный капитал, млрд долл. США, х 2 Числен­ность служа­щих, тыс.чел., х 3 Рыночная капитализация компании, млрд долл. США, х 4
0,9 31,3 18,9 43,0 40,9
1,7 13,4 13,7 64,7 40,5
0,7 4,5 18,5 24,0 38,9
1,7 10,0 4,8 50,2 38,5
2,6 20,0 21,8 106,0 37,3
1,3 15,0 5,8 96,6 26,5
4,1 137,1 99,0 347,0 37,0
1,6 17,9 20,1 85,6 36,8
6,9 165,4 60,6 745,0 36,3
0,4 2,0 1,4 4,1 35,3
1,3 6,8 8,0 26,8 35,3
1,9 27,1 18,9 42,7 35,0
1,9 13,4 13,2 61,8 26,2
1,4 9,8 12,6 212,0 33,1
0,4 19,5 12,2 105,0 32,7
0,8 6,8 3,2 33,5 32,1
1,8 27,0 13,0 142,0 30,5
0,9 12,4 6,9 96,0 29,8
1,1 17,7 15,0 140,0 25,4
1,9 12,7 11,9 59,3 29,3
-0,9 21,4 1,6 131,0 29,2
1,3 13,5 8,6 70,7 29,2
2,0 13,4 11,5 65,4 29,1
0,6 4,2 1,9 23,1 27,9
0,7 15,5 5.8 80,8 27,2

Рассчитайте матрицы парных коэффициентов корреляции и на их основе отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

Рассчитайте ошибки и доверительный интервал прогноза для
уровня значимости 5 или 10% (γ = 0,05; γ = 0,10).

2. Имеются данные о деятельности крупнейших компаний США в 2006г.

№ п/п Чистый доход, млрддолл. у Оборот капи­тала, млрддолл. США, х 1 Использованный капитал, млрддолл. х 2 Численность, тыс. чел., х 3
6,6 6,9 83,6 222,0
3,0 18.0 6,5 32,0
6,5 107,9 50,4 82,0
3,3 16,7 15,4 45,2
0,1 79,6 29,6 299,3
3,6 16,2 13,3 41,6
1,5 5,9 5,9 17,8
5,5 53,1 27,1 151,0
2,4 18,8 11,2 82,3
3,0 35,3 16,4 103,0
4,2 71,9 32,5 225,4
2,7 93,6 25,4 675,0
1,6 10,0 6,4 43,8
2,4 31,5 12,5 102,3
3,3 36,7 14,3 105,0
1,8 13,8 6,5 49,1
2,4 64,8 22,7 50,4
1,6 30,4 15,8 480,0
1,4 12,1 9,3 71,0
0,9 31,3 18,9 43,0

Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов.

Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности.

Рассчитайте матрицы парных и частных коэффициентов корреляции и на их основе отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (α = 0,05; α = 0,10).


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16

Получение оценок коэффициентов регрессии и проверка их достоверности не являются самоцелью, это лишь необходимый промежуточный этап. Основное – это использовать модель для анализа и прогноза значений изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в полученную формулу регрессии.

Используем полученное в примере 1.1 (прил.4) уравнение регрессии для прогноза объема товарооборота. Если намечается открыть магазин с численностью работников х =140 чел., то обоснованный объем товарооборота устанавливается по уравнению ŷ (х )= –0,974 + 0,01924×140=1,72 млрд. рублей.

Доверительный интервал для прогноза значения у (х )=a 0 +a 1 х определяется по формуле

где t p – критическая граница распределения Стьюдента с n – 2 степенями свободы, соответствующая уровню значимости р . Для получения доверительного интервала воспользуемся выражением (2.2).

Выберем уровень значимости 5%. Количество степеней свободы у нас 8 – 2 = 6, тогда по таблице распределения Стьюдента (приложение 1) находим

t 0.05 (6)=2,447.s= =0,089,

следовательно, с вероятностью 95% истинные значения объемов товарооборота будут лежать в пределах

1,72 – 2,447×0,048<y (x )<1,72+2,447×0,048, или 1,60<y (x )<1,84.

2.8. Практический блок

Пример. Построить уравнение регрессии между заданными переменными, проверить её адекватность, сделать прогноз методом экстраполяции.

1 . Построить диаграмму рассеяния в EXCELи сделать заключение о наличии корреляции.

Таблица 2.6Диаграмма 2.1

Y x
29,5 2,1
34,2 2,9
30,6 3,3
35,2 3,8
40,7 4,2
44,5 3,9
47,2 5,0
55,2 4,9
51,8 6,3
56,7 5,8

Из диаграммы 2.1 видно, что между переменнымиx и y имеется сильная линейная связь .

Таблица2.7

xy
29,5 2,1 61,95 4,41 870,25 27,91 0,054 1,59
34,2 2,9 99,18 8,41 1169,64 33,46 0,022 0,74
30,6 3,3 100,98 10,89 936,36 36,23 0,184 -5,63
35,2 3,8 133,76 14,44 1239,04 39,69 0,128 -4,49
40,7 4,2 170,94 17,64 1656,49 42,47 0,043 -1,77
44,5 3,9 173,55 15,21 1980,25 40,39 0,092 4,11
47,2 5,0 2227,84 48,01 0,017 -0,81
55,2 4,9 270,48 24,01 3047,04 47,32 0,143 7,88
51,8 6,3 326,34 39,69 2683,24 57,02 0,101 -5,22
56,7 5,8 328,86 33,64 3214,89 53,55 0,056 3,15
ИТОГО: 42,2 1902,04 193,34 19025,04 0,840
Среднее 42,6 4,22 190,204 19,334 1902,504

2.1.Теснота связи между переменными:

;

Вывод: сильная связь.

2.2.Проверим по критерию Стьюдента статистическую значимость:

По критерию Стьюдента: t выб <=t кр

Гипотеза Н о: r=0,t кр =2,31,

t выб =r выб *

Так какt выб =5,84сильную линейную связь.

3. Записать систему нормальных уравнений для коэффициентов линейной регрессии. Используя метод наименьших квадратов, рассчитайте эти коэффициенты.

Подставляя в найденное уравнение регрессии значения (графа (3) табл.2.7), рассчитаем значения (графа (7) табл.2.7).

4. Для полученного уравнения регрессии между Х и У рассчитать среднюю ошибку аппроксимации. Сделать заключение об адекватности полученной модели.

Заполним 8-ю и 9-ю графу табл.2.7.

<Екр=12%

Модель признается удовлетворительной.

5 . Проверить значимость коэффициента a 1 уравнения регрессии, используя критерий Стьюдента.

Решение: Таблица 2.8

29,5 2,1 27,91 214,623 2,5281 170,564
34,2 2,9 33,46 82,81 0,5476 69,8896
30,6 3,3 36,23 40,069 31,6969 143,0416
35,2 3,8 39,69 8,237 20,1601 54,1696
40,7 4,2 42,47 0,008 3,1329 3,46
44,5 3,9 40,39 4,709 16,8921 3,7636
47,2 48,01 29,703 0,6561 21,5296
55,2 4,9 47,32 22,658 62,0944 159,7696
51,8 6,3 57,02 209,092 27,2484 85,3776
56,7 5,8 53,55 120,78 9,9225 199,9396
ИТОГО: 425,6 42,2 426,1 732,687 174,8791 911,504
Среднее 42,56 4,22

Статистическая проверка:

Выводы: С доверительной вероятностью 0.9 коэффициент a 1 является статистически значимым, таким образом, гипотеза отвергается.

6. Проверить адекватность уравнения регрессии в целом, применив F-критерий Фишера-Снедекора.

Статистическая проверка:

:модель не адекватна

Так какF выб >F кр, то отвергается гипотеза (принимается альтернативная)с доверительной вероятностью 0.95. Данная модель адекватна и может использоваться для прогнозирования при принятии управленческих решений.

(таб. 2.8).

Доля вариации.

Таким образом, 80% вариации объясняемой переменной объясняется включенным в модель фактором, а 20% факторами, не включенными в модель.

Тесноту связи между переменными для произвольной связи показывает эмпирическое корреляционное отношение, при линейной связи , и коэффициент корреляции равен коэффициенту детерминации.

9 . Выполнить точечный прогноз для .

Исходные данные,

Точечный прогноз,

Линию регрессии,

90% доверительные интервалы.

Сформулировать общие выводы относительно полученной регрессионной модели.

-математическое ожидание среднего.

Чтобы выполнить интервальный прогноз рассмотрим две области.

а) доверительные границы уравнения регрессии дляy из области значений переменнойx рассчитаем по формуле:

б) для прогнозных значений доверительный интервал для рассчитаем по формуле:

Имеем:n=10, t=2,31(таб. Приложение 1),

19,334-4,22 2)=1,53.

: 27,9; 42,6; 57,0; 66,7

Таблица 2.9

1 2,1 -2,12 1,74 3,03 4,49 2,31 4,68 27,9 18,81 9,10 46,72
4,22 0,00 0,32 0,1 0,00 2,31 4,68 42,6 3,46 39,10 46,02
6,3 2,08 1,71 2,93 4,33 2,31 4,68 57,0 18,49 38,53 75,51
7,7 3,48 9,02 12,11 2,31 4,68 66,7 32,43 34,29 99,15

Т.к. 90% точек наблюдения находится в 90% - доверительном интервале, данная модель с ее доверительными границами может использоваться для прогнозирования с доверительной вероятностью 0,9.

Контрольные вопросы

1. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

2. Виды автокорреляции и их краткая характеристика.

3. Автокорреляция в остатках и порядок её обнаружения.

4. Виды автокорреляции в остатках.

5. Порядок использования критерия Дарбина-Уотсона.

6. Автокорреляция в исходных данных и порядок определения её наличия.

7. Методы устранения влияния автокорреляции на результаты прогнозирования.

8. Обобщенный метод наименьших квадратов (ОМНК).

9. Что понимается под гомоскедастичностью?

10. Как проверяется гипотеза о гомоскедастичности ряда остатков?

11. Оценка качества регрессии. Проверка адекватности и достоверности модели.

12. Значимость коэффициентов регрессии (критерий Стъюдента).

13. Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).

14. Коэффициенты и индексы корреляции. Мультиколлениарность.

15. Оценка значимости корреляции. Детерминация.

16. Средняя ошибка аппроксимации.

17. Принятие решений на основе уравнений регрессии.

18. В каких задачах эконометрики используется распределение Фишера?

19. Таблицы каких распределений используются при оценке качества линейной регрессии?

20. Каковы особенности практического применения регрессионных моделей?

21. Как осуществляется прогнозирование экономических показателей с использованием моделей линейной регрессии?

22. Как можно оценить «естественный» уровень безработицы с использованием модели линейной регрессии?

23. В каких случаях необходимо уточнение линейной регрессионной модели и как оно осуществляется?

24. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

Задания и задачи

1 . Имеются данные о показателях деятельности компаний США в 2006г.

№ п/п Чистая прибыль, млрд$,у Использованный капитал, млрд $,х 1 Оборот капитала, млрд$,х 2 Капитализация компании, млрд$, х 4 Числен­ность сотрудников, тыс.чел., х 3
0,9 18,9 31,3 40,9 43,0
1,7 13,7 13,4 40,5 64,7
0,7 18,5 4,5 38,9 24,0
1,7 4,8 10,0 38,5 50,2
2,6 21,8 20,0 37,3 106,0
1,3 5,8 15,0 26,5 96,6
4,1 99,0 137,1 37,0 347,0
1,6 20,1 17,9 36,8 85,6
6,9 60,6 165,4 36,3 745,0
0,4 1,4 2,0 35,3 4,1
1,3 8,0 6,8 35,3 26,8
1,9 18,9 27,1 35,0 42,7
1,9 13,2 13,4 26,2 61,8
1,4 12,6 9,8 33,1 212,0
0,4 12,2 19,5 32,7 105,0
0,8 3,2 6,8 32,1 33,5
1,8 13,0 27,0 30,5 142,0
0,9 6,9 12,4 29,8 96,0
1,1 15,0 17,7 25,4 140,0
1,9 11,9 12,7 29,3 59,3
-0,9 1,6 21,4 29,2 131,0
1,3 8,6 13,5 29,2 70,7
2,0 11,5 13,4 29,1 65,4
0,6 1,9 4,2 27,9 23,1
0,7 5.8 15,5 27,2 80,8

2. Имеются данные о показателях деятельности компаний США в 2009г.

№ п/п Чистая прибыль, млрд $, у Использованный капитал, млрд $.х 1 Оборот капи­тала, млрд$, х 2 Численность, тыс. чел., х 3
6,6 83,6 6,9 222,0
3,0 6,5 18.0 32,0
6,5 50,4 107,9 82,0
3,3 15,4 16,7 45,2
0,1 29,6 79,6 299,3
3,6 13,3 16,2 41,6
1,5 5,9 5,9 17,8
5,5 27,1 53,1 151,0
2,4 11,2 18,8 82,3
3,0 16,4 35,3 103,0
4,2 32,5 71,9 225,4
2,7 25,4 93,6 675,0
1,6 6,4 10,0 43,8
2,4 12,5 31,5 102,3
3,3 14,3 36,7 105,0
1,8 6,5 13,8 49,1
2,4 22,7 64,8 50,4
1,6 15,8 30,4 480,0
1,4 9,3 12,1 71,0
0,9 18,9 31,3 43,0

Вопрос 4. Доверительные интервалы прогноза. Оценка адекватности и точности моделœей

Заключительным этапом применения кривых роста яв­ляется экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t , соответ­ствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени опреде­ляется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желатель­но определить границы возможного изменения прогнозируемого по­казателя, задать «вилку» возможных значений прогнозируемого пока­зателя, ᴛ.ᴇ. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста͵ может быть вызвано:

1) субъективной ошибочностью выбора вида кривой;

2) погрешностью оценивания параметров кривых;

3) погрешностью, связанной с отклонением отдельных наблю­дений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, мо­жет быть отражена в виде доверительного интервала прогноза. До­верительный интервал, учитывающий неопределœенность, связанную с положением тренда, и возможность отклонения от этого тренда, опре­деляется в виде:

, (5.26)

где п - длина временного ряда;

L - период упреждения; - точечный прогноз на момент n+L ;

t a - значение t -статистики Стьюдента;

S p - средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содер­жат погрешность. Погрешность параметра а 0 приводит к вертикально­му сдвигу прямой, погрешность параметра а 1 изменению угла на­клона прямой относительно оси абсцисс. С учетом разброса кон­кретных реализаций относительно линий тренда, дисперсию S 2 p можно представить в виде:

, (5.27)

где: S y 2 -дисперсия отклонений фактических наблюдений от расчетных;

t l - время упреждения, для которого делается экстраполяция, t l = n + L ;

t - порядковый номер уровней ряда, t =1, 2,..., п ;

Порядковый номер уровня, стоящего в серединœе ряда, ;

Тогда доверительный интервал можно представить в виде:

. (5.28)

Обозначим корень в выражении (5.28) через К . Значение К за­висит только от п и L , ᴛ.ᴇ. от длины ряда и периода упреждения. По этой причине можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

. (5.29)

Выражение, аналогичное (5.28), можно получить для полинома второго порядка:

(5.30)

. (5.31)

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:

, (5.32)

где: y t - фактические значения уровней ряда,

Расчетные значения уровней ряда,

п - длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома. Чем выше степень полинома, тем шире доверительный интер­вал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствую­щих параметров уравнения.

Рис. 5.4. Доверительные интервалы прогноза для линœейного тренда

Доверительные интервалы прогнозов, полученных с использо­ванием уравнения экспоненты, определяют аналогичным образом. От­личие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме бывают определœены доверительные ин­тервалы для ряда кривых, имеющих асимптоты, в случае, если значе­ние асимптоты известно (к примеру, для модифицированной экспонен­ты).

В таблице 5.4 приведены значения К* в зависимости от длины временного ряда п и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (п ) значения К* умень­шаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений п : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L .

Таблица 5.4

Значения К* для оценки доверительных интервалов прогноза на основе линœейного тренда и параболического тренда при доверительной вероятности 0,9 (7)

Одна из основных задач, возникающих при экстраполяции тренда, заключается в определении доверительных интервалов прогноза. Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень -- время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Следовательно, при построении доверительного интервала прогноза следует учесть оценку колеблемости или вариации уровней ряда. Обычно такой оценкой является среднее квадратическое отклонение (стандартное отклонение) фактических наблюдений от расчетных, полученных при выравнивании динамического ряда.

Прежде чем приступить к определению доверительного интервала прогноза, необходимо сделать оговорку о некоторой условности рассматриваемого ниже расчета. То, что следует далее, является в некоторой мере произвольным перенесением результатов, найденных для регрессии выборочных показателей, на анализ динамических рядов. Дело в том, что предположение регрессионного анализа о нормальности распределения отклонений вокруг линии регрессии не может, по существу, безоговорочно утверждаться при анализе динамических рядов.

Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал для тренда определяется как

  • ? расчетное значение yt;

Если t = i + L то уравнение определит значение доверительного интервала для тренда, продленного на L единиц времени.

Доверительный интервал для прогноза, очевидно, должен учитывать не только неопределенность, связанную с положением тренда, но возможность отклонения от этого тренда. В практике встречаются случаи, когда более или менее обоснованно для экстраполяции можно применить несколько типов кривых. При этом рассуждения иногда сводятся к следующему. Поскольку каждая из кривых характеризует один из альтернативных трендов, то очевидно, что пространство между экстраполируемыми трендами и представляет собой некоторую “естественную доверительную область” для прогнозируемой величины. С таким утверждением нельзя согласиться. Прежде всего потому, что каждая из возможных линий тренда отвечает некоторой заранее принятой гипотезе развития. Пространство же между трендами не связано ни с одной из них -- через него можно провести неограниченное число трендов. Следует также добавить, что доверительный интервал связан с некоторым уровнем вероятности выхода за его границы. Пространство между трендами не связано ни с каким уровнем вероятности, а зависит от выбора типов кривых. К тому же при достаточно продолжительном периоде упреждения это пространство, как правило, становится настолько значительным, что подобный “доверительный интервал” теряет всякий смысл.

При условии учета стандартных ошибок оценок параметров уравнения тренда (которые по определению являются выборочными, а следовательно, могут не являться оценками неизвестных генеральных параметров из-за проявления случайной ошибки репрезентативности), и не рассматривая последовательность преобразований получим общую формулу доверительного интервала прогноза.

где - значение прогноза, рассчитанного по уравнению тренда на период t+L

Средняя квадратическая ошибка тренда;

К - коэффициент, учитывающий ошибки коэффициентов уравнения тренда

Значение t-статистики Стьюдента.

Коэффициент К рассчитывается следующим образом

n ? число наблюдений (длина ряда динамики);

L - число прогнозов

Значение К зависит только от п и L, т. е. продолжительности наблюдения и периода прогнозирования.

Если при анализе развития объекта прогноза есть основания принять два базовых допущения экстраполяции, о которых мы говорили выше, то процесс экстраполяции заключается в подстановке соответствующей величины периода упреждения в формулу, описывающую тренд.

Экстраполяция, вообще говоря, дает точечную прогностическую оценку. Интуитивно ощущается недостаточность такой оценки и необходимость получения интервальной оценки с тем, чтобы прогноз, охватывая некоторый интервал значений прогнозируемой переменной, был бы более надежным. Как уже сказано выше, точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, - явление маловероятное. Соответствующая погрешность имеет следующие источники:

1) выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной или тем более наилучшей для экстраполяции в данных конкретных условиях;

2) оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а следовательно, и ее положению в пространстве свойственна некоторая неопределенность;

3) тренд характеризует некоторый средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.

Погрешность, связанная со вторым и третьим ее источником, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный экстраполяционный прогноз преобразуется в интервальный.

Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения прогноза.

Одна из основных задач, возникающих при экстраполяции тренда, заключается в определении доверительных интервалов прогноза. Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень - время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Следовательно, при построении доверительного интервала прогноза следует учесть оценку колеблемости или вариации уровней ряда. Обычно такой оценкой является среднее квадратическое отклонение (стандартное отклонение) фактических наблюдений от расчетных, полученных при выравнивании динамического ряда.

Прежде чем приступить к определению доверительного интервала прогноза, необходимо сделать оговорку о некоторой условности рассматриваемого ниже расчета. То, что следует далее, является в некоторой мере произвольным перенесением результатов, найденных для регрессии выборочных показателей, на анализ динамических рядов. Дело в том, что предположение регрессионного анализа о нормальности распределения отклонений вокруг линии регрессии не может, по существу, безоговорочно утверждаться при анализе динамических рядов.

Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал для тренда определяется как

где ¾ средняя квадратическая ошибка тренда;

¾ расчетное значение yt ;

¾ значение t -статистики Стьюдента.

Если t = i + L то уравнение определит значение доверительного интервала для тренда, продленного на L единиц времени.

Доверительный интервал для прогноза, очевидно, должен учитывать не только неопределенность, связанную с положением тренда, но возможность отклонения от этого тренда. В практике встречаются случаи, когда более или менее обоснованно для экстраполяции можно применить несколько типов кривых. При этом рассуждения иногда сводятся к следующему. Поскольку каждая из кривых характеризует один из альтернативных трендов, то очевидно, что пространство между экстраполируемыми трендами и представляет собой некоторую “естественную доверительную область” для прогнозируемой величины. С таким утверждением нельзя согласиться. Прежде всего потому, что каждая из возможных линий тренда отвечает некоторой заранее принятой гипотезе развития. Пространство же между трендами не связано ни с одной из них - через него можно провести неограниченное число трендов. Следует также добавить, что доверительный интервал связан с некоторым уровнем вероятности выхода за его границы. Пространство между трендами не связано ни с каким уровнем вероятности, а зависит от выбора типов кривых. К тому же при достаточно продолжительном периоде упреждения это пространство, как правило, становится настолько значительным, что подобный “доверительный интервал” теряет всякий смысл.

При условии учета стандартных ошибок оценок параметров уравнения тренда (которые по определению являются выборочными, а следовательно, могут не являться оценками неизвестных генеральных параметров из-за проявления случайной ошибки репрезентативности), и не рассматривая последовательность преобразований получим общую формулу доверительного интервала прогноза.

где - значение прогноза, рассчитанного по уравнению тренда на период t+L

¾ средняя квадратическая ошибка тренда;

К - коэффициент, учитывающий ошибки коэффициентов уравнения тренда

¾ значение t -статистики Стьюдента.

Коэффициент К рассчитывается следующим образом

n ¾ число наблюдений (длина ряда динамики);

L – число прогнозов

Значение К зависит только от п и L, т. е. продолжительности наблюдения и периода прогнозирования.

Пример расчета прогноза и построения доверительного интервала прогноза.

Оптимальным трендом является линейный тренд . Необходимо рассчитать прогнозы объемов импорта в Германии на 1996 и 1997 год. Для этого необходимо определить значения уровней тренда при значениях временного фактора 14 и 15.

Объем импорта в 1996 г:

Объем импорта в 1997 г:

Стандартная ошибка тренда Sy = 30,727. Коэффициент доверия распределения Стъюдента при уровне значимости 0,05 и числе степеней свобод равен 2,16. Коэффициент К равен 1,428:

Таким образом, нижняя граница первого доверительного интервала равна 378,62: 473,452-30,727*2,16*1,428.

Верхняя граница равна 568,28: 473,452+30,727*2,16*1,428.

Результаты расчетов необходимо оформить в виде таблице и графически

Фактическое значение объема импорта в Германии за 1996 год

Прогнозное значение объема импорта в Германии за 1996 год

Нижняя граница 95% доверительного интервала

Фактическое значение объема импорта в Германии за 1997 год

Прогнозное значение объема импорта в Германии за 1997 год

Верхняя граница 95% доверительного интервала

Данный график рисуется следующим образом:

1) необходимо сделать копию уже существующего графика сглаживания динамического ряда линейным трендом

2) дорисовать недостающие значения (фактические уровни ряда за 1996 и 1997 год, прогнозы на 1996 и 1997 год, а также границы доверительных интервалов).

График в какой-то степени условный, так как точный масштаб вряд ли удастся выставить. Рисовать можно как от руки, так и используя инструменты рисования Excel.



Включайся в дискуссию
Читайте также
Определение места отбывания наказания осужденного
Осужденному это надо знать
Блатной жаргон, по фене Как относятся к наркоторговцам в тюрьме