ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ
ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА МАТЕМАТИКИ И ИНФОРМАТИКИ
ЛАБОРАТОРНАЯ РАБОТА
по эконометрике
Вариант № 1
Омск, 2010 г.
ПОСТАНОВКА ЗАДАЧИ
По данным, представленным в табл.1, изучается зависимость цены колготок от их плотности, состава и фирмы-производителя в торговых точках Москвы и Московской области весной 2006.
Таблица 1.
№ |
prise |
DEN |
polyamid |
lykra |
firm |
Y
|
X1
|
X2
|
X3
|
X4
|
1 |
49,36 |
20 |
86 |
14 |
0 |
2 |
22,51 |
20 |
97 |
3 |
1 |
3 |
22,62 |
20 |
97 |
3 |
1 |
4 |
59,89 |
20 |
90 |
17 |
0 |
5 |
71,94 |
30 |
79 |
21 |
0 |
6 |
71,94 |
30 |
79 |
21 |
0 |
7 |
89,9 |
30 |
85 |
15 |
1 |
8 |
74,31 |
40 |
85 |
13 |
1 |
9 |
77,69 |
40 |
88 |
10 |
1 |
10 |
60,26 |
40 |
86 |
14 |
1 |
11 |
111,19 |
40 |
82 |
18 |
0 |
12 |
73,56 |
40 |
83 |
14 |
1 |
13 |
84,61 |
40 |
84 |
16 |
0 |
14 |
49,9 |
40 |
82 |
18 |
1 |
15 |
89,9 |
40 |
85 |
15 |
0 |
16 |
96,87 |
50 |
85 |
15 |
0 |
17 |
39,99 |
60 |
98 |
2 |
1 |
18 |
49,99 |
60 |
76 |
24 |
0 |
19 |
49,99 |
70 |
83 |
17 |
1 |
20 |
49,99 |
70 |
88 |
10 |
1 |
21 |
49,99 |
70 |
76 |
24 |
0 |
22 |
49,99 |
80 |
42 |
8 |
1 |
23 |
129,9 |
80 |
50 |
42 |
0 |
24 |
84 |
40 |
82 |
18 |
0 |
25 |
61 |
20 |
86 |
14 |
0 |
26 |
164,9 |
30 |
16 |
30 |
1 |
27 |
49,9 |
40 |
82 |
18 |
1 |
28 |
89,9 |
30 |
85 |
15 |
1 |
29 |
129,9 |
80 |
50 |
42 |
0 |
30 |
89,9 |
40 |
86 |
14 |
1 |
31 |
105,5 |
40 |
85 |
15 |
1 |
32 |
79,9 |
15 |
88 |
12 |
1 |
33 |
99,9 |
20 |
88 |
12 |
1 |
34 |
99,9 |
30 |
73 |
25 |
1 |
35 |
119,9 |
20 |
85 |
12 |
1 |
36 |
109,9 |
20 |
83 |
14 |
1 |
37 |
59,9 |
20 |
86 |
14 |
0 |
38 |
79,9 |
40 |
82 |
18 |
0 |
39 |
82,9 |
20 |
86 |
14 |
0 |
40 |
111,8 |
40 |
82 |
18 |
0 |
41 |
83,6 |
40 |
82 |
18 |
0 |
42 |
60 |
20 |
86 |
14 |
0 |
43 |
80 |
40 |
82 |
18 |
0 |
44 |
90 |
50 |
76 |
24 |
0 |
45 |
120 |
70 |
74 |
26 |
0 |
Цена колготок – это зависимая переменная Y. В качестве независимых, объясняющих переменных выбраны: плотность (DEN) Х1
, содержание полиамида Х2
и лайкры Х3
, фирма-производитель Х4
.
Описание переменных содержится в таблице 2.
Требуется:
1.
Рассчитать матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов регрессии.
2.
Оценить статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверить с помощью F-критерия; оценить качество уравнения регрессии с помощью коэффициента детерминации.
Таблица 2.
Переменная |
Описание |
№ |
номер торговой точки |
price |
цена колготок в рублях |
DEN |
плотность в DEN |
polyamid |
содержание полиамида в % |
lykra |
содержание лайкры в % |
firm |
фирма-производитель: 0 - Sanpellegrino, 1 - Грация |
3.
Построить уравнение множественной регрессии только со статистически значимыми факторами.
4.
Отобразить графически исходные данные и расчетные значения.
РЕШЕНИЕ ЗАДАЧИ
1. Рассчитать матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов регрессии.
Сначала нужно отобрать факторы, которые должны войти в модель. Для этого строится матрица коэффициентов парной корреляции (табл.3.)
Таблица 3.
Y
|
X1
|
X2
|
X3
|
X4
|
Y |
1 |
X1 |
0,071711 |
1 |
X2 |
-0,55678 |
-0,42189 |
1 |
X3 |
0,607569 |
0,435579 |
-0,66726 |
1 |
X4 |
-0,12119 |
-0,10354 |
0,060901 |
-0,43912 |
1 |
Анализ показал, что независимые переменные Х2
(полиамид) и Х3
(лайкра) имеют тесную линейную связь с результативным фактором Y. Проверяем наличие мультипликативности: │ │= 0,66726. Считается, что две переменных явно коллинеарны, т.е. находятся между собой в линейной зависимости, если ≥ 0,7. Х2
и Х3
могут включаться в модель, т.к. мультипликативности нет. Х1
и Х4
в незначительной степени влияют на Y, их отбрасываем.
Коэффициенты множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов. Для упрощения работы эти коэффициенты можно получить в Excel с помощью отчета по регрессии. Получаем уравнение линейной модели: у = -0,476х1
-0,588х2
+2,245х3
+7,554х4
+ 104,163.
Это означает, что с увеличением лайкры в составе колготок на 1%, их цена поднимется на 2,245 у.е. А при увеличении полиамида в составе колготок на 1%, их цена упадет на 0,588 у.е.
2. Оценить статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверить с помощью F-критерия; оценить качество уравнения регрессии с помощью коэффициента детерминации.
Подставляя значения факторов Х в уравнение регрессии, вычисляем урасч
,а записываем ряд остатков, составляем таблицу 4.
Таблица 4.
№ |
prise |
polyamid |
lykra |
у расч. |
остатки |
Y
|
X2
|
X3
|
1 |
49,36 |
86 |
14 |
75,4920707 |
-26,1321 |
2 |
22,51 |
97 |
3 |
51,8771925 |
-29,3672 |
3 |
22,62 |
97 |
3 |
51,8771925 |
-29,2572 |
4 |
59,89 |
90 |
17 |
79,8758598 |
-19,9859 |
5 |
71,94 |
79 |
21 |
90,5623507 |
-18,6224 |
6 |
71,94 |
79 |
21 |
90,5623507 |
-18,6224 |
7 |
89,9 |
85 |
15 |
81,1152196 |
8,78478 |
8 |
74,31 |
85 |
13 |
71,8598003 |
2,4502 |
9 |
77,69 |
88 |
10 |
63,359152 |
14,33085 |
10 |
60,26 |
86 |
14 |
73,5171042 |
-13,2571 |
11 |
111,19 |
82 |
18 |
77,2971365 |
33,89286 |
12 |
73,56 |
83 |
14 |
75,2814724 |
-1,72147 |
13 |
84,61 |
84 |
16 |
71,6300376 |
12,97996 |
14 |
49,9 |
82 |
18 |
84,8513019 |
-34,9513 |
15 |
89,9 |
85 |
15 |
68,7964882 |
21,10351 |
16 |
96,87 |
85 |
15 |
64,0319222 |
32,83808 |
17 |
39,99 |
98 |
2 |
29,9853791 |
10,00462 |
18 |
49,99 |
76 |
24 |
84,769301 |
-34,7793 |
19 |
49,99 |
83 |
17 |
67,7240545 |
-17,7341 |
20 |
49,99 |
88 |
10 |
49,065454 |
0,924546 |
21 |
49,99 |
76 |
24 |
80,004735 |
-30,0147 |
22 |
49,99 |
42 |
8 |
66,8636812 |
-16,8737 |
23 |
129,9 |
50 |
42 |
130,949041 |
-1,04904 |
24 |
84 |
82 |
18 |
77,2971365 |
6,702864 |
25 |
61 |
86 |
14 |
75,4920707 |
-14,4921 |
26 |
164,9 |
16 |
30 |
155,377089 |
9,522911 |
27 |
49,9 |
82 |
18 |
84,8513019 |
-34,9513 |
28 |
89,9 |
85 |
15 |
81,1152196 |
8,78478 |
29 |
129,9 |
50 |
42 |
130,949041 |
-1,04904 |
30 |
89,9 |
86 |
14 |
73,5171042 |
16,3829 |
31 |
105,5 |
85 |
15 |
76,3506536 |
29,14935 |
32 |
79,9 |
88 |
12 |
79,7614203 |
0,13858 |
33 |
99,9 |
88 |
12 |
77,3791373 |
22,52086 |
34 |
99,9 |
73 |
25 |
110,626959 |
-10,727 |
35 |
119,9 |
85 |
12 |
79,1435056 |
40,75649 |
36 |
109,9 |
83 |
14 |
84,8106044 |
25,0894 |
37 |
59,9 |
86 |
14 |
75,4920707 |
-15,5921 |
38 |
79,9 |
82 |
18 |
77,2971365 |
2,602864 |
39 |
82,9 |
86 |
14 |
75,4920707 |
7,407929 |
40 |
111,8 |
82 |
18 |
77,2971365 |
34,50286 |
41 |
83,6 |
82 |
18 |
77,2971365 |
6,302864 |
42 |
60 |
86 |
14 |
75,4920707 |
-15,4921 |
43 |
80 |
82 |
18 |
77,2971365 |
2,702864 |
44 |
90 |
76 |
24 |
89,533867 |
0,466133 |
45 |
120 |
74 |
26 |
85,6718339 |
34,32817 |
Расчет остатков связан с тем, что изменение уi
будет неточно описываться изменением Х, поскольку присутствуют другие факторы, неучтенные в данной модели.
В Excel находим t-критерий для х2
и х3
. =-1,763; =3,270. Сравним с табличным (0,05;42)=2,023.
При │tрасч
│>tα
связь существует и коэффициент корреляции является статистически значимым. В данном случае значимым является только а3
. На практике на а2
(коэффициент содержания полиамида в составе колготок при определении цены) опираться не стоит, т.к. этот коэффициент не является статистически значимым.
Приступая к оценке значимости уравнения множественной регрессии через критерий Фишера, найдем Fрасч
(есть в отчете по регрессии)=9,589 и Fтабл
(0,05;2;42)=3,220. Т.к. Fрасч
> Fтабл
, то модель является в целом надежной и по ней можно строить прогноз.
Оценить коэффициенты регрессии можно также с помощью коэффициента детерминации R2
. В данном случае он равен 0,4895 (из отчета по регрессии). Это говорит о том, что 48,95% всех случайных изменений у зависят от х и объясняются регрессионной моделью и учтены в ряде остатков. Для практического применения модели это очень маленький процент, и от нее следует отказаться. Для множественной регрессии применяют также скорректированный коэффициент детерминации 1-(1-R2
) = 0,4385. Модель имеет низкую точность.
3. Построить уравнение множественной регрессии только со статистически значимыми факторами.
Ранее был сделан вывод о том, что плотность колготок (х1
) и фирма-производитель (х2
) незначительно влияют на изменение цены (у) продукции. Таким образом, эти факторы можно отбросить.
В п.2. данной работы был проведен анализ коэффициентов корреляции, который показал, что а2
– коэффициент фактора содержания полиамида в составе колготок (х2
) – не является статистически значимым. Его также отбрасываем.
Уравнение принимает вид: у = 2,245х3
+ 104,163.
Таким образом, наиболее значимым фактором в изменениях цены (у) является содержание лайкры в составе колготок (х3
).
4. Отобразить графически исходные данные и расчетные значения.
Для отображения графически исходные значения цены и рассчитанные по модели цены лучше всего использовать Excel (диаграммы).
|