Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови icon

Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови


Скачать 79.41 Kb.
НазваниеБагатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови
Размер79.41 Kb.
ТипДокументы

Багатофакторна регресія


1 Сутність багатофакторної регресії та порядок її побудови

2 Передумови застосування методу найменших квадратів (матрична форма для багатофакторної регресії)

3 Оцінка параметрів методом найменших квадратів

4 Властивості оцінок параметрів

5 Дисперсійний аналіз економетричної моделі

5.1 Побудова економетричної моделі на основі покрокової регресії

5.2 Множинний коефіцієнт кореляції і детермінації

5.3 Перевірка значущості і довірчі інтервали


1 Сутність багатофакторної регресії та порядок її побудови

На практиці економічний процес змінюється під впливом багатьох різноманітних факторів, які треба вміти виявити та оцінити. Якщо повернутися до прикладу практичних занять, то було б дуже великим спрощенням вважати, що обсяг випуску продукції залежить лише від вартості основних засобів. Існує багато інших дуже важливих і впливових показників.

Явний вигляд залежності досліджувального показника від декількох факторів, що впливають на його зміну, а також кількісно оцінити цей вплив, допомагає знайти багатофакторний регресійний аналіз.

Більшість розрахунків є досить складними, тому доречним є використання обчислювальної техніки. Тому побудова та аналіз багатофакторних регресійних моделей базується на сучасних пакетах прикладних програм. Однак економіст повинен уміти самостійно проводити основні розрахунки, а крім того – аналізувати отримані результати, робити за ними висновки, вміти оцінити найкращу модель для взаємозв’язку вихідних даних та побудувати прогноз.

Розрізняють регресійні моделі узагальнені та вибіркові. Узагальнена модель – це модель, які дійсна для всієї генеральної сукупності. Невідомі параметри узагальненої моделі є константами, а випадкова величина – не спостережувана, і ми можемо зробити тільки припущення відповідно до закону її розподілу. На відміну від узагальненої, вибіркова модель будується для певної вибірки; невідомі параметри випадкової моделі є випадковими величинами, математичне сподівання яких дорівнює параметрам узагальненої моделі (випадок класичної лінійної регресії), випадкові величини (помилки) можна оцінити, виходячи з вибіркових даних.

Узагальнена багатофакторна лінійна регресійна модель може бути записана у такому вигляді:


,


де у – залежна змінна;

хі – незалежні змінні (фактори);

αі – параметри моделі (константи) узагальненої моделі;

u – неспостережувана випадкова величина.


Вибіркова лінійна багатофакторна модель має такий вигляд:


,


де у – залежна змінна;

хі – незалежні змінні (фактори);

аі – оцінки невідомих параметрів, які потрібно оцінити;

u – випадкова величина (помилка).


Крім того, багатофакторна регресійна економетрична модель може бути записана в матричній формі:

Y = XA + U,

де Y – вектор значень залежної змінної розміром n (n – кількість спостережень вибіркового обстеження);

X – матриця незалежних змінних розміром n×(m+1) (m – кількість незалежних змінних). В перший стовпець цієї матриці ставлять одиниці у випадку, коли модель, що будується, повинна містити вільний член а0;

A – вектор оцінок параметрів моделі розміром m;

U – вектор залишків розміром m.


Процес побудови багатофакторної регресійної моделі більш складний, ніж процес побудови простої лінійної регресії. Він складається з декількох етапів. Розглянемо основні з них.

  1. Вибір та аналіз усіх можливих факторів, які впливають на процес (або показник), що вивчається.

  2. Вимір та аналіз обраних факторів.

  3. Математико-статистичний аналіз факторів.

  4. Вибір методу та побудова регресійної багатофакторної моделі.

  5. Оцінка невідомих параметрів регресійної моделі.

  6. Перевірка моделі на адекватність.

  7. Розрахунок основних характеристик та побудова інтервалів довіри.

  8. Аналіз отриманих результатів, висновки, прогноз.

Розглянемо кожен з етапів побудови та аналізу багатофакторної регресійної моделі докладно.

  1. Вибір та аналіз усіх можливих факторів, які впливають на процес (або показник), що вивчається. На цьому етапі необхідно зрозуміти економічний процес, який вивчається, розглянути його з макроекономічних та мікроекономічних позицій; виявити якомога більше факторів, які в конкретному випадку можуть справити суттєвий або несуттєвий вплив на його зміну. На цьому етапі можуть знадобитися поради практиків, які працюють в галузі, що вивчається, і т. і. Тільки після окреслення множини факторів, можна переходити до другого етапу.

  2. Вимір та аналіз знайдених факторів. На етапі кількісного аналізу дослідник повинен оцінити можливість кількісного вираження відібраних факторів, провести вимірювання або зібрати статистику для кількісних факторів; підібрати або розробити балову шкалу оцінок для якісних даних. Якщо деякі фактори неможливо кількісно виразити, наприклад, імідж продукції у населення, їх треба вилучити з подальшого розгляду. Крім того можуть бути вилучені фактори, за якими нема статистики або вона недоступна. Після того, як усі фактори проаналізовано, подано у кількісному вигляді, тобто у вигляді варіаційних або динамічних рядів, переходять до третього етапу.

  3. Математико-статистичний аналіз факторів – найважливіший підготовчий етап для побудови регресійної багатофакторної моделі. Це заключний етап формування необхідної інформаційної бази.

На цьому етапі проводиться перевірка факторів на мультиколінеарність. Термін «мультиколінеарність» означає, що в багатофакторній регресійній моделі дві або більше залежних змінних (факторів) пов’язані між собою лінійною залежністю або, іншими словами, мають високий ступінь кореляції. Для виявлення наявності мультиколінеарності спочатку будують матрицю коефіцієнтів парної кореляції, яка є симетричною і має такий вигляд:.


Коефіцієнти парної кореляції між факторами аналізуються. Якщо їх значення доближаються до одиниці – це вказує на щільний зв'язок між ними, або на мультиколінеарність. В такому випадку один з таких факторів необхідно вилучити із подальшого розгляду, інший – залишають. Найчастіше залишають той фактор, який з економічної точки зору є більш впливовим на результативний показник. З іншого боку, залишити можна фактор, який має більший коефіцієнт кореляції з результативним показником у.

Такий аналіз проводиться для кожної пари залежних між собою факторів. Результатом етапу математико-статистичного аналізу є знаходження множини основних незалежних між собою факторів, які є базою для побудови регресійної моделі.

  1. Вибір методу побудови та побудова регресійної багатофакторної моделі. Метод побудови регресійної багатофакторної моделі неможливо відокремити від самої моделі, бо вони найтіснішим чином пов’язані один з одним. Саме обраний метод впливає на остаточний вигляд регресійної моделі.

  2. Оцінка невідомих параметрів регресійної моделі. У лінійних регресійних моделях оцінка параметрів здійснюється за методом найменших квадратів (МНК), аналогічно простої лінійної регресії.

  3. Перевірка моделі на адекватність. Перевірка проводиться після знаходження параметрів регресії, за допомогою F-критерію Фішера. Крім того, відбувається перевірка значущості параметрів моделі за t-критерієм Ст’юдента Якщо модель виявиться неадекватною, необхідно повернутися до етапу побудови моделі (4) і, можливо від лінійної моделі перейти до нелінійної, або ввести додаткові фактори.

Якщо модель виявиться адекватною, то робота може бути продовжена. В такому випадку може вивчатися вплив окремих факторів на залежний показник, будуються інтервали довіри (етап 7), аналізуються та інтерпретуються отримані результати, будуються прогнози (етап 8).


^ 2 Передумови застосування методу найменших квадратів (матрична форма для багатофакторної регресії)


Для класичної багатофакторної регресійної моделі, яка є узагальненням простої лінійної регресійної моделі, всі основні класичні припущення зберігаються:

Щоб застосувати метод найменших квадратів для оцінки параметрів моделі, необхідне виконання таких передумов:

1) математичне сподівання залишків дорівнює нулю, тобто

M(U) = 0;

2) значення ui елементів вектора залишків U повинні бути незалежними між собою і мати постійну дисперсію, тобто

,

де Е – одинична матриця;

3) незалежні змінні моделі не повинні бути зв’язані із залишками, тобто

.

4) незалежні змінні економетричної моделі повинні створювати лінійно незалежну систему векторів, або, іншими словами, незалежні змінні не повинні бути мультиколінеарнними, тобто

,

,

де к = , j = .

^ Перша передумова є очевидною, бо якщо математичне сподівання залишків не дорівнює нулю, то це значить, що існує систематичний вплив на залежну змінну, а в модельну специфікацію не включені всі незалежні змінні. Якщо ця передумова не виконується, то має місце помилка специфікації.

Коли економетрична модель має вільний член, то за рахунок його значення майже завжди можна відкоригувати рівняння так, щоб математичне сподівання залишків дорівнювало нулю. Звідси виходить, що для таких моделей перша передумова буде виконуватись практично завжди.

^ Друга передумова передбачає наявність постійної дисперсії залишків. Ця передумова носить назву гомоскедастичності. Але вона може виконуватись лише тоді, коли залишки U є результатом помилки вимірів. Якщо залишки акумулюють загальний вплив змінних, які не враховані в моделі, то звичайно дисперсія залишків не може бути постійною величиною, вона змінюється для певної групи спостережень. В цьому випадку маємо справу з явищем гетероскедастичності, яке впливає на методи оцінки параметрів.

^ Третя передумова, що передбачає незалежність між залишками і екзогенними змінними, порушується в основному тоді, коли економетрична модель будується на основі одночасних структурних рівнянь або має лагові змінні. В цьому випадку для оцінки її параметрів використовуються дво- або трикроковий методи найменших квадратів.

^ Четверта передумова вимагає, щоб всі екзогенні змінні, які включені в економетричну модель, були незалежними між собою. Але очевидно, що в економіці дуже важко виділити такий масив незалежних (екзогенних) змінних, які зовсім були б не зв’язані між собою. Тоді кожний раз необхідно вирішувати питання, чи не буде впливати залежність екзогенних змінних на оцінку параметрів моделі.

Це явище отримало назву мультиколінеарнності змінних. Наявність її робить оцінки параметрів моделі ненадійними, чутливими до обраної специфікації моделі і до конкретного набору даних. Спадає довіра до результатів верифікації моделей існуючими методами. Таким чином, це явище з усіх точок зору є дуже небажаним. Але воно зустрічається досить часто. Існують методи виявлення мультиколінеарнності і способи її врахування через специфікацію моделі чи спеціальні методи оцінки параметрів.


3 Оцінка параметрів методом найменших квадратів


Розглянемо модель Y = XA + U , для якої виконуються всі чотири передумови для оцінки параметрів методом найменших квадратів.

З рівняння Y = XA + U запишемо вираз для залишків: U = Y – XA. Тоді сума квадратів залишків U буде визначатись так:

.


Продиференціюємо цю умову по А і прирівняємо похідну до нуля:

або ,

де Х – матриця, транспонована до матриці залежних змінних Х.

Це рівняння дає матричну форму запису системи нормальних рівнянь.

Звідси значення вектора А є розв’язком системи нормальних рівнянь, тобто:

.

Якщо незалежні змінні в матриці Х взяті як відхилення кожного значення від своєї середньої, то матрицю ХХ називають матрицею моментів. Числа, що стоять на її головній діагоналі, характеризують величину дисперсій незалежних змінних, інші елементи відповідають взаємним коваріаціям. Таким чином, структура матриці моментів відображає зв'язок між незалежними змінними. Чим ближче показники коваріації до величини дисперсії, тим ближче визначник матриці ХХ наближається до нуля і тим гірше оцінки параметрів А. Далі буде показано, що стандартні помилки параметрів А прямо пропорційні значенням, що стоять на головній діагоналі матриці (ХХ) 1.

Розглянемо оцінку параметрів моделі методом найменших квадратів на прикладі.

Приклад 2.1 Оцінити параметри економетричної моделі, що характеризує залежність між тижневими витратами на харчування, загальними витратами та розміром сім’ї за даними таблиці 2.1.

Приклад 1

Запишемо економетричну модель:

y = a0 + a1x1 + a2x2 +u або ,

де y – фактичні значення тижневих витрат на харчування;

– розрахункові значення тижневих витрат на харчування по моделі;

х1 – загальні витрати;

x2 – розмір сім’ї;

u – залишки;

– оцінки параметрів моделі.


Таблиця 2.1



п/п

Витрати на харчування (Y)

Загальні витрати (Х1)

Розмір сім’ї (Х2)

1

22

45

1,5

2

34

75

1,6

3

50

125

1,9

4

67

223

1,8

5

47

92

3,4

6

66

146

3,6

7

81

227

3,4

8

106

358

3,5

9

70

135

5,5

10

95

218

5,4

11

119

331

5,4

12

147

490

5,3

13

93

175

8,5

14

133

305

8,3

15

169

468

8,1

16

197

749

7,3


Оператор оцінювання параметрів моделі по методу найменших квадратів має вигляд:

,

де А= ;



Х – матриця, транспонована до матриці Х.

Матриця Х, крім двох векторів незалежних змінних, включає вектор одиниць. Він дописується в матриці Х зліва тоді, коли економетрична модель має вільний член. Якщо не дописувати в матрицю Х вектор одиниць із n елементів, то вільний член можна розрахувати як:

,

де – середнє значення залежної змінної;

– середні значення незалежних змінних х1 та х2.

Згідно з оператором оцінювання знайдемо:

1) (ХХ) = ;

2) (ХХ)-1 = ;

3) ХY = ; 4) А = .

Таким чином, економетрична модель має вигляд:

.


^ 4 Властивості оцінок параметрів

Оцінки параметрів А повинні мати такі властивості:

1) незміщеності;

2) обгрунтованості;

3) ефективності;

4) інваріантності.

Вибіркова оцінка параметрів називається незміщеною, коли вона задовольняє рівність:

М() = А.

В нашому випадку М() = А+(ХХ)-1ХМ(U). Оскільки, згідно першої передумови М(U) = 0, то М() = А, тобто оцінка параметрів методом найменших квадратів є незміщеною.

Незміщеність – це мінімальна вимога, яка ставиться до оцінок параметрів А. Якщо оцінка буде незміщеною, то при багаторазовому повторенні випадкової вибірки, незважаючи на те, що при окремих вибірках допускались би помилки оцінки, середнє значення цих помилок дорівнювало б нулю.

Різниця між математичним сподіванням оцінки і значенням оціненого параметра називається зміщенням оцінки:

 = М() – А.

Не треба змішувати помилку оцінки із її зміщенням. Помилка дорівнює – А і є випадковою величиною, а зміщення – постійною.

Дисперсія кожної з компонент вектора А дорівнює j-му елементу головної діагоналі матриці (ХХ)-1, помноженому на дисперсію залишків U, тобто

,

де – незміщена оцінка дисперсії залишків (n-m – число ступенів свободи).

Приклад 2

На основі моделі, яка побудована в прикладі 2.1, розрахуємо дисперсію залишків, дисперсії параметрів та їх стандартні помилки.

1) Дисперсія залишків:

.

2) Дисперсія параметрів моделі:

;

.

С11 і С22 – відповідні діагональні елементи матриці (ХХ)-1.

3) Стандартні помилки параметрів моделі:

;

;

.

Стандартні помилки у порівнянні з числовим значенням параметрів моделі можуть свідчити про наявність чи відсутність зміщеності.

В цьому прикладі стандартні помилки оцінок параметрів складають відповідно до рівня оцінки:

або 5,58%;

або 12,21%,

а це свідчить про зміщеність оцінок.

Наслідком зміщеності є також факт, що М(U)  0. В нашому прикладі М(U) = –0,000019. Якщо М(U)  0, то це означає, що залишки можуть мати систематичну складову, яка зумовлена неточною специфікацією моделі. Наприклад, в модель включені не всі основні чинники, що впливають на тижневі витрати на харчування (скажімо, не враховуються ціни на продукти харчування).

Дуже важливою властивістю оцінки є її обґрунтованість.

Вибіркова оцінка називається обґрунтованою, якщо при дуже малій величині 0 є справедливим співвідношення:

.

Іншими словами, оцінка обґрунтована, коли вона підкоряється закону великих чисел. Обґрунтованість оцінки означає, що чим більші будуються вибірки, тим більша ймовірність, що помилка оцінки не буде перевищувати дуже малу величину .

Третя властивість оцінок А – ефективність – пов’язана з величиною дисперсії оцінок.

Із визначення дисперсії випливає, що – параметр розподілу випадкової величини А, який є мірою розсіювання її значень навколо математичного сподівання.

Вибіркова оцінка параметрів А називається ефективною, коли дисперсія цієї оцінки є найменшою.

Нехай – ефективна оцінка параметрів А, а А – деяка інша оцінка цих параметрів. Тоді відношення



характеризує ефективність оцінки. Очевидно, що 0  К  1. Крім того, чим ближче К до одиниці, тим ефективнішою є оцінка А. Цікаво, що відношення може бути функцією від сукупності спостережень n і із збільшенням n може швидко змінюватись.

Незміщена оцінка А, дисперсія якої при n   задовольняє умову , називається асимптотично ефективною оцінкою.

Пошук ефективних оцінок параметрів – досить складна справа. Можна доказати, що М() дає ефективну оцінку параметрів А.

Ще одна властивість оцінок – їх інваріантність. Оцінка параметрів А називається інваріантною, якщо для довільно заданої функції g, g() є оцінкою параметрів функції g(A). Іншими словами, інваріантність оцінки базується на тому, що в разі перетворення параметрів А за допомогою деякої функції g таке ж перетворення дає оцінку нових параметрів g(A).

Інваріантність оцінок має велике практичне значення. Для прикладу можна сказати, що якщо відома оцінка дисперсії генеральної сукупності і вона інваріантна, то оцінку середньоквадратичного відхилення можна одержати, взявши квадратний корінь із оцінки дисперсії.


3 Дисперсійний аналіз економетричної моделі


3.1 Побудова економетричної моделі на основі покрокової регресії


При елементарному трактуванні взаємозв’язку між двома змінними за допомогою методу найменших квадратів, як правило, акцентують увагу на коефіцієнтах кореляції. Причому можна доказати, що

,

де r – парний коефіцієнт кореляції;

y – середньоквадратичне відхилення залежної змінної;

x – середньоквадратичне відхилення незалежної змінної.

Таким чином, оцінка параметрів моделі прямо пропорційна коефіцієнту парної кореляції. Аналогічні співвідношення мають місце і в загальному випадку. Ці співвідношення покладені в основу алгоритму покрокової регресії.

Розглянемо цей алгоритм.

^ На першому кроці цього алгоритму всі вихідні дані змінних стандартизуються (або нормалізуються):

; ,

де y – нормалізована залежна змінна;

xj – нормалізована незалежна змінна;

– середнє значення залежної змінної;

– середнє значення j-ї незалежної змінної;

у, – середньоквадратичні відхилення.

При цьому середні значення дорівнюють нулю, а дисперсії - одиниці.

^ На другому кроці знаходиться кореляційна матриця:

,

де – парні коефіцієнти кореляції між залежною і незалежними змінними:

;

– парні коефіцієнти кореляції між незалежними змінними:

.

На третьому кроці на основі порівняння абсолютних значень обирається . Найбільше вказує на ту незалежну змінну, яка найтісніше пов’язана із у. На цьому кроці на основі методу найменших квадратів знаходиться оцінка параметра цієї змінної в моделі:

.

На четвертому кроці серед інших значень обирається і в модель вводиться наступна незалежна змінна:

.

Усі наступні кроки аналогічні. Якщо нема обмежень на включення в економетричну модель кожної наступної незалежної змінної, то розрахунок продовжується до тих пір, поки поступово не будуть включені в модель всі змінні.

Система нормальних рівнянь для знаходження параметрів моделі j в загальному вигляді запишеться так:



Позначимо матрицю парних коефіцієнтів кореляції між незалежними змінними через r, а вектор парних коефіцієнтів між залежною і незалежними змінними через r, тоді система нормальних рівнянь запишеться

,

а оператор оцінювання параметрів

.

Оскільки всі змінні виражені у стандартизованому масштабі. то параметри показують порівняльну силу впливу кожної незалежної змінної на залежну.

Зв’язок між оцінками параметрів моделі на основі стандартизованих і нестандартизованих змінних запишеться так:

, ( j = ),

.

Приклад 3.1 По десяти цехах машинобудівного підприємства наведені такі дані:


Таблиця 3.1



цеху

Середньомісячна зарплата

(у)

Продуктивність праці

1)

Фондомісткість продукції

2)

Відсоток виконання норм виробітку (х3)

1

265

45

0,20

130

2

236

42

0,04

127

3

257

50

0,30

151

4

279

55

0,20

149

5

226

40

0,10

140

6

350

70

0,10

141

7

278

56

0,25

152

8

262

57

0,03

188

9

269

55

0,15

120

10

250

53

0,32

126

Побудуємо економетричну модель, яка буде описувати зв’язок середньомісячної зарплати з наведеними чинниками на основі алгоритму покрокової регресії.

Наведемо кореляційну матрицю для цих вихідних даних:

.

Із матриці видно, що діагональні елементи її дорівнюють одиниці, бо характеризують зв’язок кожної змінної з собою. Ця матриця квадратна і симетрична.

В першому рядку знаходяться коефіцієнти парної кореляції, що характеризують тісноту зв’язку кожної змінної з середньомісячною зарплатою:

; ; ,

де у - зарплата;

х1 – продуктивність праці;

х2 – фондомісткість продукції;

х3 – відсоток виконання норм виробітку.

Оскільки серед величин найбільше значення має = 0,9003, то спочатку буде будуватись модель . Порівнявши потім інші два коефіцієнта, визначимо найбільший:

.

Таким чином наступна модель буде включати:

.

І наприкінці остання модель має вигляд:



Таким чином, будуть побудовані такі моделі:

1) ; ;

2) ; ;

3) ; ;

Приведемо ці моделі для вихідної інформації:

1) ;

2) ;

3) .


3.2 Множинний коефіцієнт кореляції і детермінації


Тіснота зв’язку та загального впливу всіх незалежних змінних на залежну визначається коефіцієнтами множинної кореляції і детермінації.

Щоб дати метод їх розрахунку, необхідно показати, що варіація залежної змінної (Y) навколо свого вибіркового середнього () значення може бути розкладена на дві складові:

,

де – варіація розрахункових значень () навколо середнього значення ();

– варіація розрахункових значень () навколо фактичних (Y).

Визначімо, що , тобто середні значення залежної змінної, розрахованої по моделі (), і фактичної () співпадають.

Необхідні обчислення зведемо в таблицю 3.2.

Числове значення коефіцієнта детермінації характеризує, в якій мірі варіація залежної змінної (Y) визначається варіацією незалежних змінних моделі.


Таблиця 3.2

Варіація

Позна-чення

Джерело варіації

Сума квадратів відхилень

Ступе-ні сво-боди

Розрахункових значень навколо середнього значення



x1, x2, …, xm



m – 1

Розрахункових значень () навколо фактичних (Y)



Залишок u



n – m

Загальна (залежної змінної Y навколо свого середнього )






де

n – 1

Використаємо середні квадрати відхилень (дисперсії) (див. таблицю 3.2) і запишемо формулу розрахунку коефіцієнта детермінації:

або .

Оскільки у цій формулі дисперсії використовуються без урахування поправки на число ступенів свободи, то коефіцієнт детермінації, розрахований за нею ніколи не зменшується при введені в модель нових незалежних змінних. Коефіцієнт детермінації, розрахований з урахуванням числа ступенів свободи, може зменшуватись при введенні в модель нових незалежних змінних. Залежність між цими двома коефіцієнтами можна записати:

,

де R2 – коефіцієнт детермінації з урахуванням числа ступенів свободи;

– коефіцієнт детермінації без урахування числа ступенів свободи.

Множинний коефіцієнт кореляції:

.

Він характеризує тісноту зв’язку всіх незалежних змінних із залежною. Для множинного коефіцієнта кореляції з урахуванням та без урахування числа ступенів свободи характерна така ж зміна числового значення, як і для коефіцієнта детермінації.

Приклад 3.3 Порівняємо коефіцієнти кореляції і детермінації для різних економетричних моделей, побудованих для вихідних даних, наведених у таблиці 3.1 на основі покрокової регресії.

Таблиця 3.3

Економетрична модель



R2 з ураху-ванням числа ступе-нів свобо-ди



R з ураху-ванням числа ступе-нів свобо-ди



0,8106

0,8106

0,9003

0,9003



0,8361

0,8156

0,9144

0,9031



0,8459

0,8019

0,9197

0,8954


Із таблиці 3.3 можна побачити, що з додатковим включенням нової залежної змінної, коефіцієнти детермінації і кореляції без урахування числа ступенів свободи збільшуються, а ці ж характеристики з урахуванням числа ступенів свободи для другої моделі, яка має дві незалежні змінні – зростають, а для третьої – з трьома незалежними змінними – знижуються. Тобто, для третьої моделі в результаті введення додаткової змінної зменшення величини 1–R2 недостатнє для компенсації збільшення відношення . При цьому треба звернути увагу, що коефіцієнти детермінації і кореляції без урахування числа ступенів свободи мають більші числові значення, ніж з урахуванням цього числа.

Покажемо альтернативний спосіб розрахунку коефіцієнтів детермінації і кореляції, коли система нормальних рівнянь будується на основі коефіцієнтів парної кореляції r.

В цьому випадку метод розрахунку коефіцієнтів детермінації можна записати:

.

Звідси коефіцієнт кореляції дорівнює:

.

Ще один альтернативний метод розрахунку коефіцієнта детермінації через алгебраїчне доповнення матриці r:

,

де – визначник кореляційної матриці;

– алгебраїчне доповнення матриці r до елементу rkj.

Сума квадратів відхилень залишків також може бути виражена через алгебраїчне доповнення матриці r:

.

А оцінка параметрів моделі дорівнює:

.


3.3 Перевірка значущості і довірчі інтервали


3.3.1 Значущість економетричної моделі


Гіпотеза про наявність чи відсутність зв’язку між залежною і незалежною змінними може бути перевірена на основі F-критерію, який можна розрахувати через коефіцієнт детермінації:

.

При цьому припускається, що залишки u розподілені нормально, тобто використовується фундаментальна теорема про те, що для нормально розподіленої випадкової величини х з нульовою середньою і одиничною дисперсією сума квадратів її n випадково обраних значень має розподіл 2 із n ступенями свободи.

Фактичне значення F-критерію порівнюється з табличним при ступенях свободи n-m i m-1 і вибраному рівні значущості. Якщо FфактFтабл , то гіпотеза про суттєвість зв’язку між залежною і незалежними змінними економетричної моделі підтверджується, в протилежному випадку – вона відкидається.

Приклад 3.4 Розрахуємо F-критерій для економетричних моделей, що наведені в прикладі 3.1.


Таблиця 3.4

Економетрична модель

Число ступенів свободи

F-критерій



m – 1 = 1

n – m = 8

34,2386



m – 1 = 2

n – m = 7

15,4821



m – 1 = 3

n – m = 6

8,0975

Fтабл(0,95) для першої моделі дорівнює 5,32.

Fтабл(0,95) для другої моделі дорівнює 4,74.

Fтабл(0,95) для третьої моделі дорівнює 4,76.

Таким чином, при рівні значущості =0,05:

F1факт  Fтабл;

F2факт  Fтабл;

F3факт  Fтабл.

Це свідчить про те, що відповідна економетрична модель є вірогідною, тобто підтверджується гіпотеза про те, що кількісна оцінка зв’язку між залежною і незалежними змінними в моделі є суттєвою.


^ 3.3.2 Значущість коефіцієнта кореляції


Перевірка значущості вибіркового коефіцієнта кореляції базується на t-критерії:

,

де R2 – коефіцієнт детермінації моделі;

R – коефіцієнт кореляції;

n-m – число ступенів свободи.

Якщо , де – відповідне табличне значення t-розподілу з n-m ступенями свободи, то можна зробити висновок про значущість коефіцієнта кореляції між залежною та незалежними змінними моделі.

Приклад 3.5 Для множинних коефіцієнтів кореляції, що наведені в таблиці 3.3, розрахуємо t-критерії:

.

,

.

Табличні значення цього критерію при рівні значущості =0,05 і відповідних ступенях свободи дорівнюють:

t1табл = 2,26,

t2табл = 2,31,

t3табл = 2,37.

Порівнявши їх з фактичними, де

t1  t1 табл,

t2  t2 табл,

t3  t3 табл

робимо висновок про те, що коефіцієнт кореляції, який характеризує тісноту зв'язку між залежною і незалежними змінними в моделях є достовірним.


3.3.3 Значущість параметрів моделі


Щоб перевірити значущість коефіцієнтів моделі і знайти для них довірчі інтервали припустимо, що залишки u нормально розподілені, тобто u є N(0,2E). Тоді параметри моделі задовольняють багатомірний нормальний розподіл:

.

Незміщену оцінку дисперсії залишків дає співвідношення:

.

Перевірка гіпотез відносно суттєвості кожного із параметрів економетричної моделі виконується на основі t-критерію:

,

де Сjj – діагональний елемент матриці (ХХ)-1.

Знаменник цього відношення називається стандартною помилкою параметра моделі.

Розраховане значення t-критерію порівнюється з табличним при обраному рівні значущості і n-m ступенів свободи. Якщо tфакт  tтабл , то відповідний параметр економетричної моделі є достовірним.

На основі t-критерію і стандартної помилки будуються довірчі інтервали для параметрів аj :

.

Приклад 3.5 Перевіримо гіпотези про значущість оцінок параметрів моделі , побудованої на основі вихідних даних, що наведені у таблиці 2.1:

,

.

При ступені свободи n-m = 10 – 3 = 7 і рівні значущості =0,05 tтабл=2,365. Оскільки t1 факт  tтабл , то параметр характеризує суттєвий зв’язок цієї незалежної змінної із залежною. t2 факт > tтабл, то можна відкинути нульову гіпотезу про несуттєвість впливу змінної х2 на результативну ознаку – y.

Оцінка параметра може знаходитись у межах:

,

,

.

Відповідно знайдемо довірчий інтервал для параметра моделі а2.

,

.

Величини стандартних помилок параметрів в порівнянні з абсолютним значенням оцінки цих параметрів можуть також свідчити про те, що оцінка параметра є зміщеною. Для цього прикладу

або 5,56%,

або 12,21%.

Похожие:

Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconБагатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови
Передумови застосування методу найменших квадратів (матрична форма для багатофакторної регресії)
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconПринципи побудови економетричних моделей. Парна лінійна регресія. 1 Сутність економетріки 2 Визначення моделі та етапи її побудови
Джерела невизначеності можуть бути різноманітнішими: нестабільність економічної, соціальної або політичної ситуації, не прогнозованість...
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconУзагальнені економетричні моделі 1 Сутність узагальнених економетричних моделей 2 Визначення моделі та етапи її побудови
В залежності від кількості факторів, які включають в модель, розрізняють регресії прості (парні) та багатофакторні
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconОпорна схема лекції №6 тема заняття: основні принципи побудови локальних І глобальних мереж, інформаційні сервіси, технології та їх професійне використання. Мета вивчення
Тема 27. Основні принципи побудови локальних і глобальних мереж, інформаційні сервіси, технології та їх професійне використання....
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconМетодичні вказівки до завдання 3 Завдання виконується за темою "Узагальнена модель простої лінійної регресії"
Для моделі, розрахованої у завданні 2, перевірте на значущість параметри a0 i a1 за допомогою t-тесту Ст’юдента
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconТренінг «Особливості сучасного уроку в початковій школі»
Мета: поглибити знання вчителів про вимоги, принципи побудови, методи роботи на сучасному уроці
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconПоложение о конкурсе творческих работ «От Волги до Вислы: диалог культур. Современное прочтение школьниками и студентами»
Настоящим положением определяются номинации, по которым проводится конкурс, требования к представляемым на конкурс работам, критерии...
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconПакет програмних продуктів arcgis
Геоінформаційних Систем. Платформа Arcgis є оптимальним рішенням для побудови корпоративної гіс, фундаменту інформаційної системи...
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconМетодичні вказівки до завдання 2 Завдання виконується за темою " Парна лінійна регресія "
Назви показників, які треба аналізувати, обираються за передостанньою цифрою шифру студента. Розташування в таблиці 3 даних першого...
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconКиївський радіомеханічний коледж нау
Вивчити принципи побудови локальних комп’ютерних мереж на основі комутаторів Fast Ethernet, отримати практичні навики по налаштуванню...
Багатофакторна регресія 1 Сутність багатофакторної регресії та порядок її побудови iconТема 4: Основи адміністративного права України
Поняття і сутність державного управління та його співвідношення з виконавчою владою
Вы можете разместить ссылку на наш сайт:
Документы


При копировании материала укажите ссылку ©ignorik.ru 2015

контакты
Документы