Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" icon

Методичні вказівки до завдання 2 Завдання виконується за темою " Парна лінійна регресія "


Скачать 352.66 Kb.
НазваниеМетодичні вказівки до завдання 2 Завдання виконується за темою " Парна лінійна регресія "
Дата публикации07.01.2014
Размер352.66 Kb.
ТипМетодичні вказівки

Задача 2

Побудова та оцінка якості простої лінійної регресії

Завдання


2.1 З таблиці 3 обрати назви результуючого показника у і фактора х, а також дані десятьох спостережень, які відносяться до варіанта, що виконується. Назви показників, які треба аналізувати, обираються за передостанньою цифрою шифру студента. Розташування в таблиці 3 даних першого спостереження визначається двома останніми цифрами шифру. Від цього елементу за відповідним рядком таблиці 3 послідовно обираються дані всіх десяти спостережень.

2.2 Знайти оцінки параметрів простої вибіркової лінійної регресії за допомогою методу найменших квадратів.

2.3 Розрахувати коефіцієнти кореляції та детермінації.

2.4 Перевірити модель на адекватність за F-критерієм Фішера.


Методичні вказівки до завдання 2

Завдання виконується за темою ” Парна лінійна регресія ”.

Прості парні лінійні регресійні моделі встановлюють лінійну залежність між двома змінними. При цьому одна із змінних вважається залежною (у) та розглядається як функція незалежної змінної (х).

У загальному вигляді проста вибіркова регресійна модель записується таким чином:

,

де у - вектор спостережень за залежною змінною: ;

х - вектор спостережень за незалежною змінною: ;

- невідомі параметри регресійної моделі;

- вектор випадкових величин (помилок): .

Регресійна модель називається лінійною, якщо вона лінійна за своїми параметрами. Її можна трактувати як пряму на площині, де а0 - перетин з віссю ординат, а а1 - нахил ( звичайно, якщо абстрагуватись від випадкової величини u).
^

Таблиця 3 - Дані спостережень





Результуюча ознака у і чинник х
^
Остання цифра шифру студента

0

1

2

3

4

5

6

7

8

9




























Передостання цифра шифру студента

4 , 5

х

Розміри руху

вантажних потягів

(у парах потягів)

90

40

75

60

40

60

55

40

40

60

40

90

45

95

70

25

40

50

50

у

Собівартість пересування вагонів, коп./ваг.-км

1,1

1,0

1,2

1,1

1,4

1,0

1,0

1,5

1,5

1,3

0,9

0,9

1,6

1,4

1,7

1,5

1,8

1,4

1,2

3 , 9

х
^
Експлуатаційний ухил, %

0,7

1,2

1,0

0,6

0,9

0,6

0,8

0,7

1,1

0,6

0,9

0,7

0,6

1,4

0,7

0,7

1,2

0,6

2,0

у

Собівартість вантажних перевезень, коп./ваг.-км

1,16

1,08

1,12

0,98

1,06

1,05

1,06

1,15

1,27

1,1

1,1

1,2

1,44

1,0

1,0

1,06

1,09

0,9

1,48

2 , 8

х

Динамічне навантаження на вісь робочого вагона, т

6,7

7,6

7,0

6,2

6,2

7,0

8,0

8,5

8,1

6,3

6,4

7,6

6,3

8,0

7,5

7,5

8,0

8,3

8,9

у

Собівартість вантажних перевезень, коп./ваг.-км

3,14

2,14

2,90

3,26

3,29

3,96

2,57

2,40

2,51

3,52

3,30

2,49

2,53

2,71

2,40

2,20

2,25

2,30

2,35

1 , 7

х

Відсоток порожнього пробігу вагонів до загального

28

23

29

28

38

29

19

18

18

29

32

23

33

16

22

18

16

17

18

у

Собівартість вантажних перевезень, коп./ваг.-км

3,14

2,14

2,90

3,26

3,29

2,96

2,57

2,40

2,51

3,52

3,30

2,49

3,53

1,71

2,40

2,20

2,25

2,30

2,35

0 , 6

х

Дільнична швидкість, км/год

24,7

36,4

26,1

23,9

19,7

28,7

29,6

34,8

25,6

22,3

29,7

39,1

30,3

32,9

32,6

37,0

36,0

35,5

35,1

у

Собівартість вантажних перевезень, коп./ваг.-км

3,14

2,14

2,90

3,26

3,29

2,96

2,57

2,40

2,51

3,52

3,30

2,49

2,53

2,71

2,40

2,20

2,25

2,30

2,35

Щоб мати явний вигляд залежності необхідно знайти (оцінити) невідомі параметри цієї моделі. Для цього розглянемо пряму . Відхилення (помилки) теоретичних значень від фактичних можна виразити формулою:

, ,

де - і-та точка на прямій, яка відповідає значенню хі.

Відхилення, або помилки, іноді називають залишками. Логічно, що пряму треба проводити таким чином, щоб сума квадратів помилок була мінімальною. У цьому й полягає критерій найменших квадратів. Невідомі параметри знаходяться таким чином, щоб мінімізувати , тобто маємо цільову функцію:

.

Мінімізація цієї функції, яка є функцією від двох невідомих , дає таку формулу для параметра a1 (нахилу прямої):

, де ; .

Цей вираз можна переписати таким чином:

.

При цьому параметр a0 (перетин) знаходиться за формулою:

.


Приклад виконання завдання 2


Застосування простої регресійної моделі дає можливість записати зв’язок між ознаками аналітично (у вигляді рівняння) і надати йому кількісний вираз.

Розглянемо побудову простої лінійної регресійної моделі на конкретному прикладі залежності обсягу випуску продукції від вартості основних фондів підприємства (див. таблицю 8).

Таблиця 8 - Вартість основних фондів і випуск продукції по групі заводів

Номер спостереження

1

2

3

4

5

6

7

8

9

10

Вартість основних фондів (х), млн. грн

6

8

9

10

10

11

12

13

14

15

Випуск продукції (у), млн. грн

2,4

4,0

3,6

4,0

4,5

4,6

5,6

6,5

7,0

5,0


Аналіз даних показує, що зі збільшенням вартості основних фондів зростає і випуск продукції. Щоб виявити, на скільки підвищується в середньому випуск продукції при збільшенні основних фондів на 1 млн. грн, побудуємо модель , якщо припустити існування прямолінійного зв’язку між вартістю основних фондів і випуском продукції, який виражається рівнянням прямої .

Для оцінки параметрів прямої побудуємо розрахункову таблицю (див. таблицю 9).


Таблиця 9

Номер спостереження

Вартість основних фондів (хі),

млн. грн

Випуск продукції (уі), млн. грн







1

2

3

4

5

6

1

6

2,4

14,4

36

2,6966

2

8

4,0

32,0

64

3,5396

3

9

3,6

32,4

81

3,9612

4

10

4,0

40,0

100

4,3827

5

10

4,5

45,0

100

4,3827

6

11

4,6

50,6

121

4,8043

7

12

5,6

67,2

144

5,2258

8

13

6,5

84,5

169

5,6474

9

14

7,0

98,0

196

6,0689

10

15

5,0

75,0

225

6,4905

Разом

108

47,2

539,1

1236

47,1997


За даними розрахункової таблиці отримаємо:

; ; ; ;

;

.

Рівняння прямої буде мати такий вигляд:

.

Параметр a1 показує, що із збільшенням вартості основних засобів на 1 млн. грн, випуск продукції збільшується в середньому на 0,42155 млн. грн. Параметр a0 – вільний член рівняння. Він характеризує значення при х = 0, в нашому випадку при х = 0.

Підставимо значення незалежної змінної х в рівняння прямої і знайдемо теоретичні, вирівняні значення у:

;



і так далі.

Теоретичні значення надані в таблиці 9.

Критерієм, що характеризує щільність зв’язку між залежною змінною у і незалежною х, тобто наскільки значним є вплив змінної х на у, є коефіцієнт кореляції:

.

Коефіцієнт кореляції є відносною мірою зв’язку між двома змінними. Тому значення коефіцієнта кореляції завжди знаходиться в межах –1 та +1 (). Додатне значення коефіцієнта кореляції свідчить про прямий, а від’ємне – про зворотній зв’язок між змінними. Коли коефіцієнт кореляції прямує за абсолютною величиною до 1 (), то це свідчить про наявність міцного зв’язку, тобто щільність зв’язку велика. В протилежному випадку, коли коефіцієнт кореляції прямує до 0 () – зв’язок відсутній.

Для розрахунку коефіцієнта кореляції використовуємо розрахункову таблицю 10. Два останні стовпці таблиці 10 використовуються при виконанні завдання 3.

За даними таблиці 10 знаходимо:

; ;

.

Коефіцієнт кореляції пов’язаний з нахилом регресійної лінії, тобто параметром a1 та середніми квадратичними відхиленнями і таким співвідношенням:

.

Відхилення фактичних значень у від середнього значення можна записати у вигляді: .


Таблиця 10 – Розрахунок щільності зв’язку між вартістю основних фондів і випуском продукції по групі заводів

Номер спостереження

Вартість основних фондів (хі), млн. грн

Випуск продукції (уі), млн. грн











1

2

3

4

5

6

7

8

1

6

2,4

-4,8

23,04

-2,32

5,3824

11,136

2

8

4,0

-2,8

7,84

-0,72

0,5184

2,016

3

9

3,6

-1,8

3,24

-1,12

1,2544

2,016

4

10

4,0

-0,8

0,64

-0,72

0,5184

0,576

5

10

4,5

-0,8

0,64

-0,22

0,0484

0,176

6

11

4,6

+0,2

0,04

-0,12

0,0144

-0,024

7

12

5,6

+1,2

1,44

+0,88

0,7744

1,056

8

13

6,5

+2,2

4,84

+1,78

3,1684

3,916

9

14

7,0

+3,2

10,24

+2,28

5,1984

7,296

10

15

5,0

+4,2

17,64

+0,28

0,0784

1,176

Разом

108

47,2

0

69,60

0

16,956

29,34

У статистиці різницю прийнято називати загальним відхиленням. Різницю називають відхиленням, яке можна пояснити виходячи з регресійної прямої. Різницю називають відхиленням, яке не можна пояснити, виходячи з регресійної прямої, або непояснювальним відхиленням.

Квадрати цих відхилень просумуємо за всіма індексами, та отримаємо:

,

де - загальна сума квадратів, яка позначається, як правило, через SST;

- сума квадратів, яка пояснюється регресією та позначається SSR;

- сума квадратів помилок, яка позначається через ^ SSE.

Отже, у скороченому вигляді можна записати SST=SSR+SSE.

Якщо поділити на n, то отримаємо вираз для дисперсій:

.

Таким чином ми розклали загальну дисперсію на дві частини: дисперсію, що пояснюється регресією, та дисперсію помилок:

.

Поділивши обидві частини на отримаємо:

.

Як можна побачити з цього виразу, друга частина () є частиною дисперсії, яку не можна пояснити через регресій ний зв’язок. Перша частина () – частина дисперсії, яку можна пояснити, виходячи з регресії.

Частина дисперсії, що пояснюється регресією, називається коефіцієнтом детермінації і позначається R2. Коефіцієнт детермінації використовується як критерій адекватності моделі, бо є відносною мірою варіації у під впливом незалежної змінної х. Таким чином, коефіцієнт детермінації можна записати у вигляді двох виразів, які є еквівалентними:

або .

Коефіцієнт детермінації завжди додатний і знаходиться в межах від нуля до одиниці (). Коефіцієнт детермінації дорівнює квадрату коефіцієнта кореляції: .

За допомогою коефіцієнта детермінації можна перевірити адекватність простої регресійної моделі. Якщо його значення близьке до одиниці, то можна вважати, що модель адекватна. Якщо його значення близьке до нуля, то модель неадекватна, тобто немає лінійного зв’язку між залежною та незалежною змінними.

Для нашого прикладу:

,

тобто дійсно існує лінійний зв’язок між вартістю основних фондів та випуском продукції.

У випадках, коли коефіцієнт кореляції має не явно виражене граничне значення (0,5;0,45;0,44 і т. ін.), важко зробити однозначний висновок про наявність зв’язку, тобто про адекватність моделі. Отже, потрібен інший критерій, який би однозначно давав би відповідь на запитання про адекватність побудованої моделі. Найбільш поширеним з таких критеріїв є критерій Фішера.

Перевірка моделі за F-критерієм Фішера складається з певних етапів:

1 На першому етапі розраховуємо величину так званого F-відношення:

або ,

де n – кількість спостережень;

k – кількість параметрів моделі (для простої регресії k=2).

2 На другому етапі задаємо рівень значущості або

3 На третьому етапі за статистичними таблицями F-розполілу Фішера зі (k-1,n-k) ступенями свободи та рівнем значущості , знаходимо критичне значення (Fкр).

4 Якщо розраховане значення , то відкидається гіпотеза Но, що (або що ) з ризиком помилитись не більше ніж в випадків.

Отже, якщо , то побудована регресійна модель адекватна реальній дійсності, тобто дійсно існує лінійний зв’язок між х та у, бо приймається гіпотеза .

Для перевірки моделі на адекватність в даному прикладі визначимо насамперед число ступенів свободи. Зв’язок між випуском продукції і вартістю основних фондів лінійний, тому рівняння простої лінійної регресії буде мати два параметри k=2 і число ступенів свободи дорівнює: і .

Розрахункове значення F-відношення:

.

За таблицею критичних значень F-розподілу Фішера (див. таблицю 11) визначаємо, що при зазначених ступенях свободи і рівні значущості критичне значення F-критерію – F1,8(0,05)=5,32, тобто критичне значення F-критерію менше розрахункового. Отже, побудована модель адекватна дійсності, тобто дійсно існує лінійний зв’язок між випуском продукції і вартістю основних фондів.


Таблиця 11 – Критичні значення F-критерію (рівень значущості – 0,05, тобто ймовірність Р=0,95)

К2

К1

1

2

3

4

5

6

7

8

9

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

9

5,12

4,26

3,86

3,63

3,48

3,37

3,25

3,23

3,18

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02


Задача 2

Побудова та оцінка якості простої лінійної регресії

Завдання


2.1 З таблиці 3 обрати назви результуючого показника у і фактора х, а також дані десятьох спостережень, які відносяться до варіанта, що виконується. Назви показників, які треба аналізувати, обираються за передостанньою цифрою шифру студента. Розташування в таблиці 3 даних першого спостереження визначається двома останніми цифрами шифру. Від цього елементу за відповідним рядком таблиці 3 послідовно обираються дані всіх десяти спостережень.

2.2 Знайти оцінки параметрів простої вибіркової лінійної регресії за допомогою методу найменших квадратів.

2.3 Розрахувати коефіцієнти кореляції та детермінації.

2.4 Перевірити модель на адекватність за F-критерієм Фішера.


Розв’язання


Таблиця 3 – Вихідні дані для побудови парної регресії

Номер спостереження

1

2

3

4

5

6

7

8

9

10

(х),
































(у),

































Для наочного виявлення наявності зв’язку між показниками х та у побудуємо графік. За побудованим рисунком можна припустити, що між змінними існує ________________________________________ зв’язок.

Іншими словами, аналіз даних показує, що при збільшенні _________________ ________________________________________________________________________________________________________________________________________________________________________________________________________________________

Припустимо, що цей зв'язок прямолінійний та побудуємо просту лінійну регресію, тобто знайдемо рівняння прямої .

Для оцінки параметрів прямої побудуємо розрахункову таблицю 4.





Рисунок 2 –


Таблиця 4

Номер спостереження


(хі),



(уі),








1
















2
















3
















4
















5
















6
















7
















8
















9
















10
















Разом
















Середнє

















За даними розрахункової таблиці отримаємо:

; ; ; ;


;


.

Рівняння прямої буде мати такий вигляд:

.

Параметр a1 показує, що із збільшенням х – _____________________________ на 1 _________, параметр у – _______________________________________________ ________________________________________________________________________

Параметр a0 – вільний член рівняння. Він характеризує значення при х = 0, в нашому випадку при х = 0 .

Підставимо значення незалежної змінної х в побудоване рівняння прямої і знайдемо теоретичні, вирівняні значення у. Занесемо їх в таблицю 4.

Нанесемо побудовану пряму на рисунок 2.

Для характеристики щільності зв’язку між залежною змінною у і незалежною х розрахуємо коефіцієнт кореляції:

.

Для розрахунку коефіцієнта кореляції побудуємо розрахункову таблицю 5.

За даними таблиці 5 знаходимо:

; ;;


; ;


.

Таблиця 5 – До розрахунку щільності зв’язку між _____________________

_____________________________________________________

Номер спостереження

















1






















2






















3






















4






















5






















6






















7






















8






















9






















10






















Разом






















Середнє























За результатами розрахунку коефіцієнта кореляції можна зробити висновок, що між х – ____________________________________________________________ та у – _____________________________________________________________________ існує _____________________________ та ____________________________ зв'язок.

Для перевірки моделі на адекватність реальній дійсності розрахуємо коефіцієнт детермінації .


.

Оскільки коефіцієнт детермінації знаходиться в межах ___________________, то лінійний зв’язок між х – _________________________________________________ та у – ___________________________________________________________________ ________________________________________________________________________.

Таким чином, можна стверджувати, що зміна ____________________________ _______________________________ (у) залежить від зміни _____________________ _______________________________ (х) на ____________ %, а від зміни інших факторів, що не ввійшли до моделі – на ____________%.

Для підтвердження висновків про адекватність моделі розрахуємо критерій Фішера:

,


.

Критичне значення F-розподілу Фішера при рівні значущості ____________% та ступенях свободи _______ та ________ дорівнює _____________.

Оскільки розрахункове значення F-критерію Фішера ______________________ критичного (табличного) значення, то гіпотеза про наявність лінійного зв’язку між ______________________________________________________________________ та ________________________________________________________________________ з ймовірністю _________ при ступенях свободи _____ та _____ ________________. Отже, побудована модель _________________ дійсності, тобто _________________ лінійний зв'язок між ______________________________________________________ ________________________________________________________________________.

Таким чином, побудована модель ____ може бути використана для подальшого використання (зокрема, прогнозування).







Похожие:

Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки до завдання 2 Завдання виконується за темою " Парна лінійна регресія "
Назви показників, які треба аналізувати, обираються за передостанньою цифрою шифру студента. Розташування в таблиці 3 даних першого...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки до завдання 3 Завдання виконується за темою "Узагальнена модель простої лінійної регресії"
Для моделі, розрахованої у завданні 2, перевірте на значущість параметри a0 i a1 за допомогою t-тесту Ст’юдента
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки та завдання до семінарських і практичних занять
Методичні вказівки та завдання до семінарських занять з дисципліни "Господарський процес" / Укладачі: В. А. Кройтор; Сапейко Л. В.;...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки і завдання до курсової роботи по дисципліні «Бухгалтерський облік» для студентів економічних спеціальностей
Методичні вказівки І завдання до курсової роботи по дисципліні «Бухгалтерський облік» для студентів економічних спеціальностей усіх...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки до виконання обов’язкового домашнього завдання
Методичні вказівки з дисципліни «Різальний інструмент та із гав» та з дисципліни «Різальний інструмент» / укладач С. В. Швець. Суми:...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconПринципи побудови економетричних моделей. Парна лінійна регресія. 1 Сутність економетріки 2 Визначення моделі та етапи її побудови
Джерела невизначеності можуть бути різноманітнішими: нестабільність економічної, соціальної або політичної ситуації, не прогнозованість...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки до виконання індивідуального завдання з дисципліни "банківські операції"вступ
Методичні вказівки до виконання індивідуального завдання з дисципліни “банківські операції”вступ
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconЗавдання з методичними вказівками
Методичні вказівки розглянуто і рекомендовано до друку на засіданні кафедри “Економіка, організації і управління підприємством” 1...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки до виконання розрахунково-графічного завдання з дисципліни
«Технологія обслуговування в готелях І туркомплексах» (для студентів спеціальності «Менеджмент організацій», спеціалізації «Менеджмент...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки до виконання практичних робіт за темами учбового плану та завдання для самостійного розв’язання
Практична робота – це закріплення теоретичних знань студента на фактичному матеріалі, придбання практичних навичок з використання...
Методичні вказівки до завдання 2 Завдання виконується за темою \" Парна лінійна регресія \" iconМетодичні вказівки по виконанню роботи: Виконуючи Завдання №1 користуватись додатком №1
Мета заняття: Ознайомитись з класифікацією споживчих товарів. Розглянути фактори за якими споживач оцінює товари, обираючи його серед...
Вы можете разместить ссылку на наш сайт:
Документы


При копировании материала укажите ссылку ©ignorik.ru 2015

контакты
Документы