Шта је линеарна регресија?
Линеарна регресија је у основи техника статистичког моделирања која се користи да покаже везу између једне зависне променљиве и једне или више независних променљивих. То је један од најчешћих типова предиктивне анализе. Ова врста дистрибуције формира се у линији, па се то назива линеарна регресија. У овом чланку узећемо примере Линеарне регресионе анализе у програму Екцел.
Да бисмо прво урадили линеарну регресиону анализу, треба да додамо екцел програмске додатке пратећи кораке.
Кликните на Датотека - Опције (ово ће отворити искачуће опције програма Екцел).

Кликните на програмске додатке - Изаберите Екцел програмске додатке из Манаге Дроп Довн у Екцелу, а затим кликните на Го.

Ово ће отворити искачуће прозоре додатака. Изаберите Аналисис ТоолПак, а затим кликните У реду.

Додатак за анализу података појавит ће се на картици Уметање.

Хајде да разумемо доле Примере линеарне регресионе анализе у екцелу.
Примери линеарне регресионе анализе
Пример # 1
Претпоставимо да имамо месечну продају и потрошили смо на маркетинг за прошлу годину, а сада треба да предвидимо будућу продају на основу прошлогодишње потрошње и утрошеног маркетинга.
Месец дана | Оглашавање | Продаја |
Јан | 40937 | 502729 |
Феб | 42376 | 507553 |
Мар | 43355 | 516885 |
Апр | 44126 | 528347 |
Може | 45060 | 537298 |
Јун | 49546 | 544066 |
Јул | 56105 | 553664 |
Авг | 59322 | 563201 |
Сеп | 59877 | 568657 |
Окт | 60481 | 569384 |
Нема в | 62356 | 573764 |
Дец | 63246 | 582746 |
Кликните картицу Анализа података на картици Подаци и ово ће отворити скочни прозор за анализу података.

Сада одаберите Регресија са листе и кликните У реду.

Отвориће се искачући прозор за регресију.

Изаберите опсег продаје $ Ц $ 1: $ Ц $ 13 у пољу И оса, јер је ово зависна променљива, а $ Б $ 1: $ Б $ 14 у Кс оси, јер је потрошено оглашавање независна променљива.

Означите поље за ознаке ако сте у подацима одабрали заглавља, то ће вам дати грешку.

Изаберите опсег излаза ако желите да добијете вредност за одређени опсег на радном листу, а затим изаберите Нови слој радног листа: и то ће додати нови радни лист и дати вам резултат.

Затим означите поље Резидуал и кликните У реду.

Ово ће додати радне листове и дати следећи резултат.

Да разумемо резултате.
Резиме резултата
Вишеструко Р: Ово представља коефицијент корелације. Вредност 1 показује позитивну везу, а вредност 0 не показује никакву везу.
Р квадрат: Р квадрат представља коефицијент одлучности. Ово вам говори да проценат поена пада на линију регресије. 0,49 значи да 49% вредности одговара моделу
Прилагођени Р квадрат : Ово је прилагођени Р квадрат, који захтева када имате више од једне Кс променљиве.
Стандардна грешка: Ово представља процену стандардне девијације грешке. Ово је прецизност мерења коефицијента регресије.
Запажања: Ово је број запажања која сте узели у узорку.
АНОВА - Дф: Степени слободе
СС: Збир квадрата.
МС: имамо две МС
- Регресија МС је Регресија СС / Регресија Дф.
- Резидуална МС је средња квадратна грешка (Ресидуал СС / Ресидуал Дф).
Ф: Ф тест за нулту хипотезу.
Значај Ф: П-вредности повезане са значајем
Коефицијент: Коефицијент вам даје процену најмањих квадрата.
Т статистика: Т статистика за нулту хипотезу наспрам алтернативне хипотезе.
П-вредност: Ово је п-вредност за тест хипотезе.
Доња и горња 95%: То су доња и горња граница интервала поузданости
Резидуални излаз. На основу података имамо 12 запажања. 2 ј колона представља предвидео продаје и 3 ИИИ колона остатака. Остаци су у основи разлика у предвиђеној продаји од стварне.
Пример # 2
Изаберите предвиђену колону продаје и маркетинга

Идите на групу графикона испод картице за уметање. Изаберите икону дијаграма расипања

Ово ће убацити дијаграм расејања у Екцел. Погледајте слику испод

Кликните десним тастером миша на било коју тачку, а затим одаберите Додај линију тренда у Екцелу. Ово ће додати линију тренда на ваш графикон.


- Можете да форматирате линију тренда тако што ћете кликнути десним тастером миша било где на линији тренда, а затим одабрати обликовати линију тренда.
- Можете да направите још побољшања на графикону. тј. форматирање линије тренда, боје и промене наслова итд
- Формулу можете приказати и на графикону тако што ћете означити приказ формуле на графикону и приказати Р квадратну вредност на графикону.
Још неколико примера анализе линеарне регресије:
- Предвиђање кишобрана продато на основу кише догодило се у области.
- Предвиђање продате наизменичне струје на основу температуре лети.
- Током испитне сезоне продаја Стационарног уређаја, продаја водича за испите је порасла.
- Предвиђање продаје када је Оглашавање урађено на основу серије Хигх ТРП у којој се оглашава, Популарност бренда амбасадора и Фоотфаллс на месту одржавања где се оглас објављује.
- Продаја куће на основу локалитета, подручја и цене.
Пример # 3
Претпоставимо да имамо девет ученика са њиховим нивоом интелигенције и бројем бодова које су постигли на тесту.
Ученик | Резултат теста | ИК |
РАМ | 100 | 145 |
Схиам | 97 | 140 |
Кул | 93 | 130 |
Каппу | 91 | 125 |
Рају | 89 | 115 |
Висхал | 86 | 110 |
Вивек | 82 | 100 |
Винаи | 78 | 95 |
Кумар | 75 | 90 |
Корак 1: Прво сазнајте зависне и независне променљиве. Овде је тест оцена зависна променљива, а ИК независна променљива, јер тест резултат варира како се ИК мења.
Корак 2: Идите на картицу Подаци - Кликните на Анализа података - Изаберите регресију - кликните У реду.

Ово ће отворити прозор Регресија за вас.

Корак 3. Распон резултата улазног теста у пољу за унос И опсега и ИК у пољу уноса Кс опсега. (Проверите налепнице ако имате заглавља у вашем опсегу података. Изаберите излазне опције, а затим проверите жељене остатке. Кликните Ок.

Добићете резиме излаз приказан на слици испод.

Корак 4: Анализа регресије према резимеу резултата
Резиме резултата
Вишеструко Р: Овде је коефицијент корелације 0,99, што је врло близу 1, што значи да је Линеарни однос веома позитиван.
Р квадрат: Вредност Р квадрата је 0,983, што значи да 98,3% вредности одговара моделу.
П-вредност: Овде је П-вредност 1,86881Е-07, што је врло мање од .1, што значи да ИК има значајне предиктивне вредности.
Погледајте графикон испод.

Можете видети да скоро све тачке падају у линију или у оближњу линију тренда.
Пример # 4
Морамо предвидети продају АЦ на основу продаје и температуре за други месец.
Месец дана | Темп | Продаја |
Јан | 25 | 38893 |
Феб | 28 | 42254 |
Мар | 31 | 42845 |
Апр | 33 | 47917 |
Може | 37 | 51243 |
Јун | 40 | 69588 |
Јул | 38 | 56570 |
Авг | 37 | 50000 |
Следите кораке у наставку да бисте добили резултат регресије.
Корак 1: Прво сазнајте зависне и независне променљиве. Овде је продаја зависна променљива, а температура независна променљива јер продаја варира како се температура мења.
Корак 2: Идите на картицу Подаци - Кликните на Анализа података - Изаберите регресију - кликните У реду.

Ово ће отворити прозор Регресија за вас.

Корак 3. Продаја улаза у пољу за унос И Ранге и температура у пољу Бок Кс Ранге. (Проверите налепнице ако имате заглавља у вашем опсегу података. Изаберите излазне опције, а затим проверите жељене остатке. Кликните Ок.

Ово ће вам дати резиме резултата као у наставку.

Корак 4: Анализирајте резултат.
Вишеструко Р: Овде је коефицијент корелације 0,877, што је близу 1, што значи да је Линеарни однос позитиван.
Р квадрат: Вредност Р квадрата је 0,770, што значи да 77% вредности одговара моделу
П-вредност: Овде је П-вредност 1,86881Е-07, што је врло мање од .1, што значи да ИК има значајне предиктивне вредности.
Пример # 5
Сада направимо регресиону анализу за више независних променљивих:
Морате предвидети продају мобилног уређаја који ће се представити следеће године. Имате цену и становништво земаља које утичу на продају мобилних телефона.
Мобилна верзија | Продаја | Количина | Популација |
САД | 63860 | 858 | 823 |
УК | 61841 | 877 | 660 |
КЗ | 60876 | 873 | 631 |
ЦХ | 58188 | 726 | 842 |
Х Н | 52728 | 864 | 573 |
АУ | 52388 | 680 | 809 |
НЗ | 51075 | 728 | 661 |
РУ | 49019 | 689 | 778 |
Следите кораке у наставку да бисте добили резултат регресије.
Корак 1. Прво сазнајте зависне и независне променљиве. Овде продаја зависи од променљиве и количине и популације. Обе су независне променљиве, јер продаја варира у зависности од количине и броја становника у земљи.
Корак 2. Идите на картицу Подаци - Кликните на Анализа података - Изаберите регресију - кликните У реду.

Ово ће отворити прозор Регресија за вас.

Корак 3. Унесите продају у оквир за унос И Ранге и одаберите количину и популацију у пољу за унос Кс Ранге. (Проверите налепнице ако имате заглавља у вашем опсегу података. Изаберите излазне опције, а затим проверите жељене остатке. Кликните Ок.

Сада покрените регресију користећи анализу података на картици Подаци. Ово ће вам дати доњи резултат.
Резиме резултата
Вишеструко Р: Овде је коефицијент корелације 0,93, што је врло близу 1, што значи да је Линеарни однос веома позитиван.
Р квадрат: Вредност Р квадрата је 0,866, што значи да 86,7% вредности одговара моделу.
Значај Ф: Значај Ф је мањи од .1, што значи да регресиона једначина има значајну предиктивну вредност.
П-вредност : Ако погледате П-вредност за количину и становништво, можете видети да су вредности мање од .1, што значи да количина и популација имају значајну предиктивну вредност. Мање вредности П значи да променљива има значајније предиктивне вредности.
Међутим, и количина и популација имају значајну предиктивну вредност, али ако погледате П-вредност за количину и популацију, тада можете видети да та количина има мању П-вредност у екцелу од популације. То значи да количина има значајнију предиктивну вредност од становништва.
Ствари које треба запамтити
- Увек проверите зависне и независне променљиве кад год одаберете било који податак.
- Линеарна регресијска анализа узима у обзир везу између Средње вредности променљивих.
- Ово само моделира однос између променљивих које су линеарне
- Понекад то није најбоље за решавање стварних проблема. На пример: (Старост и наднице). Већину времена зараде се повећавају како се старост повећава. Међутим, након пензионисања, старост се повећава, али зараде се смањују.