Линеарна регресија (дефиниција, примери) - Како тумачити?

Преглед садржаја

Шта је линеарна регресија?

Линеарна регресија је у основи техника статистичког моделирања која се користи да покаже везу између једне зависне променљиве и једне или више независних променљивих. То је један од најчешћих типова предиктивне анализе. Ова врста дистрибуције формира се у линији, па се то назива линеарна регресија. У овом чланку узећемо примере Линеарне регресионе анализе у програму Екцел.

Да бисмо прво урадили линеарну регресиону анализу, треба да додамо екцел програмске додатке пратећи кораке.

Кликните на Датотека - Опције (ово ће отворити искачуће опције програма Екцел).

Кликните на програмске додатке - Изаберите Екцел програмске додатке из Манаге Дроп Довн у Екцелу, а затим кликните на Го.

Ово ће отворити искачуће прозоре додатака. Изаберите Аналисис ТоолПак, а затим кликните У реду.

Додатак за анализу података појавит ће се на картици Уметање.

Хајде да разумемо доле Примере линеарне регресионе анализе у екцелу.

Примери линеарне регресионе анализе

Пример # 1

Претпоставимо да имамо месечну продају и потрошили смо на маркетинг за прошлу годину, а сада треба да предвидимо будућу продају на основу прошлогодишње потрошње и утрошеног маркетинга.

Месец дана Оглашавање Продаја
Јан 40937 502729
Феб 42376 507553
Мар 43355 516885
Апр 44126 528347
Може 45060 537298
Јун 49546 544066
Јул 56105 553664
Авг 59322 563201
Сеп 59877 568657
Окт 60481 569384
Нема в 62356 573764
Дец 63246 582746

Кликните картицу Анализа података на картици Подаци и ово ће отворити скочни прозор за анализу података.

Сада одаберите Регресија са листе и кликните У реду.

Отвориће се искачући прозор за регресију.

Изаберите опсег продаје $ Ц $ 1: $ Ц $ 13 у пољу И оса, јер је ово зависна променљива, а $ Б $ 1: $ Б $ 14 у Кс оси, јер је потрошено оглашавање независна променљива.

Означите поље за ознаке ако сте у подацима одабрали заглавља, то ће вам дати грешку.

Изаберите опсег излаза ако желите да добијете вредност за одређени опсег на радном листу, а затим изаберите Нови слој радног листа: и то ће додати нови радни лист и дати вам резултат.

Затим означите поље Резидуал и кликните У реду.

Ово ће додати радне листове и дати следећи резултат.

Да разумемо резултате.

Резиме резултата

Вишеструко Р: Ово представља коефицијент корелације. Вредност 1 показује позитивну везу, а вредност 0 не показује никакву везу.

Р квадрат: Р квадрат представља коефицијент одлучности. Ово вам говори да проценат поена пада на линију регресије. 0,49 значи да 49% вредности одговара моделу

Прилагођени Р квадрат : Ово је прилагођени Р квадрат, који захтева када имате више од једне Кс променљиве.

Стандардна грешка: Ово представља процену стандардне девијације грешке. Ово је прецизност мерења коефицијента регресије.

Запажања: Ово је број запажања која сте узели у узорку.

АНОВА - Дф: Степени слободе

СС: Збир квадрата.

МС: имамо две МС

  • Регресија МС је Регресија СС / Регресија Дф.
  • Резидуална МС је средња квадратна грешка (Ресидуал СС / Ресидуал Дф).

Ф: Ф тест за нулту хипотезу.

Значај Ф: П-вредности повезане са значајем

Коефицијент: Коефицијент вам даје процену најмањих квадрата.

Т статистика: Т статистика за нулту хипотезу наспрам алтернативне хипотезе.

П-вредност: Ово је п-вредност за тест хипотезе.

Доња и горња 95%: То су доња и горња граница интервала поузданости

Резидуални излаз. На основу података имамо 12 запажања. 2 ј колона представља предвидео продаје и 3 ИИИ колона остатака. Остаци су у основи разлика у предвиђеној продаји од стварне.

Пример # 2

Изаберите предвиђену колону продаје и маркетинга

Идите на групу графикона испод картице за уметање. Изаберите икону дијаграма расипања

Ово ће убацити дијаграм расејања у Екцел. Погледајте слику испод

Кликните десним тастером миша на било коју тачку, а затим одаберите Додај линију тренда у Екцелу. Ово ће додати линију тренда на ваш графикон.

  • Можете да форматирате линију тренда тако што ћете кликнути десним тастером миша било где на линији тренда, а затим одабрати обликовати линију тренда.
  • Можете да направите још побољшања на графикону. тј. форматирање линије тренда, боје и промене наслова итд
  • Формулу можете приказати и на графикону тако што ћете означити приказ формуле на графикону и приказати Р квадратну вредност на графикону.

Још неколико примера анализе линеарне регресије:

  1. Предвиђање кишобрана продато на основу кише догодило се у области.
  2. Предвиђање продате наизменичне струје на основу температуре лети.
  3. Током испитне сезоне продаја Стационарног уређаја, продаја водича за испите је порасла.
  4. Предвиђање продаје када је Оглашавање урађено на основу серије Хигх ТРП у којој се оглашава, Популарност бренда амбасадора и Фоотфаллс на месту одржавања где се оглас објављује.
  5. Продаја куће на основу локалитета, подручја и цене.

Пример # 3

Претпоставимо да имамо девет ученика са њиховим нивоом интелигенције и бројем бодова које су постигли на тесту.

Ученик Резултат теста ИК
РАМ 100 145
Схиам 97 140
Кул 93 130
Каппу 91 125
Рају 89 115
Висхал 86 110
Вивек 82 100
Винаи 78 95
Кумар 75 90

Корак 1: Прво сазнајте зависне и независне променљиве. Овде је тест оцена зависна променљива, а ИК независна променљива, јер тест резултат варира како се ИК мења.

Корак 2: Идите на картицу Подаци - Кликните на Анализа података - Изаберите регресију - кликните У реду.

Ово ће отворити прозор Регресија за вас.

Корак 3. Распон резултата улазног теста у пољу за унос И опсега и ИК у пољу уноса Кс опсега. (Проверите налепнице ако имате заглавља у вашем опсегу података. Изаберите излазне опције, а затим проверите жељене остатке. Кликните Ок.

Добићете резиме излаз приказан на слици испод.

Корак 4: Анализа регресије према резимеу резултата

Резиме резултата

Вишеструко Р: Овде је коефицијент корелације 0,99, што је врло близу 1, што значи да је Линеарни однос веома позитиван.

Р квадрат: Вредност Р квадрата је 0,983, што значи да 98,3% вредности одговара моделу.

П-вредност: Овде је П-вредност 1,86881Е-07, што је врло мање од .1, што значи да ИК има значајне предиктивне вредности.

Погледајте графикон испод.

Можете видети да скоро све тачке падају у линију или у оближњу линију тренда.

Пример # 4

Морамо предвидети продају АЦ на основу продаје и температуре за други месец.

Месец дана Темп Продаја
Јан 25 38893
Феб 28 42254
Мар 31 42845
Апр 33 47917
Може 37 51243
Јун 40 69588
Јул 38 56570
Авг 37 50000

Следите кораке у наставку да бисте добили резултат регресије.

Корак 1: Прво сазнајте зависне и независне променљиве. Овде је продаја зависна променљива, а температура независна променљива јер продаја варира како се температура мења.

Корак 2: Идите на картицу Подаци - Кликните на Анализа података - Изаберите регресију - кликните У реду.

Ово ће отворити прозор Регресија за вас.

Корак 3. Продаја улаза у пољу за унос И Ранге и температура у пољу Бок Кс Ранге. (Проверите налепнице ако имате заглавља у вашем опсегу података. Изаберите излазне опције, а затим проверите жељене остатке. Кликните Ок.

Ово ће вам дати резиме резултата као у наставку.

Корак 4: Анализирајте резултат.

Вишеструко Р: Овде је коефицијент корелације 0,877, што је близу 1, што значи да је Линеарни однос позитиван.

Р квадрат: Вредност Р квадрата је 0,770, што значи да 77% вредности одговара моделу

П-вредност: Овде је П-вредност 1,86881Е-07, што је врло мање од .1, што значи да ИК има значајне предиктивне вредности.

Пример # 5

Сада направимо регресиону анализу за више независних променљивих:

Морате предвидети продају мобилног уређаја који ће се представити следеће године. Имате цену и становништво земаља које утичу на продају мобилних телефона.

Мобилна верзија Продаја Количина Популација
САД 63860 858 823
УК 61841 877 660
КЗ 60876 873 631
ЦХ 58188 726 842
Х Н 52728 864 573
АУ 52388 680 809
НЗ 51075 728 661
РУ 49019 689 778

Следите кораке у наставку да бисте добили резултат регресије.

Корак 1. Прво сазнајте зависне и независне променљиве. Овде продаја зависи од променљиве и количине и популације. Обе су независне променљиве, јер продаја варира у зависности од количине и броја становника у земљи.

Корак 2. Идите на картицу Подаци - Кликните на Анализа података - Изаберите регресију - кликните У реду.

Ово ће отворити прозор Регресија за вас.

Корак 3. Унесите продају у оквир за унос И Ранге и одаберите количину и популацију у пољу за унос Кс Ранге. (Проверите налепнице ако имате заглавља у вашем опсегу података. Изаберите излазне опције, а затим проверите жељене остатке. Кликните Ок.

Сада покрените регресију користећи анализу података на картици Подаци. Ово ће вам дати доњи резултат.

Резиме резултата

Вишеструко Р: Овде је коефицијент корелације 0,93, што је врло близу 1, што значи да је Линеарни однос веома позитиван.

Р квадрат: Вредност Р квадрата је 0,866, што значи да 86,7% вредности одговара моделу.

Значај Ф: Значај Ф је мањи од .1, што значи да регресиона једначина има значајну предиктивну вредност.

П-вредност : Ако погледате П-вредност за количину и становништво, можете видети да су вредности мање од .1, што значи да количина и популација имају значајну предиктивну вредност. Мање вредности П значи да променљива има значајније предиктивне вредности.

Међутим, и количина и популација имају значајну предиктивну вредност, али ако погледате П-вредност за количину и популацију, тада можете видети да та количина има мању П-вредност у екцелу од популације. То значи да количина има значајнију предиктивну вредност од становништва.

Ствари које треба запамтити

  • Увек проверите зависне и независне променљиве кад год одаберете било који податак.
  • Линеарна регресијска анализа узима у обзир везу између Средње вредности променљивих.
  • Ово само моделира однос између променљивих које су линеарне
  • Понекад то није најбоље за решавање стварних проблема. На пример: (Старост и наднице). Већину времена зараде се повећавају како се старост повећава. Међутим, након пензионисања, старост се повећава, али зараде се смањују.

Занимљиви Чланци...