Емпиријско правило - дефиниција, формула, како се користи у статистици?

Шта је емпиријско правило у статистици?

Емпиријско правило у статистици наводи да се готово сва (95%) посматрања у нормалној расподели налазе унутар 3 стандардне девијације од средње вредности. Ово је врло важно правило и помаже у предвиђању.

Формула

Формула показује предвиђени проценат посматрања која ће се налазити у оквиру сваке стандардне девијације од средње вредности.

Правило каже да:

  • 68% посматрања лежи у оквиру +/- 1 стандардног одступања од средње вредности
  • 95% посматрања лежи у оквиру +/- 2 стандардних одступања од средње вредности
  • 7% посматрања лежи у оквиру +/- 3 стандардних одступања од средње вредности

Како се користи?

Ово се користи у тренду предвиђања скупа података. Када је скуп података опсежан и постане изазовно проучити целокупну популацију, тада се на узорку може применити емпиријско правило да би се добила процена како ће подаци у популацији реаговати ако се од вас затражи да пронађете просечну плату свих рачуновође у САД. Тада је то тежак задатак, јер је становништво огромно. Дакле, у том случају можете случајно да изаберете, рецимо, 90 посматрања из целе популације.

Дакле, сада ћете имати 90 плата. Треба да пронађете средњу и стандардну девијацију посматрања. Ако посматрање следи нормалну расподелу, онда се то може применити и може се извршити процена зараде свих рачуновођа у САД-у.

Рецимо да средња зарада узорка износи 90.000 УСД. А стандардно одступање је 5.000 УСД. Дакле, од целокупне популације, 68% рачуновођа прима плату у распону од +/- 1Стандардна одступања од просека. Како је средња вредност 90.000 америчких долара, а стандардна девијација 5.000 америчких долара. Дакле, 68% свих рачуновођа у САД-у плаћа се у распону од 90.000 УСД +/- (1 * 5.000 УСД). То је између 85.000 и 95.000 долара

Ако се мало више ширимо, тада 95% свих рачуновођа у САД-у плаћа у распону од Просечне +/- 2 стандардне девијације. 90.000 УСД +/- (2 * 5000). Дакле, распон је од 80.000 до 100.000 долара.

У ширем опсегу, 99,7% свих рачуновођа прима плате у распону од Просека +/- 3 Стандардна одступања. То је 90.000 +/- (3 * 5000). Распон је од 75.000 до 105.000 долара

Јасно се види да би се без проучавања целокупне популације могла направити процена у вези са популацијом. Ако неко планира да ради као рачуновођа у САД-у, онда може лако очекивати да ће му се плата кретати од 75.000 до 105.000 долара

Оваква процена помаже да се олакша рад и дају прогнозе у вези са будућношћу.

Примери емпиријских правила

Господин Кс покушава да пронађе просечан број година које особа преживи након пензионисања, с обзиром на то да је старосна граница за одлазак у пензију 60 година. Ако су средње године преживљавања од 50 случајних посматрања 20 година, а СД 3, тада сазнајте вероватноћу да особа ће примати пензију дуже од 23 године

Решење

Емпиријско правило наводи да ће се 68% посматрања налазити у оквиру 1 стандардне девијације од средње вредности. Овде је средина посматрања 20.

68% посматрања лежи у границама 20 +/- 1 (стандардно одступање), што је 20 +/- 3. Дакле, опсег је од 17 до 23.

Постоји 68% шансе да минимално година које особа преживи након пензионисања лежи између 17 и 23. Сада је проценат који лежи изван овог опсега (100 - 68) = 32%. 32 се дистрибуира подједнако на обе стране, што значи 16% шансе да ће минималне године бити испод 17 и 16% шансе да ће минималне године бити веће од 23.

Дакле, вероватноћа да ће особа повући више од 23 године пензије је 16%.

Емпиријско правило наспрам теореме Чебишева

Емпиријско правило се примењује на скупове података који следе нормалну расподелу која значи звоно. У нормалној дистрибуцији, обе стране дистрибуције имају по 50% вероватноће.

Ако се скуп података нормално не дистрибуира, постоји још једна апроксимација или правило које се примењује на све типове скупова података, а то је Цхебисхев-ова теорема. Каже три ствари:

  • Најмање 3/4 ог свих посматрања ће лежати у 2Стандард одступања од просека. То је снажна апроксимација. То значи да ако има 100 посматрања, а затим 3/4 ог од закључака који су 75 примедбе ће лежати у +/- 2 стандардне девијације од средње вредности.
  • Најмање 8/9 ог свих посматрања ће лежати у 3Стандард одступања од просека.
  • Најмање 1 - 1 / к 2 свих посматрања лежи у оквиру К стандардних одступања од средње вредности. Овде се К назива било којим целим бројем.

Када користити?

Подаци су попут злата у савременом свету. Огромни подаци долазе из различитих извора и користе се за различите апроксимације или прогнозе. Ако скуп података прати нормалну дистрибуцију, он приказује криву у облику звона; тада се може користити емпиријско правило. Примењује се на посматрања како би се створила апроксимација за популацију.

Једном када се види да посматрања показују структуру нормалне расподеле, следи се емпиријско правило да би се пронашло неколико вероватноћа посматрања. Правило је изузетно корисно за многе статистичке прогнозе.

Закључак

Емпиријско правило је статистички концепт који помаже да се прикаже вероватноћа посматрања и веома је користан при проналажењу апроксимације огромне популације. Увек треба напоменути да су то апроксимације. Увек постоје шансе за оутлиерс који не падну у дистрибуцији. Дакле, налази нису тачни и треба предузети мере предострожности када се поступа према предвиђању.

Занимљиви Чланци...