Формула Оутлиер пружа графички алат за израчунавање података који се налазе изван датог скупа расподеле, а који могу бити унутрашња или спољна страна у зависности од променљивих.
Шта је Оутлиер формула?
Изузетак је тачка података датог узорка или датог посматрања или у дистрибуцији која лежи изван укупног обрасца. Уобичајено правило које каже да ће се тачка података сматрати одступањем ако има више од 1,5 ИКР испод првог квартила или изнад трећег квартила.
Речено другачије, ниски одступања леже испод К1-1,5 ИКР, а високи одступају К3 + 1,5ИКР
Треба израчунати медијану квартила, укључујући ИКР, К1 и К3.
Формула одступања представљена је на следећи начин,
Формула за К1 = ¼ (н + 1) тх члан Формула за К3 = ¾ (н + 1) тх појам Формула за К2 = К3 - К1

Корак по корак израчунавање одступања
Да би се израчунао Оутлиер потребно је следити кораке у наставку.
- Корак 1: Прво израчунајте квартиле, тј. К1, К2 и интерквартил
- Корак 2: Сада израчунајте вредност К2 * 1,5
- Корак 3: Сада од вредности израчунате у кораку 2 одузмите вредност К1
- Корак 4: Овде додајте К3 са вредношћу израчунатом у кораку 2
- Корак 5: Креирајте опсег вредности израчунатих у Корак 3 и Корак 4
- Корак 6: Распоредите податке у растућем редоследу
- Корак 7: Проверите да ли постоје вредности које су испод или веће од опсега створеног у Кораку 5.
Пример
Узмите у обзир скуп података следећих бројева: 10, 2, 4, 7, 8, 5, 11, 3, 12. Потребно је да израчунате све одступања.
Решење:
Прво морамо да поређамо податке у растућем редоследу да бисмо пронашли медијану која ће за нас бити К2.
2, 3, 4, 5, 7, 8, 10, 11, 12

Сада, будући да је број запажања непаран, а то је 9, медијана би лежала на петом положају, што је 7, а исто ће бити и К2 за овај пример.
Према томе, израчунавање К1 је следеће -
К1 = ¼ (9 + 1)
= ¼ (10)
К1 ће бити -

К1 = 2,5 члана
То значи да К1 је просек на 2 нд анд 3 ИИИ положаја примедби, што је 3 и 4 овде, и просечно исте је (3 + 4) / 2 = 3.5
Према томе, израчунавање К3 је следеће -

К3 = ¾ (9 + 1)
= ¾ (10)
К3 ће бити -

К3 = 7,5 члана
То значи да је К3 просек седмог и осмог места посматрања, што је овде 10 и 11, а просек истог је (10 + 11) / 2 = 10,5
Сада ће нижи одступања лежати испод К1-1,5ИКР, а одступања од К3 + 1,5ИКР
Дакле, вредности су 3,5 - (1,5 * 7) = -7, а већи опсег је 10,5 + (1,5 * 7) = 110,25.
Будући да нема запажања која се налазе изнад или испод 110,25 и -7, у овом узорку немамо никаквих одступања.
Пример необичне формуле у Екцелу (са Екцел предлошком)
Часови креативног подучавања разматрају могућност награђивања ученика који су међу најбољих 25%. Међутим, они желе да избегну било какве изузетке. Подаци су за 25 ученика. Помоћу једначине Оутлиер одредите да ли постоји оутлиер?
Решење:
Испод су дати подаци за израчунавање одступања.

Број запажања овде је 25, а наш први корак би био претварање горе наведених сирових података у растућем редоследу.
Медијан ће бити -

Средња вредност = ½ (н + 1)
= ½ = ½ (26)
= 13 тх терм
К2 или медијана је 68,00
Што је 50% становништва.
К1 ће бити -

К1 = ¼ (н + 1) тх члан
= ¼ (25 + 1)
= ¼ (26)
= 6,5- ти члан, што је еквивалентно 7- том члану
К1 је 56,00, што је најнижих 25%
К3 ће бити -

Коначно, К3 = ¾ (н + 1) тх члан
= ¾ (26)
= 19.50 термин
Овде просечна потребе треба узети, што је 19 -ог и 20 -ог термина који су 77 и 77 и просек исто (77 + 77) / 2 = 77,00
К3 је 77, што је топ 25%
Мали опсег
Сада ће нижи одступања лежати испод К1-1,5ИКР, а одступања од К3 + 1,5ИКР

Хигх Ранге -

Дакле, вредности су 56 - (1,5 * 68) = -46, а већи опсег је 77 + (1,5 * 68) = 179.
Нема истицања.
Релевантност и употреба
Формулу оутлиерс је веома важно знати, јер могу постојати подаци који би се искривили због такве вредности. Узмимо пример запажања 2, 4, 6, 101 и сада, ако неко узме просек ових вредности, биће 28,25, али 75% запажања лежи испод 7, па би стога била нетачна одлука у вези са запажањима овај узорак.
Овде се може приметити да се чини да се јасно оцртава 101, а ако се ово уклони, онда би просек био 4, што говори о вредностима или запажањима да леже у опсегу 4. Стога је веома важно спровести ово прорачун како би се избегла било каква злоупотреба водећих информација о подацима. Њих широко користе статистичари широм света кад год врше неко истраживање.