Нормална дистрибуција у статистици - дефиниција, пример, тумачење

Шта је нормална дистрибуција у статистици?

Нормална дистрибуција је крива расподеле фреквенције у облику звона која помаже у описивању свих могућих вредности које случајна променљива може узети у датом опсегу, при чему је већина подручја дистрибуције у средини, а мало је у реповима, на крајњим границама. Ова расподела има два кључна параметра: средњу вредност (µ) и стандардну девијацију (σ) која игра кључну улогу у израчунавању поврата имовине и стратегији управљања ризиком.

Како протумачити нормалну дистрибуцију

Горња слика показује да је статистичка нормална дистрибуција звонаста крива. Опсег могућих исхода ове расподеле су цели реални бројеви који леже између -∞ до + ∞. Репови звона се протежу на обје стране графикона (+/-) без ограничења.

  • Отприлике 68% свих посматрања спада у +/- једно стандардно одступање (σ)
  • Приближно 95% свих посматрања спада у +/- две стандардне девијације (σ)
  • Приближно 99% свих посматрања спада у +/- три стандардне девијације (σ)

Има искривљеност нуле (симетрија расподеле). Ако је дистрибуција података асиметрична, тада је дистрибуција неравномерна ако скуп података има искривљеност већу од нуле или позитивну закривљеност. Тада је десни реп расподеле продуженији од левог, а за негативну искривљеност (мању од нуле) леви реп ће бити дужи од десног репа.

Има куртозу од 3 (мери вршност расподјеле), што указује на то да расподјела није ни превише шиљаста ни превише танка репа. Ако је куртоза већа од три, него што је дистрибуција јача са дебљим реповима, а ако је куртоза мања од три, тада има танке репове, а тачка врха је нижа од нормалне расподеле.

Карактеристике

  • Они представљају породицу дистрибуције где средња вредност и одступање одређују облик дистрибуције.
  • Средња вредност, средња вредност и начин ове расподеле су једнаки.
  • Половина вредности је лево од центра, а друга половина десно.
  • Укупна вредност под стандардном кривом увек ће бити једна.
  • Највероватније је дистрибуција у центру, а мање вредности лежи на репу.

Трансформација (З)

Функција густине вероватноће (ПДФ) случајне променљиве (Кс) која следи расподелом дата је:

где је -∞ <к <∞; -∞ <µ 0

Где,

  • Ф (к) = Нормална вероватноћа Функција
  • к = случајна променљива
  • µ = Средња вредност дистрибуције
  • σ = Стандардна девијација расподеле
  • π = 3,14159
  • е = 2,71828

Формула трансформације

Где,

  • Кс = Случајна променљива

Примери нормалне расподеле у статистици

Размотримо следеће примере.

Пример # 1

Претпоставимо да компанија има 10000 запослених и вишеструку структуру плата према улози посла у којем запослени ради. Плате се генерално расподељују са просечном популацијом од µ = 60.000 УСД, а стандардно одступање становништва σ = 15.000 УСД. Колика ће бити вероватноћа да насумично одабрани запослени има плату мању од 45000 УСД годишње.

Решење

Као што је приказано на горњој слици, да бисмо одговорили на ово питање, морамо да сазнамо површину испод нормалне кривине од 45 до левог бочног репа. Такође, треба да користимо вредност З-табеле да бисмо добили прави одговор.

Прво, морамо да претворимо дату средњу вредност и стандардну девијацију у стандардну нормалну расподелу са средњом вредношћу (µ) = 0 и стандардном девијацијом (σ) = 1 користећи формулу трансформације.

Након конверзије, морамо потражити З-табелу како бисмо сазнали одговарајућу вредност, која ће нам дати тачан одговор.

Дато,

  • Средња вредност (µ) = 60.000 УСД
  • Стандардно одступање (σ) = 15000 УСД
  • Случајна променљива (к) = 45000 УСД

Трансформација (з) = (45000 - 60000/15000)

Трансформација (з) = -1

Сада је вредност која је еквивалентна -1 у З-табели 0,1587, што представља површину испод криве од 45 према путу лево. Указало је да када насумично бирамо запосленог, вероватноћа да зарадимо мање од 45000 УСД годишње износи 15,87%.

Пример # 2

Држећи се истог сценарија као горе, сазнајте вероватноћу да случајно одабрани запослени зарађује више од 80.000 УСД годишње користећи нормалну расподелу.

Решење

Дакле, у овом питању морамо да пронађемо осенчено подручје од 80 до десног репа користећи исту формулу.

Дато,

  • Средња вредност (µ) = 60.000 УСД
  • Стандардно одступање (σ) = 15000 УСД
  • Случајна променљива (Кс) = 80.000 УСД

Трансформација (з) = (80000 - 60000/15000)

Трансформација (з) = 1,33

Према З-табели, еквивалентна вредност 1,33 износи 0,9082 или 90,82%, што показује да је вероватноћа насумичног избора запослених који зарађују мање од 80 000 америчких долара годишње 90,82%.

Али што се тиче питања, морамо да утврдимо вероватноћу да случајни запослени зараде више од 80.000 америчких долара годишње, тако да вредност морамо да одузмемо од 100.

  • Случајна променљива (Кс) = 100% - 90,82%
  • Случајна променљива (Кс) = 9,18%

Дакле, вероватноћа да запослени зарађују више од 80.000 америчких долара годишње је 9,18%.

Користи

  • Техничка шема на берзи често је крива звона, која омогућава аналитичарима и инвеститорима да направе статистичке закључке о очекиваном приносу и ризику од деоница.
  • Користи се у стварном свету, као да се утврди највероватније најбоље време које пицерије требају за испоруку пице и још много стварних апликација.
  • Користи се за упоређивање висина датог скупа становништва у којем ће већина људи имати просечну величину, а врло мали број људи имаће просечну или испод просечне висине.
  • Користе се за одређивање просечног академског успеха ученика, што помаже упоређивању ранга ученика.

Закључак

Уобичајена дистрибуција налази примену у науци података и аналитици података. Напредне технологије попут вештачке интелигенције и машинског учења које се користе заједно са овом дистрибуцијом могу дати бољи квалитет података, што ће помоћи појединцима и компанијама у ефикасном доношењу одлука.

Занимљиви Чланци...