Хипергеометријска расподела (дефиниција, формула) - Како израчунати?

Дефиниција хипергеометријске дистрибуције

У статистикама и теорији вероватноће, хипергеометријска расподела је у основи засебна расподела вероватноће која дефинише вероватноћу к успеха (тј. Неке случајне извлачења за нацртани објекат који има неко одређено обележје) у н броја извлачења, без икакве замене, са датог величина популације Н која укључује тачно К објеката који имају ту особину, где извлачење може успети или не успети.

Формула за вероватноћу хипергеометријске расподеле изведена је помоћу одређеног броја јединица у популацији, броја јединица у узорку, броја успеха у популацији, броја успеха у узорку и неколико комбинација. Математички, вероватноћа је представљена као,

П = К Ц к * (Н - К) Ц (н - к) / Н Ц н

где,

  • Н = Број предмета у популацији
  • н = број предмета у узорку
  • К = Број успеха у популацији
  • к = број успеха у узорку

Средња и стандардна девијација хипергеометријске расподеле изражава се као,

Средња вредност = н * К / Н Стандардна девијација = (н * К * (Н - К) * (Н - н) / (Н 2 * (Н - 1))) 1/2

Објашњење

Корак 1: Прво одредите укупан број предмета у популацији, који је означен са Н. На пример, број играћих карата у шпилу је 52.

Корак 2: Затим одредите број предмета у узорку, означен са н-на пример, број карата извучених из шпила.

Корак 3: Следеће, одредите случајеве који ће се сматрати успехом у популацији, а означава се са К. На пример, број срца у целој шпилу, који је 13.

Корак 4: Затим одредите случајеве који ће се сматрати успехом у извученом узорку, а означава се са к. Нпр. Број срца на картама извученим из шпила.

Корак 5: Коначно, формула за вероватноћу хипергеометријске расподеле изведена је помоћу одређеног броја ставки у популацији (корак 1), броја јединица у узорку (корак 2), броја успеха у популацији (корак 3) и број успеха у узорку (корак 4) као што је приказано доле.

П = К Ц к * (Н - К) Ц (н - к) / Н Ц н

Примери хипергеометријске дистрибуције (са Екцел предлошком)

Пример # 1

Узмимо пример обичног шпила са картама за играње карата где се насумично извлачи 6 карата без замене. Одредите вероватноћу цртања тачно 4 црвене картице апартмана, тј. Дијаманата или срца.

  • С обзиром на то, Н = 52 (пошто се у обичном шпилу играју 52 карте)
  • н = 6 (Број насумично извучених карата са шпила)
  • К = 26 (с обзиром да у пакету дијаманата и срца има по 13 црвених картона)
  • к = 4 (Број црвених картона који се сматрају успешним у извученом узорку)

Решење:

Према томе, вероватноћа цртања тачно 4 црвене суите картице на извучених 6 карата може се израчунати користећи горњу формулу као,

Вероватноћа = К Ц к * (Н - К) Ц (н - к) / Н Ц н

= 26 Ц 4 * (52 - 26) Ц (6 - 4) / 52 Ц 6

= 26 Ц 4 * 26 Ц 2 / 52 Ц 6

= 14950 * 325/20358520

Вероватноћа ће бити -

Вероватноћа = 0,2387 ~ 23,87%

Према томе, постоји 23,87% вероватноће да извучете тачно 4 црвена картона док цртате 6 случајних карата из обичног шпила.

Пример # 2

Узмимо још један пример новчаника који садржи 5 новчаница од 100 долара и 7 новчаница од 1 долара. Ако су случајно одабране 4 новчанице, онда одредите вероватноћу избора тачно 3 новчанице од 100 долара.

  • Дато, Н = 12 (број рачуна од 100 УСД + број рачуна од 1 УСД)
  • н = 4 (Број рачуна одабран случајно)
  • К = 5 (пошто постоји 5 рачуна од 100 УСД)
  • к = 3 (Број новчаница од 100 УСД који се сматрају успехом у одабраном узорку)

Решење:

Према томе, вероватноћа избора тачно 3 новчанице од 100 долара у насумично изабраних 4 новчанице може се израчунати користећи горњу формулу као,

Вероватноћа = К Ц к * (Н - К) Ц (н - к) / Н Ц н

= 5 Ц 3 * (12 - 5) Ц (4 - 3) / 12 Ц 4

= 5 Ц 3 * 7 Ц 1 / 12 Ц 4

= 10 * 7/495

Вероватноћа ће бити -

Вероватноћа = 0,1414 ~ 14,14%

Због тога постоји 14,14% вероватноће да ћете изабрати тачно 3 новчанице од 100 долара док цртате 4 случајна рачуна.

Релевантност и употреба

Концепт хипергеометријске расподеле важан је јер пружа тачан начин одређивања вероватноће када број покуса није баш велик и ако се узорци узимају из коначне популације без замене. У ствари, хипергеометријска расподела је аналогна биномној расподели, која се користи када је број покуса суштински велик. Међутим, хипергеометријска дистрибуција се претежно користи за узорковање без замене.

Занимљиви Чланци...