Trójka z przodu

Na Quora pojawiło się ciekawe pytanie z rachunku prawdopodobieństwa. Ponieważ liczenie serii jest częścią moich zainteresowań postanowiłem spróbować na to pytanie odpowiedzieć (UPDATE 2021: oryginał mojej odpowiedzi już niedostępny - skasowałem konto na Quora).

Pytanie: Jak znaleźć prawdopodobieństwo że sekwencja rozpoczyna się serią o długości 3?

Zarówno pytanie jak i odpowiedź można znaleźć tuaj (UPDATE 2021: oryginał mojej odpowiedzi już niedostępny - skasowałem konto na Quora): - poniżej tłumacznenie na polski.


Układamy losowo 5 zer i 6 w jednej linii. Maksymalna, nieprzerwana sekwencja symboli to seria. Na przykład sekwencja 01 000 11 0 111 zawiera 6 serii. Długość serii to liczba symboli zawartych w tej serii.

Najpierw należy policzyć liczbę ustawien (sekwencji), które zaczynają się od trzech zer, po których następuje jedynka. Powiedzmy, że mamy 5 kulek, na których namalowano cyfrę 0 i 6 kulek na których namalowano cyfrę 1. Mamy również 11 kubków, do których możemy te kulki wkładać. Zaczynamy od odłożenia na bok trzech kulek z zerem które włożymy do pierwszych trzech kubków i jednej z jedynką przeznaczoną do czwartego kubka. Zostają nam dwie kulki z 0, które możemy rozłożyć w pozostałych 7 kubkach - w pozostałych będą kulki z jedynkami. Opisaną czynność można wykonać na następującą liczbę sposobów: \[7\choose{2}\]

Pełna liczba różnych konfiguracji to

\[11\choose{5}\]

  • rozkładamy 5 kulek z zerami losowo, a w pozostałych będzą jedynki. W związku z tym prawdopodobieństwo można obliczyć jako:

\[p=\frac{7\choose{2}}{11\choose{5}}=0.0454545\]

Obliczenia te można łatwo sprawdzić przy pomocy poniższej symulacji:

set.seed(777)
balls <- c(rep(0,5), rep(1,6))
n <- 10000000
register <- 0
for (i in 1:n){
   draw <- sample(balls,11)
      if ((sum(draw[1:3])==0) & draw[4]==1)
        register <- register+1
  }
 print(register/n)
[1] 0.0454394

ps. “Zmiana kodu, trójka z przodu” mówiło się (i być może nadal się mówi) gdy ktoś kończył 30 lat :)

Avatar
Jarosław Piskorski
Physicist and Medical Biologist

Research interest - heart rate variability, statistics, machine learning, time series analysis

Powiązane