8  Seminar 01: Variabile aleatoare și probabilități

8.1 Exercițiul 1

Fie A o variabilă aleatoare continuă cu distribuția U[0,6] (distribuție uniformă între 0 și 6).

  • a). Reprezentați grafic funcția densitate de probabilitate a lui A (distribuția lui A)
  • b). Calculați probabilitatea P(A>1)
  • c). Calculați probabilitatea P(A(0,2))
  • d). Reprezentați funcția de repartiție FA(x) și scrieți-i expresia matematică
  • e). Care e distribuția variabilei aleatoare B definită ca B=A2?
  • f). Care e distribuția variabilei aleatoare C definită ca C=3A?

Rezolvare

a). Distribuția uniformă U[0,6] este reprezentată grafic mai jos.

Distribuția uniformă U[0,6]

b). Probabilitatea P(A>1) reprezintă aria de sub densitatea de probabilitate wA(x), de la 1 la infinit (aici, până la 6).

P(A>1)=1wA(x)dx=1616dx=56

c). Probabilitatea P(A(0,2)) reprezintă aria de sub densitatea de probabilitate wA(x), de la 0 la 2. P(A(0,2))=02wA(x)dx=0216dx=13

d). Funcția de repartiție FA(x) este integrala de la la x a densității de probabilitate wA. Întrucât wA(x) este constantă între 0 și 6, FA(x) este o funcție liniară între 0 și 6, și constantă în afara acestui interval.

Așadar, graficul funcției de repartiție, este cel de mai jos.

Expresia matematică este: FA(x)={0,x016x,x(0,6)1,x6

e). Distribuția variabilei aleatoare B este distribuția variabilei A translatată cu 2 unități la stânga, așadar o distribuție uniformă între -2 și 4, U[2,4].

f). Distribuția variabilei aleatoare C este distribuția variabilei A scalată cu 3. Dacă A ia valori între 0 și 6, atunci C=3A ia valori între 0 și 18, având așadar o distribuție uniformă între 0 și 18, U[0,18].

8.2 Exercițiul 2

Fie A o variabilă aleatoare continuă cu distribuția normală N(μ=1,σ2=20).

  • a). Calculați probabilitatea P(A[2,4])
  • b). Care e distribuția variabilei aleatoare B definită ca B=A2?
  • c). Care este valoarea maximă a distribuției wA(x), și pentru ce valoare x se atinge?
  • d). (**) Care e distribuția variabilei aleatoare C definită ca C=3A?

Rezolvare

a). Probabilitatea P(A[2,4]) reprezintă aria de sub densitatea de probabilitate wA(x), de la 2 la 4. P(A[2,4])=24wA(x)dx=F(4)F(2) unde F(x) este funcția de repartiție a lui A, care se poate calcula cu formula: F(x)=12(1+erf(xμ2σ))

Așadar: P(A[2,4])=F(4)F(2)=12(1+erf(41220))12(1+erf(21220))=...

  1. Distribuția variabilei aleatoare B este distribuția variabilei A translatată cu 2 unități la stânga, așadar o distribuție normală cu media -1 și cu aceeași varianță, N(μ=1,σ2=20).

  1. Inspectând graficul funcției de densitate normală, se observă că maximul este atins întotdeauna în dreptul mediei. Aici, media are valoarea 1, deci maximul este: wA(1)=140πe(11)240=140πe0=140π

d). Dacă valorile lui C sunt triplul valorilor A, atunci am fi tentați să spunem că probabilitatea ca C să fie în jurul unei valori x este egală cu probabilitatea ca A să ia valori în jurul lui x3. Acest lucru s-ar traduce prin relația: wC(x)=wA(x3) Întrucăt A urmează o distribuție normală, am avea: wC(x)=wA(x3)=140πe(x31)240=140πe(x3)2940

Din pacate aici întâlnim o problemă, pentru că expresia la care am ajuns nu este o distribuție Gaussiană, întrucât σ de la exponent (unde 2σ2 este 940) este diferit de σ din numitorul fracției din față (unde σ2π=40π).

În realitate, ne induce în eroare faptul că “a lua valori în jurul lui x” este o formulare imprecisă, și însăși relația de la care am pornit, wC(x)=wA(x3), este incorectă.

Pentru o rezolvare corectă, ne întoarcem la definiția funcției de repartiție, pe care o putem defini întotdeauna în mod riguros: F(x)=P(Xx).

Așadar, dacă C este triplul lui A, atunci Cx este totuna cu Ax3, deci probabilitatea FC(x)=P(Cx) este în mod riguros aceeași cu FA(x3)=P(Ax3): FC(x)=FA(x3)

Densitatea de probabilitate este derivata funcției de repartiție, așadar: wC(x)=ddxFC(x)=ddxFA(x3)=ddxFA(x3)13=13wA(x3)=13140πe(x31)240=13140πe(x3)2940=13202πe(x3)22920=1σC2πe(xμC)22σC2

Recunoaștem în rezultatul de mai sus o distribuție normală, cu media μC=3 și cu deviația standard σC=320, adică σC2=920.

Așadar, la triplarea valorilor lui A, obținem o distribuție normală cu μ triplat și σ triplat (deci σ2 de 9 ori mai mare): wC(x)=N(μ=3,σ2=920)

Generalizare

Rezultatul de mai sus se poate generaliza.

Dacă o variabilă aleatoare cu distribuție normală se scalează cu o orice constantă c, rezultatul va urma tot o distribuție normală, având media scalată cu c și deviația standard scalată cu c (varianța σ2 scalată cu c2): cN(μ,σ2)=N(cμ,c2σ2)

În plus, aceeași metodă bazată pe funcția de repartiție se poate folosi și pentru alte distribuții, cum ar fi cea uniformă.

Temă pentru acasă: folosind aceeași metodă, demonstrați riguros că dacă o variabilă aleatoare cu distribuția uniformă U[a,b] este scalată cu o constantă c, rezultatul urmează o distribuție uniformă U[ca,cb].

8.3 Exercițiul 3

Considerând că scorul IQ urmează o distribuție N(μ=100,σ=15), calculați:

  • a). Probabilitatea ca o persoană oarecare să aibă IQ > 130
  • b). Dacă populația globului este 8 miliarde, câți oameni au IQ mai mic decât 75
  • c). (**)Ce IQ minim trebuie să ai pentru a fi între primii 2%?

Rezolvare

a). Probabilitatea ca o persoană oarecare să aibă IQ > 130 este: P(IQ>130)=130wIQ(x)dx=FIQ()FIQ(130)=112(1+erf(130100215))=0.0227=2.27%

b). Trebuie să calculăm probabilitatea ca o persoană oarecare să aibă IQ < 75, și să înmulțim cu populația globului: P(IQ<75)=75wIQ(x)dx=FIQ(75)FIQ()=12(1+erf(75100215))=0.0478 Așadar, numărul de oameni cu IQ < 75 este: 81090.0478=382.4106=382.4milioane

8.4 Exercițiul 4

Fie A o variabilă aleatoare discretă, cu valorile posibile {0,1,2,10}, toate având aceeași probabilitate.

  • a). Reprezentați grafic distribuția lui A
  • b). Calculați probabilitatea P(A[3,7]
  • b). Care e probabilitatea ca A să fie număr impar?

Rezolvare

  1. Avem 11 valori posibile, toate cu aceeași probabilitate, așadar distribuția lui A este o distribuție uniformă discretă, U[0,10]. Fiecare realizare are probabilitatea 111.

  1. Fiind o variabilă discretă, putem calcula probabilitățile prin adunarea probabilităților cazurilor favorabile.

Probabilitatea ca A să ia valori între 3 și 7 este sume celor 5 probabilități din dreptul valorile 3, 4, 5, 6 și 7: P(A[3,7])=511

c). Probabilitatea ca A să fie impar este suma probabilităților din dreptul valorilor 1, 3, 5, 7, 9: P(Aimpar)=511

8.5 Exercițiul 5

Calculați probabilitatea ca 3 variabile aleatoare X, Y, Z, independente și identic distribuite (i.i.d) cu distribuția normală N(μ=1,σ2=1) să fie pozitive simultan.

Rezolvare

Fiind variabile independente, probabilitatea că toate să fie pozitive este egală cu produsul probabilităților că fiecare să fie pozitivă: P(X>0Y>0Z>0)=P(X>0)P(Y>0)P(Z>0)

Întrucât toate urmează aceeași distribuție, probabilitatea ca X să fie pozitivă este egală cu probabilitatea ca Y sau ca Z să fie pozitivă, așadar trebuie de fapt să calculăm o singură probabilitate, și apoi să o ridicăm la puterea 3.

Avem: P(X>0)=(Y>0)=P(Z>0)=0wX(x)dx=F()F(0)=112(1+erf(0121))=112(1+erf(12))=0.841

Așadar, probabilitatea că toate să fie pozitive este: P(X>0,Y>0,Z>0)=0.8413=0.595

8.6 Exercițiul 6

Fie 3 variabile aleatoare cu distribuțiile: AN(μ=1,σ2=3)BN(μ=4,σ2=3)CN(μ=5,σ2=3)

  • a). Este mai probabil ca tripleta de valori (A, B, C) să ia valori în jurul lui (2, -6, 3) sau în jurul lui (-2, -3, 2)?
  • b). Găsiți 3 valori pozitive (x,y,z) pentru care probabilitatea ca (A, B, C) să aibă valori în jurul lui (x,y,z) să fie egală cu probabilitatea de a avea valori în jurul lui (2, -6, 3)

Rezolvare

TODO