logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Computer Engineering - Statistica e Calcolo delle Probabilià

Raccolta temi d'esame A.A. 19-20

Other

Politecnico di Milano Temi d'esame di 099319-Probabilita e statistica per l'informatica dell'AA 2019/20 per ING-INF (laurea) Docenti: Alberto Barchielli, Ilenia Epifani, Lucia Ladelli21 febbraio 2021 1 2 Primo appello di Probabilità e statistica per l'Informatica A. Barchielli, I. Epifani e L. Ladelli16.06.2020 ©I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Giusticare adeguatamente tutte le risposte. 1 Domande di teoria D 1Un unico apparato è formato dancomponenti elettronici collegati in serie; siaSil tempo di vita (espresso in ore) di questo apparato. I componenti usati sono indipendenti tra loro, non soggetti ad usura (cioè c'è assenza di memoria) ed hanno tutti durata media pari aore. 1.Determinare l'espressione diSin funzione dei tempi di vita dei singoli componenti del sistema. Denire la proprietà diassenza di memoria(cioèassenza di usura) per una variabile aleatoria assolutamente continuaT. 2.Dopo avere identicato la distribuzione della durata di ogni componente, determinare la funzione diripartizione del tempo di vitaSdel sistema e riconoscerla. Possiamo dire che l'intero sistema non è soggetto ad usura? Soluzione1.Un apparato con componenti in serie smette di funzionare appena smette di funzionare uno deicomponenti. Se chiamiamoT 1; : : : ; T ni tempi di vita dei singoli componenti in serie, abbiamo S= min i=1;:::;nf T ig . La proprietà di assenza di memoria (o di non usura) per una v.a. assolutamente continuaT >0dice che P(T > t+sjT > s) =P(T > t);8t0;8s0: L'unica distribuzione con queste proprietà è l'esponenziale; imponendo media, si ha:T E(1=), FT( t) =1 (0;+1)( t) 1e t= . 2.I vari componenti in serie sono indipendenti, esponenziali (per la mancanza di memoria) e iden-ticamente distribuiti (avendo la stessa media):T i E (1=). Considerando la probabilità di sopravvivenza no al tempot >0, cioèP(S > t), abbiamo P(S > t) =P(T 1> t; T 2> t; : : : ; T n> t ) =n Y i=1(1 F Ti( t)) = (1F T( t))n = e nt= : DunqueF S( t) =1 (0;+1)( t) 1e nt= , cioèSha una distribuzione esponenziale di media=ned essendo esponenziale gode della proprietà di mancanza di memoria.D 2 Fornire uno stimatore non distorto e consistente in media quadratica per il parametropdi una popolazione Bernoulliana basato su un campione casuale di dimensionen. 1.Vericare che lo stimatore proposto è eettivamente non distorto e consistente in media quadratica. 2.Appellandosi ad un opportuno teorema, determinare la distribuzione asintotica dello stimatore pro-posto (distribuzione approssimata perngrande). Citare il nome del teorema utilizzato e, se vi avanza tempo, fornirne anche l'enunciato. SoluzioneSiaX 1; : : : ; X nil campione casuale dalla popolazione Be (p). Osservando chepè la media della popolazione, stimiamopcon la media campionariaX n= (P n i=1X i) =n. 1 1.Abbiamo E p[ X i] = peVar p[ X i] = p(1p). Per la linearità del valore atteso otteniamo EphX ni =1n n X i=1E p[ X i] = p: Dunque lo stimatore proposto è non distorto; in questo caso l'errore quadratico medio dello stimatore si riduce alla sua varianza,MSE p(X n) = Var phX ni . Per l'indipendenza e le proprietà della varianza abbiamo VarphX ni =1n 2n X i=1Var p[ X i] =p (1p)n ; che tende a zero pern!+1, cosa che corrisponde alla consistenza in media quadratica. 2.Dal Teorema Centrale del Limite (enunciato: Teorema 4.11.6 nelle dispense) abbiamo che, perv.a. i.i.d. con varianza nita, la media campionaria è asintoticamente normale di media asintotica Ep[ X i] = pe varianza asintoticaVar p[ X i] =n=p(1p)=n.2 Esercizi Esercizio 1La funzione di densità congiunta della coppia di variabili aleatoriediscreteX; Yè pX;Y( x; y) =( 2x+y18 se x= 1;2ey= 1;2 0altrove. 1.Determinare le densità marginali diXe diY;X; Ysono indipendenti? 2.CalcolareP(X=Y),P(X < Y)e la probabilità dell'eventofX=Ygdato l'eventofXYg. 3.Determinare la probabilità che esattamente 2 coppie di un campione casuale accoppiato(X 1; Y 1) , : : :,(X 10; Y 10) estratto dap X;Yabbiano la prima coordinata Xstrettamente minore della seconda coordinataY. 4.Approssimare la probabilità che la prima coordinataXsia strettamente minore della seconda coor- dinataYper almeno 30 coppie di un campione casuale accoppiato(X 1; Y 1) ; : : : ;(X 100; Y 100) estratto dap X;Y. SoluzioneLa densitàp X;Ypuò essere rappresentata dalla seguente tabella a doppia entrata XnY12p X13 =184 =183 =18 + 4=18 = 7=18 25 =186 =185 =18 + 6=18 = 11=18p Y3 =18 + 5=18 = 8=184 =18 + 6=18 = 10=181 1.Le densità marginali di Xe diYsono state ottenute sull'ultima colonna e l'ultima riga, rispettiva- mente; per esempiop X(1) = p X;Y(1 ;1) +p X;Y(1 ;2) = 7=18. Si osserva che pX;Y(1 ;2) =29 6 =718  1218 = p X(1) p Y(2) QuindiX; YNON sono indipendenti. 2 2. P(X=Y) =P(X= 1; Y= 1) +P(X= 2; Y= 2) =p X;Y(1 ;1) +p X;Y(2 ;2) =318 + 618 = 0 :5 P(X < Y) =P(X= 1; Y= 2) =p X;Y(1 ;2) =418 = 29 P(fX=YgjfXYg) =P (fXYgjfX=Yg)P(X=Y)P (XY)= 1 P(X=Y)P (XY) =P (X=Y)P (X=Y) +P(X < Y)= 0 :50 :5 + 2=9= 913 ' 0:6923: L'ultimo risultato può essere ottenuto anche nel seguente modo: si osservi chefX=Yg  fXYg; dalla denizione di probabilità condizionata si ha P(fX=YgjfXYg) =P (fXYg \ fX=Yg)P (XY)= P (X=Y)P (X=Y) +P(X < Y)=    Il numero delle coppieS ndi un campione casuale accoppiato (X 1; Y 1) ; : : : ;(X n; Y n) estratto dap X;Ycon X < Ypuò essere visto come il numero di successi (X < Y) con probabilità di successoP(X < Y) = 2=9 innprove di Bernoulli (osservazioni accoppiate nel campione), quindiS n Bi(n;2=9). Segue che: 3.pern= 10, si haS 10 Bi(10;2=9)eP(S 10= 2) = 10 2  29  2 79  8 =20 789 9' 0:2976. 4.pern= 100,S 100 Bi(100;2=9)e la probabilità cercata èP(S 100 30). Perngrande, per il teore- ma centrale del limite, controllato che1007=9>1002=9'22:22>5, si ha approssimativamente S100 N (200=9;1400=81); con la correzione di continuità si ottiene P(S 100 30) = 1P(S 100 29) = 1P(S 100 29:5) '1 29:5200=9p 1400 =81 = 1 6:55p 14  '1(1:75)'10:9599 = 0:0401:Esercizio 2 Nella trasmissione di un segnale, tale segnaleviene sporcato da due erroriX; Ynormali indipendenti (gaussiani) tali cheX N(0; 2 X) eY N(0;1:0), dimodoché il segnale ricevuto èW= +X+Y. 1.Fornire valore atteso, varianza e distribuzione diWin funzione die2 X. La trasmissione del segnaleè stata ripetuta 5 volte e sono stati ricevuti i seguenti valori w1= 17 :98; w 2= 20 :43; w 3= 22 :93; w 4= 19 :71; w 5= 20 :72 (per questi dati:P 5 i=1w i= 101 :77eP 5 i=1w2 i= 2084 :2527). 2.Impostare un opportuno test per provare se il segnale trasmessosupera20: il test sia tale che la probabilità dell'errore di primo tipo diriutare l'ipotesi che il segnalenon superi20, quando in realtà questa ipotesi è corretta, sia minore o uguale di = 5%. Quale decisione si prende? Successivamente, il segnale è stato ritrasmesso altre 10 volte (sempre in modo indipendente) e del nuovo campione casuale di segnaliW 6; : : : ; W 15ricevuti sono stati registrati i seguenti valori 15 X j=6w j= 199 :75;15 X j=6w 2 j= 4013 :613: 3 3.Aggiornare le stime di e della varianza2 Wdi Wusando il totale dei 15 segnali ricevutiw 1; : : : ; w 15. 4.Sulla base del totale dei 15 segnali ricevutiw 1; : : : ; w 15, qual è la stima di un conne superiore di condenza 95% per2 W? Dedurne una per 2 X. Soluzione1.La variabile aleatoriaWè gaussiana perché è il risultato di una somma di due v.a. gaussiane indipendenti e di una costante. Inoltre segue dalle proprietà di valore atteso e varianza che E(W) = E(X) + E(Y) += 0 + 0 +=Var(W) = Var(X) + Var(Y) =2 X+ 1 In conclusioneW N(; 2 W) con2 W= 2 X+ 1 ; si noti che sia la media sia la varianza diWsono incognite. 2.Seriutare l'ipotesi che il segnalenon superi20quando in realtà questa ipotesi è correttacostituisce un errore di I tipo, alloraH 0: 20e si tratta di vericareH 0: 20controH 1:  >20. La statistica test è T=W 5 20q S 2 W= 5 =20 t(4) e si riutaH 0a livello = 5%se t= w 5 20q s 2 W= 5 t 0:05;4= 2 :132. Con i dati forniti si ha: w 5= 20 :354, s2 W= P5 i=1w2 i 5 w2 5 =4'3:2065e t'0:4420 0set0 Il parametro#è positivo e incognito. 1.Determinare la mediaE #( T)e la caratteristica=(#)data dalla probabilità che trascorrano almeno 9 ore senza guasti. 4 Sono stati osservati i seguenti 6tempi al primo guasto 3.18, 1.93, 1.90, 11.00, 25.10, 42.10 che costituiscono la realizzazione campionaria di un campione casualeT 1; : : : ; T niid f #con n= 6(per questi dati:P 6 i=1t i= 85 :21eP 6 i=1t0 :5 i' 19:3660). 2.Determinare con il metodo dei momenti lo stimatoree e la stimae #per#. 3.Determinare gli stimatori di massima verosimiglianza (ML)b per#,b Kpere le rispettive stime b #,b k. SoluzioneLa densitàf #è una densità di Weibull con parametro di forma (shape) 0:5e tasso (rate)#: TWeib(0:5; #). 1.Segue dal formulario cheE#( T) =(1 + 1 =0:5)# 1 =0:5=(3)# 2=2# 2 oppure, si calcola direttamente l'integrale:E #( T) =Z 1 0t 0:5#t0 :51 e #t0 :5 dt=: : :. La caratteristicaè =P #( T >9) =Z 1 90 :5#u0 :51 e #u0 :5 du=Z 1 p9 # e #v dv= e #p9 = e 3# [col cambio di variabilev=u0 :5 ]. 2.Per il metodo dei momenti, dobbiamo eguagliare la media della popolazione2=#2 alla media campionaria, cioè2=#2 =T 6, quindi e  =s2 T 6; e #=r2 685 :21'p0 :1408'0:3753: 3.Poiché tutte le osservazionit 1; : : : ; t nsono strettamente positive qualunque sia # >0, la funzione di verosimiglianza è L#( t) =n Y i=1f #( t i) =n Y i=10 :5#t0 :51 ie #t0 :5 i=#n n Y i=10 :5t0 :51 i e #P n i=1t0 :5 i e la log-verosimiglianza èl #( t) = lnL #( t) =nln#+ lnn Y i=10 :5t0 :51 i #n X i=1t 0 :5 i, che ha un massimo in#=nP n i=1t0 :5 i, in quanto dl #( t)d #= n# n X i=1t 0 :5 i 0se e solo se#nP n i=1t0 :5 i: Quindi si hab  =nP n i=1T0 :5 i; b #'619 :3660' 0:3098: Segue dal Principio di Invarianza per gli M.L.E. cheb K=(b ) = exp 3 nP n i=1T0 :5 i ; dunque la relativa stima èbk= e 30:3098 '0:3948:5 Secondo appello di Probabilità e Statistica per l'Informatica A. Barchielli, I. Epifani e L. Ladelli18.07.2020 ©I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Giusticare adeguatamente tutte le risposte. 1 Domande di teoria D 1Sia( ;F; P)uno spazio di probabilità. Consideriamo due eventiA; B2F. 1.Cosa vuol dire cheAeBsonoincompatibili? Cosa vuol dire cheAeBsonoindipendenti? 2.Supponendo di avere già dimostrato la proprietà di additività nita perPa partire dagli assiomi, fornire e dimostrare la formula per la probabilità dell'unioneP(A[B), conA; Beventi qualsiasi. 3.Nel seguito assumiamoP(A) = 0:5eP(A[B) = 0:6. DeterminareP(B)nei seguenti casi: (a)AeBsono incompatibili; (b)AeBsono indipendenti; (c)P(AjB) = 0:4. Soluzione1.AeBsi diconoincompatibilise la loro intersezione è vuota:A\B=;. Gli eventiAeBsi diconoindipendentiseP(A\B) =P(A)P(B). 2.La proprietà richiesta èP(A[B) =P(A) +P(B)P(A\B). Dimostrazione: si può scrivere A[B= (A\Bc )[(A\B)[(Ac \B); A= (A\Bc )[(A\B); B= (A\B)[(Ac \B): Gli eventi coinvolti nelle tre decomposizioni sono incompatibili; dunque, per la proprietà di additività si haP(A[B) =P(A\Bc ) +P(A\B) +P(Ac \B) =P(A) +P(Ac \B) e aggiungendo e togliendoP(A\B)si ottiene la formula voluta. 3.(a)Dato cheP(A\B) = 0, si haP(A[B) =P(A) +P(B), da cui si ottieneP(B) =P(A[B) P(A) = 0:1. (b)Dato cheP(A\B) =P(A)P(B), si haP(A[B) =P(A) +P(B)P(B)P(A) =P(A) + P(B)(1P(A)), da cui si ottieneP(B) =P (A[B)P(A)1 P(A)= 0 :10 :5= 0 :2. (c)Dalla denizione di probabilità condizionata si haP(A\B) =P(AjB)P(B), e poi si ottiene P(A[B) =P(A) +P(B)P(AjB)P(B). Dunque si ricava P(B) =P (A[B)P(A)1 P(AjB)= 0 :10 :6= 16 = 0 :1(6):D 2 Nel caso di un campione casuale di numerositànestratto da una popolazione gaussiana di media incognitae varianza nota2 0, si consideri il problema di verica di ipotesi H 0:  0contro H 1:  <  0 con livello di signicatività . 1.Ottenere l'espressione della funzione di potenza del test z unilatero in termini della funzione diripartizione normale standard. (Ricordarsi di giusticare adeguatamente l'espressione fornita.) 1 2.Nel caso = 0:1, 0= 1,2 0= 49 ,n= 16, calcolare la probabilità di commettere un errore di secondo tipo se=3. Soluzione1.Indicando conX nla media campionaria, si riuta H 0se il valore osservato della statistica testX n  0 0=pn è minore o uguale a z . La funzione di potenza del test è data dalla probabilità di riutareH 0in funzione di (ristretta aiche soddisfanoH 1), cioè () =P X n  0 0=pn  z  =P X n  0=pn  (  0 )pn  0 z  =  ( 0 )pn  0 z  ; ristretta ai <  0. 2.Per = 0:1, 0= 1,2 0= 49 ,=3,n= 16, si ha: z = z 0:1' 1:28;(  0 )pn  0= 87 ' 1:14;(  0 )pn  0 z ' 0:14; e la probabilità d'errore di secondo tipo richiesta è (3) = 1(3) = 1 87 z 0:1 '1(0:14) = (0:14)'0:5557:2 2 Esercizi Esercizio 1Nell'AA 2019-20 si sono immatricolati al Politecnico di Milano 5078 maschi e 2498 femmine. Inoltre, il79:87%dei maschi e il51:32%delle femmine si è immatricolato a Ingegneria Industriale e dell'In- formazione. Se scegliamo a caso uno studente del Politecnico di Milano (immatricolatosi nel 2019-20): 1.Qual è la probabilità che sia immatricolato a Ingegneria Industriale e dell'Informazione? 2.Qual è la probabilità che sia maschio se risulta immatricolato a Ingegneria Industriale e dell'Infor-mazione? SoluzioneIntroduciamo gli eventi:M=uno studente del Politecnico di Milano (immatricolatosi nel 2019-20) scelto a caso è maschio,F=uno studente del Politecnico di Milano (immatricolatosi nel 2019- 20) scelto a caso è femmina,I=uno studente del Politecnico di Milano (immatricolatosi nel 2019-20) scelto a caso risulta immatricolato a Ingegneria Industriale e del l'Informazione. Si ha allora P(M) =50785078 + 2498 = 50787576 ' 0:6703;P(F) = 1P(M) =24987576 ' 0:3297 P(IjM) = 0:7987;P(IjF) = 0:5132: 1.Per la formula delle probabilità totali: P(I) =P(IjM)P(M) +P(IjF)P(F) = 0:798750787576 + 0 :513224987576 = 5337 :7737576 ' 0:7046: 2.Per la formula di Bayes:P(MjI) =P (IjM)P(M)P (I)= 4055 :7995337 :773' 0:7598:Esercizio 2 Le variabili aleatorieXeYhanno densità congiunta assolutamente continua fX;Y( x; y) =( 32 ( x2 +y2 )sex2(0;1)ey2(0;1) 0altrimenti. 1.CalcolareE 2X 2 +Y2 . 2.Calcolare le densità marginalif Xdi Xedf Ydi Y; fornire una diversa densità congiunta~ fsuR2 , avente le stesse densità marginalif X; f Yappena trovate. Soluzione 1.E 2X 2 +Y2 =Z +1 1Z +1 12x 2 +y2f X;Y( x; y) dxdy=Z 1 0Z 1 02x 2 +y232 ( x2 +y2 ) dxdy= =Z 1 0Z 1 03 d xdy= 3: 2.Per ragioni di simmetria,X; Yhanno le stesse densità marginalif X= f Y= fcon f(x) =Z +1 1f X;Y( x; y)dy=8 < :R 1 032 ( x2 +y2 )dy=32 x2 +y 32 1 0se x2(0;1) 0altrimenti= 3 x2 + 12 1 (0;1)( x) 3 Osserviamo che nel quadrato (0;1)2 f(x)f(y) =3 x2 + 12  3 y2 + 12 = 9 x2 y2 + 3x2 +y2 + 14 = 32 ( x2 +y2 ) se e solo se ox= 1=p3 oy= 1=p3 e quindif X;Y6 =f Xf Yal di fuori di questi due segmenti e cioè su un insieme di area positiva. Ma~ f(x; y) :=f(x)f(y)è una densità di probabilità, infatti è non negativa ed integra a 1 suR2 ; in particolare~ f(x; y) :=f(x)f(y)è la densità congiunta di due variabili aleatorie~ X ;~ Yi :i:d: f.Esercizio 3 SiaX 1; : : : ; X nun campione aleatorio estratto dalla popolazione di densità f#( x) =( #8#x # +1se x >8 0altrove dove# >0è un parametro incognito. 1.Determinare la densità della variabile aleatoriaY i= ln X i ln 8per ognii. Dedurre la media e la varianza diY n=P n i=1Y in . 2.Determinare lo stimatore di massima verosimiglianza (ML)b ndi #eT ndi (#) = 1=#. 3.Determinare la distribuzione asintotica diT ne, per n= 121, calcolare un valore approssimato della P# T1210: Si può usare questo risultato per costruire una qualche inferenza statistica su#? (Ricordarsi di giusticare adeguatamente tutte le aermazioni.) Soluzione 1.PoichéP #( X i> 8) = 1alloraP #(ln X i ln 8>0) = 18i= 1; : : : ; n, da cui per la f.d.r. diY isi ha FYi( y) = 0sey0. Invece sey >0: FYi( y) =P #(ln X i ln 8y) =P #( X i 8ey ) =F Xi(8ey ) che è derivabile per ogniy >0con F0 Yi( y) = 8ey f#(8ey ) =#e #y Segue cheY 1; : : : ; Y ni :i:d:  E(#)conE #( Y i) = 1 =#eVar #( Y i) = 1 =#2 . Segue dalle proprietà di media e varianza della media campionaria di v.a. indipendenti che E#Y n = E#( Y 1) =1# ; Var #Y n =Var #( Y 1)n = 1n# 2: 2.Per determinare l'MLE^ ndi #, possiamo usare equivalentemente il campione aleatorio originale X1; : : : ; X ni :i:d: f #o quello trasformato Y 1; : : : ; Y ni :i:d:  E(#). Abbiamo visto a lezione che per Y1; : : : ; Y ni :i:d:  E(#) b n=nP n i=1Y i= nP n i=1ln X i nln 8: 4 Per il Principio di Invarianza degli MLE si ha che T n= k(b n) =Y n. Se invece svolgiamo direttamente i conti sulla verosimiglianza diX 1; : : : ; X ni :i:d: f #vale che qua- lunque sia# >0, la funzione di verosimiglianza è L#( x) =n Y i=1f #( x i) =n Y i=1# 8#x # +1 i= #n 8n# n Y i=1x #1 i e la log-verosimiglianza èl #( x) = lnL #( x) =nln#+n#ln 8(#+ 1)n X i=1ln x i, che ha un massimo in#=nP n i=1ln x i nln 8in quanto dl #( x)d #= n# + nln 8n X i=1ln x i 0se e solo se#nP n i=1ln x i nln 8: 3.PoichéT nè la media campionariaY ndel campione Y 1; : : : ; Y ni :i:d:  E(#), per il teorema centrale del limite, la distribuzione asintotica diT nè N(1# ;1n# 2 ) ; pern= 121, per ogni# >0: P# T121 23). Poichénp'1:89la densità diSpuò quindi essere approssimata da una densità di Poisson di parametro=np'1:89. Si ha quindi: P(S 2:928))10; in base a questa regola del pollice, la scelta ricade sulla approssimazione di Poisson). Nel caso di difettositàp= 0:07, il valore esatto della probabilità cercata (arrotondato alla quarta cifra decimale) è P0:07( X7) = 1P 0:07( X6) = 0:5557: 3 Con l'approssimazione P(1000:07) P(7)dellaB(100; 0:07)si ottiene P0:07( X7)'16 X k=07 kk !e 7 '0:5503; mentre con l'approssimazione normaleN(1000:07; 1000:070:93) N(7; 6:51)con correzione di continuità, si trova P0:07( X7)'1 6:57p 6 :51 =  76:5p 6 :51 '(0:2)'0:5793: In questo caso, la regola del pollice di usare l'approssimazione gaussiana senp >5ed n(1p)>5porta a scegliere quella gaussiana (perchénp= 7); invece la regola del pollice basata sunp(1p) = 6:51