logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Management Engineering - Business Data Analytics

Full exam

Quesiti Parte A 06.09.2022 1 punto/domanda Quesito 1 Sulla base dei seguenti output del codice R, selezionare le risposte corrette: cor(y,x_3) 0.127521 Quesito 1 § Potremmo testare il requisito di esclusività (cioè se lo strumento è esogeno o robusto) calcolando la correlazione tra y e x3. §Non è possible stabilire se lo strumento utilizzato è rilevante. §L’output ottenuto è il risultato di una regressione discontinua di tipo fuzzy. §E’ opportuno ricorrere all’utilizzo di una o più variabili strumentali quando è presente un confounder non osservabile. §Nessuna delle altre risposte è vera. Quesito 1 § Potremmo testare il requisito di esclusività calcolando la correlazione tra������e ������_3.FALSO, in quanto non possiamo testare l’ipotesi di esclusività. §Non è possible stabilire se lo strumento utilizzato è rilevante.FALSO, è possibilire stabilirlo mediante il Weak Instrument test. §L’output ottenuto è il risultato di una regressione discontinua di tipo fuzzy. FALSO, l’output è il risultato di un modello con variabili strumentali. §E’ opportuno ricorrere all’utilizzo di una o più variabili strumentali quando è presente un confounder non osservabile.VERO. §Nessuna delle altre risposte è vera.FALSO, in quanto la 4 è vera. Quesito 2 § Il database db contiene 5 variabili: y (variabile di outcome), d (variabile di trattamento), x1, x2 e x3 (tre covariate osservabili). Sulla base dei seguenti output del codice R, che analizzano la comparabilità di trattati e non trattati prima e dopo un matching, selezionare le risposte corrette: Quesito 2 § Nel campione iniziale (prima della stima del Propensity Score Matching), i t-test forniscono evidenza che le unità trattate e le unità non trattate non risultano comparabili rispetto alle covariate osservabili x1, x2 e x3, ad un livello di significatività del 5%. §Usando il dataset matchato tramite Propensity Score Matching è possibile rifiutare l’ipotesi nulla di non comparabilità tra unità trattate e non trattate ad un livello di significatività del 10% e rispetto alle caratteristiche osservabili x1, x2 e x3. §Il Propensity Score Matching incrementa la validità esterna della stima dell’impatto della variabile d sulla variabile y ottenuta tramite il dataset matchato. §Nessuna delle altre risposte è vera. Quesito 27 § Nel campione iniziale (prima della stima del Propensity Score Matching), i t-test forniscono evidenza che le unità trattate e le unità non trattate non risultano comparabili rispetto alle covariate osservabili x1, x2 e x3, ad un livello di significatività del 5%.FALSO, le unità trattate e le unità non trattate risultano comparabili per la covariata x3. §Il dataset matchato dopo la stima del Propensity Score Matching presenta unità trattate e non trattate che risultano comparabili rispetto alle caratteristiche osservabili x1, x2 e x3, ad un livello di significatività del 10%.VERO, in quanto i p-value dei test sono superiori al 10%. •Il Propensity Score Matching incrementa la validità esterna di un’analisi svolta sul dataset matchato per la stima dell’impatto della variabile d sulla variabile y.FALSO. Il Propensity Score Matching può contribuire ad aumentare la validità interna dell’analisi, ma non ha impatto sulla possibilità di generalizzare i risultati dell’analisi effettuata. §Nessuna delle altre risposte è vera.FALSO, in quanto la 2 è vera. Quesito 38 Quesito 39 Quesito 3 La rete g1 e la rete g2 hanno due diverse distribuzioni del grado. Le due figure riportano i risultati di un’analisi per identificare quali modelli approssimino meglio la distribuzione del grado nei due casi. Selezionare le affermazioni corrette tra le seguenti: §Entrambi le analisi confrontano il modello poisson con il modello log-normale §FALSO. Il modello Poisson è confrontato col modello power-law §Il test a un lato indica che il modello m1 è il più efficace nello spiegare la distribuzione del grado per la rete 1 ad un livello di significatività del 5% §FALSO. Il p-value del test non è sufficientemente basso per rifiutare l’ipotesi nulla al livello di significatività prescelto §Il test a un lato indica che il modello m1 è il più efficace nello spiegare la distribuzione del grado per la rete 2 ad un livello di significatività del 5% §VERO. Il p-value è pari a 0. §Nella figura 2 la linea continua blu rappresenta il modello Poisson §FALSO. La linea blue rappresenta il modello power-law. §Tutte le altre risposte sono false. §FALSO. Quesito 4 Il seguente dataset contiene una covariata x, che è un numero naturale, e un outcome y, che è una variabile binaria: Quesito 4 Su tale dataset è stato addestrato il seguente albero decisionale: Qual è l’indice di impurità di Gini nel nodo “FALSE”? • 0.44 •Il nodo “FALSE” contiene le osservazioni da 1 a 6. Di queste 2 sono TRUE. Gini = 1 - (2/6)^2 - (4/6)^2 = 0.44 •0.33 •0.66 •0.80 •Nessuna delle altre risposte è corretta Quesito 5 E’ stato effettuato un algoritmo di clustering con il seguente comando: hc