logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Mathematica Engineering - Modelli e Metodi dell'Inferenza Statistica

Progetto statistica - Lista degli strumenti

Laboratory

Progetto Statistica - Lista degli strumenti Test di normalità Comando per il test Shapiro Wilk QQ plot Intervallo di confidenza Costruito manualmente fissato alfa NB Controllo che i dati siano normali e se la varianza è nota o incognita Test d'ipotesi Costruito manualmente fissato alfa NB Controllo che i dati siano normali e se la varianza è nota o incognita Esempi Test sulla media : T test (varianza incognita) Test sulla varianza : T test (varianza incognita) Test sulla di fferenza tra le medie di due popolazioni : T test (varianza incognita) NB Bisogna controllare se le due popolazioni sono normali e se hanno stessa varianza Test sulla di fferenza tra le varianze di due popolazioni : F test Test sulla proporzione (percentuale dei casi in cui qualcosa avviene) Regressione lineare Valuto la relazione tra le covariate con plot e correlazione pairs = plot dei dati ggpairs = plot dei dati + calcolo della correlazione cor( dataset ) = restituisce la matrice correlazione dei dati Modello di regressione lineare lm = quantili dei residui e deviazione standard, coe fficienti e significatività delle covariate, R2 e R2adj, F statistica e p-value del modello g = lm => g$fitted.values = restituisce i valori fittati = predizione puntuale g = lm => g$residuals = restituisce i valori dei residui g = lm => vcov( g ) = restituisce la matrice varianza-covarianza Nested model Valutiamo la significatività di una covariata T test (coe fficiente nullo vs non nullo) F test (tra modelli) Comando anova (tra modelli) Intervallo di confidenza = predizione intervallare Costruito manualmente fissato alfa Regione di confidenza a forma di ellisse Test sui coe fficienti valutati insieme Comando ellipse NB E' meglio del valutare separatamente i parametri perché considera le correlazioni tra le covariate Diagnostica Leverages Cerchiamo quali sono i dati che ci fanno cambiare di tanto il modello Rule of thumb per capire quali sono Fittiamo il modello senza di loro Valutiamo come cambiano i coe fficienti con e senza (in percentuale) Guardiamo dove sono nei plot delle relazioni tra le covariate Residui standardizzati Cerchiamo quali sono i residui che ci fanno cambiare di tanto il modello Comando g$residuals ( g = lm ) restituisce i valori dei residui Rule of thumb per capire quali sono quelli che influenzano Residui studentizzati Cerchiamo quali sono i residui che ci fanno cambiare di tanto il modello Calcolo tramite formula Rule of thumb per capire quali sono quelli che influenzano Distanza di Cook Cerchiamo quali sono i dati che ci fanno cambiare di tanto il modello Calcolo tramite formula Rule of thumb per capire quali sono quelli che influenzano Togliamo i dati influenti e fittiamo il modello senza i dati Influential plot e influential measures Regressione parziale Valuto residui e predizioni di modelli incrociati per trovare outliers Ipotesi del modello Omoschedasticità dei residui Plot residui vs valori vittati Normalità dei residui Comando per il test Shapiro Wilk QQ plot Istogramma dei residui Boxplot dei residui VIF Verifichiamo se le covariate sono correlate Trasformazioni BoxCox Trasformazioni per risolvere la violazione delle ipotesi Selezione delle variabili AIC e BIC Comando step per scegliere le variabili (in automatico valuta i modelli calcolando AIC o BIC a seconda del k dato e restituisce il modello migliore) R2 e R2adj Comando leaps per scegliere le variabili (in automatico valuta i modelli calcolando R2adj e restituisce il modello migliore) Cp di Mallow Comando leaps per scegliere le variabili (in automatico valuta i modelli calcolando Cp e restituisce il modello migliore) Predizione Intervallo di confidenza per la media della risposta Intervallo di predizione per le singole osservazioni