In un precedente articolo abbiamo parlato degli indici di tendenza centrale (media, moda e mediana). Questa volta analizzeremo gli indici di variabilità. In particolar modo concentreremo la nostra attenzione sulla deviazione standard, sulla varianza e sul coefficiente di variazione e la loro implementazione in SPSS, in R studio e in Excel.
![Formule-edited Varianza, deviazione standard e coefficiente di variazione](https://www.analisi-statistiche.it/wp-content/uploads/2023/05/Formule-edited.jpg)
Cosa sono gli indici di dispersione (o indici di variabilità)
In generale, gli indici di dispersione ci dicono quanto i valori si disperdono intorno alle misure di tendenza centrale, ovvero quanto si disperdono intorno al valore più rappresentativo del centro della distribuzione: più l’indice di variabilità è grande, maggiore sarà la variabilità dei dati che sto analizzando.
Utilizziamo gli indici di dispersione quando la variabile considerata è di tipo quantitativo o se è misurata su scala a intervalli o a rapporti equivalenti.
Come calcolare la Varianza e la varianza campionaria corretta
Un modo per calcolare la variabilità dei dati tenendo conto di tutti i valori della distribuzione, consiste nel calcolare la distanza (o scarto) di ciascun valore dalla media.
Se sommiamo i quadrati delle deviazioni o scarti dalla media e dividiamo questa somma per il numero delle osservazioni otteniamo la varianza.
ESEMPIO:
Nel seguente esempio viene analizzata la varianza della variabile età.
![Esempio età Varianza, deviazione standard e coefficiente di variazione: esempio età](https://www.analisi-statistiche.it/wp-content/uploads/2023/05/Esempio-eta.png)
Facciamo, come prima cosa, la media delle osservazioni.
![Formula della media delle osservazioni](https://statblog.analisi-statistiche.it/wp-content/uploads/2021/05/Formula-della-media-delle-osservazioni.jpg)
Ora possiamo utilizzare la media ottenuta per il calcolo della varianza.
![calcolo della varianza](https://statblog.analisi-statistiche.it/wp-content/uploads/2021/05/Calcolo-della-varianza.jpg)
Quando la varianza viene calcolata su una popolazione, si indica con il simbolo greco σ2 ; quando, invece, viene calcolata su un campione si indica con s2. Nel caso in cui la varianza viene calcolata su un campione, inoltre, il denominatore n è sostituito da n-1 così da ottenere una stima corretta della dispersione della variabile nella popolazione da cui il campione in esame è stato estratto: si parla, infatti, di varianza campionaria corretta.
Un limite della varianza come misura di dispersione è quella di avere una unità di misura espressa al quadrato. Per questo motivo, si ricorre, molto spesso, al calcolo della deviazione standard.
Deviazione standard: cos’è e come calcolarla
La deviazione standard, in generale, è pari alla radice quadrata della varianza.
A differenza di quest’ultima, la deviazione standard è un indice che viene espresso con la stessa unità di misura dei valori osservati. Indica quanto, in media, ciascun valore si discosta dalla media della popolazione.
ESEMPIO:
Considerando l’esempio precedente, applichiamo solamente il radicando.
Questo indice di dispersione può essere interpretato anche come misura di accuratezza della media: più la deviazione standard è elevata, meno la media è efficace nel fornire un valore che sia rappresentativo dell’intera distribuzione.
Anche in questo caso, se la deviazione standard viene calcolata sulla popolazione intera, si usa la lettera greca σ ; invece, se viene calcolata su un campione si utilizza la lettera s (o ds).
Un limite della deviazione standard è rappresentato dal fatto che non è un indice adatto per confrontare la dispersione di distribuzioni i cui punteggi sono espressi in unità di misura differenti.
Una misura di dispersione che non risente dell’unità di misura è il coefficiente di variazione.
Coefficiente di variazione: cos’è e quando si usa
Il coefficiente di variazione è un indice che si basa sul rapporto tra deviazione standard e media:
Attenzione: da non confondere con l’intervallo di variazione!
Questo indice esprime il grado di dispersione dei punteggi in termini di scostamento percentuale dalla media. Viene chiamato anche deviazione standard relativa.
È utile quando si vuole confrontare la dispersione di distribuzioni i cui punteggi sono espressi da unità di misure differenti.
ESEMPIO:
Consideriamo ora, oltre ai dati usati in precedenza, la media dei voti di 4 studenti e la relativa deviazione standard.
![formula esempio coefficiente di variazione](https://statblog.analisi-statistiche.it/wp-content/uploads/2021/05/formula-esempio-coefficiente-di-variazione.png)
Si legge come: “in media i punteggi si discostano dal valore centrale di una quantità pari a circa il 22% della media”.
In questo esempio specifico, notiamo che il coefficiente di variazione della seconda distribuzione (distribuzione espressa in anni) ha una dispersione maggiore rispetto alla prima distribuzione (espressa in voti).
![ragazzo al pc Varianza, deviazione standard e coefficiente di variazione: a che servono e come calcolarli con Excel, SPSS e R](https://www.analisi-statistiche.it/wp-content/uploads/2023/05/boy-1300226-768x641-1.png)
Varianza, deviazione standard e coefficiente di variazione in excel
- Riportiamo su un foglio Excel i dati di esempio:
- Su una qualunque cella vuota scriviamo il comando “VARIANZA.POP.VALORI” preceduto dall’uguale; nelle parentesi vanno inseriti i dati per il calcolo della varianza; premere invio.
Si procede in modo analogo per il calcolo della deviazione standard.
Il coefficiente di variazione non ha una formula propria. Per questo dovremmo calcolarlo a “mano”: ci posizioniamo in una cella vuota di Excel; digitiamo l’uguale; selezioniamo la cella della deviazione standard; digitiamo l’operatore di divisione; selezioniamo la cella della media; moltiplichiamo il tutto per 100.
Varianza, deviazione standard e coefficiente di variazione in R Studio
Per calcolare gli indici In R Studio, bisognerà creare un vettorecon i valori età “x” e usare il comando mean() per la media, var() per la varianza e sd() per la deviazione standard. Per il coefficiente di variazione non esiste un comando specifico: quindi utilizzeremo i comandi precedenti per la formula del coefficiente di variazione andando a dividere sd() e mean() e infine moltiplicandolo per 100.
Varianza, deviazione standard e coefficiente di variazione in SPSS
- Per calcolare gli indici di varianza e deviazione standard in SPSS, dal menù Analizza, selezionare Statistiche descrittive e poi frequenza.
- A questo punto si aprirà una finestra di dialogo: selezionare la variabile (quantitative) per cui calcoleremo i due indici. Selezionare l’opzione Statistiche.
- Flaggare Varianza e deviazione standard dall’elenco di statistiche proposte. Diamo Continua e Ok per confermare le nostre scelte e visualizzare i risultati.
Per il calcolo del coefficiente di variazione, invece, anche in SPSS non esiste una formula specifica o un’opzione da “flaggare”. Si ricorre a questo punto al classico calcolo “a mano”: dalla finestra di dialogo introdotta in precedenza, si seleziona, oltre alla deviazione standard, anche la media. Diamo il “continua” e l’ok per visualizzare i risultati. A questo punto prendiamo il valore della deviazione standard e lo dividiamo per la media della distribuzione; infine moltiplichiamo per 100.
Hai ancora dubbi sul calcolo degli indici di variabilità o hai bisogno di una nostra consulenza per un problema specifico?
Nessun problema, scrivici e spiegaci la tua necessità! Il preventivo è gratuito e senza impegno!
![Contattaci Contattaci per una consulenza statistica](https://www.analisi-statistiche.it/wp-content/uploads/2023/05/Contattaci.jpg)
Articolo a cura della Dott.ssa Aurelia Colucci