Nwlapcug.com


Come rimuovere valori erratici in SPSS

Come rimuovere valori erratici in SPSS


Valori erratici nelle analisi statistiche sono valori estremi che non sembrano adattarsi con la maggior parte di un set di dati. Se non rimossi, questi valori estremi possono avere un grande effetto su tutte le conclusioni che si potrebbero trarre dai dati in questione, perché questi possono influenzare i coefficienti di correlazione e linee di regressione nella direzione sbagliata. SPSS è uno di una serie di programmi di software di analisi statistica che può essere utilizzato per interpretare un insieme di dati, individuare e rimuovere i valori minori.

Istruzioni

Analisi esplorativa dei dati

1

Fare clic su "Analizza". Selezionare "Statistica descrittiva" seguita da "Esplora".

2

Trascinare e rilasciare le colonne contenenti i dati della variabile dipendente nella casella denominata "Elenco dipendente". Fare clic su "OK".

3

Rimuovere eventuali valori erratici identificati da SPSS nelle trame stelo e foglie o casella traccia mediante l'eliminazione di singoli punti dati. In alternativa, è possibile impostare un filtro per escludere questi punti dati.

4

Selezionare "Dati" e poi "Seleziona casi" e fare clic su una condizione che ha valori erratici che si desidera escludere. Determinare un valore per questa circostanza che esclude solo i valori erratici e nessuno dei punti dati non periferici.

5

Scegliere "Se condizione è soddisfatta" nella casella "Seleziona" e quindi fare clic sul pulsante "Se" appena di sotto di esso. Immettere la regola per escludere valori erratici è determinato nel passaggio precedente nella casella in alto a destra. Ad esempio, se si erano escluse misure sopra 74,5 pollici dalla condizione di "altezza", si inserirà "altezza < = 74,5." Fare clic su "Continua" e "OK" per attivare il filtro.

Analisi di regressione

6

Nel menu "Analizza", selezionare "Regressione" e poi "lineare". Selezionare le variabili dipendenti e indipendenti che si desidera analizzare.

7

Fare clic su "Salva" e poi selezionare "Distanza di Cook". I valori calcolati per distanza di Cook sarà salvato nel file di dati come variabili con l'etichetta "COO-1".

8

Eseguire un boxplot selezionando "Grafici" seguiti da "Boxplot." Fare clic su "Semplice" e selezionare "Sintesi della variabili Separate." Inserire "COO-1" la casella denominata "Caselle rappresentano" e quindi immettere un ID o il nome con cui identificare i casi nella casella "Etichetta casi per".

9

Ingrandire il boxplot nel file di output facendo clic su esso. Prendere nota dei casi che si trovano oltre le linee nere---questi sono tuoi valori anomali. Si può scegliere di rimuovere tutti i valori erratici o solo i valori erratici estremi, che sono contrassegnati da una stella (*).

10

Tornare indietro nel file di dati e individuare i casi che devono essere cancellati. Lavorando dal basso verso l'alto, evidenziare il numero all'estrema sinistra, nella colonna grigia, così il viene selezionata l'intera riga. Fare clic su "Modifica" e seleziona "Cancella". Ripetere questo passaggio per ogni valore erratico che è stato identificato dal boxplot.

Consigli & Avvertenze

  • Quando si cancellano i casi nella sezione 2, punto 5, lavorare sempre dalla parte inferiore del file di dati risalendo perché cambiano i numeri di ID quando si cancella un caso. Se si lavora dall'alto verso il basso, si finirà per cancellare i casi sbagliati.