Come si ottiene il Cluster di dati di una distribuzione di campionamento più vicino alla media? / Nwlapcug.com

Statistica inferenziale è il processo di stima di una variabile in una popolazione sulla base dei dati noti da un piccolo campione di quella popolazione. In ordine per una stima accurata da effettuarsi, la media e la distribuzione del campione dovrebbe essere più vicini possibile alla popolazione da cui è tratto. Ci sono diversi passaggi che si può prendere verso questo fine.

Istruzioni

1

Consentono di utilizzare un campione di grandi dimensioni come tempo e fondi. Se si utilizza un campione di dimensioni più piccolo, è più probabile che il vostro campione verrà configurati in cluster intorno a una media che non rappresenta la popolazione. Al contrario, più grande il vostro campione è, maggiore sarà la probabilità che statisticamente corrisponderà la popolazione.

2

Utilizzare il campionamento casuale. Idealmente, ogni punto di dati nella popolazione dovrebbe avere le stesse possibilità di finire in vostro campione. Se questo non è il caso, le stime saranno essere prevenute. Ad esempio, se si desidera calcolare la media netta di persone nel vostro paese, e si raccolgono solo i dati di esempio dalla città più ricca, il vostro campione sarà molto probabilmente sopravvalutare la media della popolazione.

3

Rimuovere i valori erratici. Un outlier è un punto di dati che si trova lontano dal cluster principale. Anche se rappresentano i punti dati legittimi da vostro campione, è possibile rimuoverli in alcuni casi, ad esempio quando la dimensione del campione è abbastanza piccola, o quando per qualche motivo che è necessario utilizzare la media invece di un'altra misura della tendenza centrale come la mediana. Ad esempio, se il vostro netto degno indagine compreso 10 persone - 9 classe media, e Bill Gates – la stima dello stipendio medio è probabile essere gonfiato, così si potrebbe contrastare questo rimuovendo il valore erratico.