domingo, 3 de junio de 2012

MEDIDAS DE VARIABILIDAD Y DISPERSIÓN

Nos ayudan a determinar la variación de los datos y determinan como se agrupan o se dispersan los datos alrededor de un promedio.


Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).


Rango intercuartil: Representa el 50% de los datos centrales


IQR = Q3 - Q1

Varianza: Sirve para comparar la variabilidad de dos o mas variables. La hay de dos tipos:

Muestral: S² = Σ(xi - X)²  
                        n-1

Poblacional: Õ² = Σ(xi -  \mu )²  
                       N


Desviación estandar: Es una medida que informa de la media de distancias que tienen los datos repecto de su media aritmetica expresada en las mismas unidades que la variable.

Muestral: S = \sqrt{\ }

Poblacional: Õ = \sqrt{\ }Õ²

Punto Z: Determina que tan lejos esta un punto de la media y se calcula:

Z = xi - X   
           S

Campa de Gauss: La campana de Gauss es una representación gráfica de la distribución normal de un grupo de datos. Éstos se reparten en valores bajos, medios y altos, creando un gráfico de forma acampanada y simétrica con respecto a un determinado parámetro. El punto máximo de la curva corresponde a la media, y tiene dos puntos de inflexión a ambos lados.

Este gráfico se usa en variables asociadas a fenómenos naturales: caracteres morfológicos de individuos como la estatura o el peso, caracteres fisiológicos como el efecto de un fármaco, caracteres sociológicos como el consumo de un determinado producto por un mismo grupo de individuos,  caracteres psicológicos como el cociente intelectual.


Teorema de Chevichev: Permite conocer a cierta escala el comportamiento de sus individuos sabiendo la media y la desviación tipica.

1 - 1  
     Z²

Diagrama de CajaUn diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".

Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.



Para el calculo de los "bigotes" se utiliza la siguiente formula:

Limite inferior: Q1 - 1,5(IQR)
Limite superior:  Q2 + 1,5(IQR)

5 comentarios: