martes, 2 de diciembre de 2014

TRATAMIENTO PARA DATOS AGRUPADOS


Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos.

Pasos para agrupar datos.
  1. Determinar el rango o recorrido de los datos.

Rango = Valor mayor – Valor menor

  1. Establecer el número de clases (k)en que se van a agrupar los datos tomando como base para esto la siguiente tabla.




Tamaño de muestra o No. De datos
Número de clases
Menos de 50
5 a 7
50 a 99
6 a 10
100 a 250
7 a 12
250 en adelante
10 a 20

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van a agrupar los datos, existen otros para hacerlo.

  1. Determinar la amplitud de clase para agrupar (C).


 

d.      Formar clases y agrupar datos.
Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente.

Ejemplo:
Los siguientes datos se refieren al diámetro en pulgadas de un engrane.

6.75
7.00
7.00
6.75
6.50
6.50
7.15
7.00
6.50
6.50
6.50
6.25
6.25
6.50
6.65
7.00
7.25
6.70
6.00
6.75
6.00
6.75
6.75
7.10
7.00
6.70
6.50
6.75
6.25
6.65
6.75
7.10
7.25
6.75
6.25
6.25
7.00
6.75
7.00
7.15

a) Agrupe datos, considere k=6.
b) Obtenga: Histograma, polígono de frecuencias, ojiva y distribución de probabilidad.
c)      Obtenga: media, mediana, moda y desviación estándar.
Solución:
a)      Agrupando datos;

1.      R= VM - Vm = 7.25 – 6.00 = 1.25
            2.     k = 6
            3.     
           4.Formando clases.

Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado en la muestra; luego,



LI         LS
Frecuencia
Marca de clase
Límite real inferior
Límite real superior
Frecuencia relativa
Frecuencia Relativa acumulada
5.97 – 6.18
2
6.075
5.965
6.185
2/40 = 0.05
0.05
6.19 – 6.40
5
6.295
6.185
6.405
5/40=0.125
0.175
6.41 – 6.62
7
6.515
6.405
6.625
0.175
0.350
6.63 – 6.84
13
6.735
6.625
6.845
0.325
0.675
6.85 – 7.06
7
6.955
6.845
7.065
0.175
0.850
7.07 – 7.28
6
7.175
7.065
7.285
0.15
1.000
Total
40



1.000



b)      Gráficas:






a)      Media ().


=

Donde:
k = número de clases
xi = marca de clase i
fi = frecuencia de la clase i
n = número de datos en la muestra

b)      Mediana (Xmed).


                   

Donde:
Li = límite real inferior de la clase que contiene a la mediana
Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra la mediana
fme = frecuencia de la clase en donde se encuentra la mediana
A = amplitud real de la clase en donde se encuentra la mediana
A = LRS-LRI
LRS = límite real superior de la clase que contiene a la mediana
LRI = límite real inferior de la clase que contiene a la mediana
N = número de datos en la muestra

f)   Moda (Xmod).



Donde:
Li = límite real inferior de la clase que contiene a la moda
d1 = =
d2 = =
fmo = frecuencia de la clase que contiene a la moda
fmo-1= frecuencia de la clase anterior a la que contiene a la moda
fmo+1= frecuencia de la clase posterior a la que contiene a la moda
A = amplitud real de la clase que contiene a la moda
A = LRS – LRI
LRS = límite real superior de la clase que contiene a la moda
LRI = límite real inferior de la clase que contiene a la moda


g)   Desviación estándar (S).

                         
                            
                   =

Donde:
xi = marca de clase i
= media aritmética
fi = frecuencia de la clase i
                  = número total de datos en la muestra



No hay comentarios:

Publicar un comentario