Varianza de K submuestras

Moderador: Solebo

Avatar de Usuario
Asakamaya
Usuaria honorífica del foro
Usuaria honorífica del foro
Mensajes: 17737
Registrado: Mar Ago 15, 2006 12:23 am
Ubicación: Catalunya
Agradecimiento recibido: 4 veces

Varianza de K submuestras

Mensaje por Asakamaya »

Pongo aquí la duda que viene de otro hilo:
Ro escribió:
La varianza d una muestra considerada desde k submuestras es:
a) la suma d las varianzas parciales
b) la media d las varianzas parciales
c) la media d las varianzas más la varianza d las medias
d) la varianza d las medias
e) la media d las varianzas menos la varianza d las medias
Necane escribió: Que algún alma caritativa y sabia me explique esta pregunta de k submuestras.

¡Gracias!
Allá voooooy! :13

Seguro que cometo fallos garrafales al explicarlo, pero más o menos es con lo que yo me quedé cuando a su vez me lo explicaron a mí ;)

Veamos el enunciado:
La varianza d una muestra considerada desde k submuestras es:
c) la media d las varianzas más la varianza d las medias

En primer lugar lo que te dice el enunciado es que en vez de calcular la varianza de un grupo de puntuaciones como se hace de ordinario, lo que vas a hacer es coger tu muestra y dividirla en varias muestras más pequeñas (las k submuestras), y a partir de ahí calcular la varianza "de otro modo". Esto de complicarse la vida, además de ser un vicio que tienen los estadísticos :smt082 , creo que lo hacen para intentar calcular con muchas más precisión :smt023 Pero veamos la mecánica:

Imagina que en la muestra original "total", tenías varios valores extremos que hacían que la media “única” estuviera por desgracia sesgada. P. ej. de un campo de uvas que tienes, resulta que hay varias cepas que son amargas, y eso hará que la media de “dulzor” sea un poco peor de la cuenta (y saques menos dinero por tu uva al venderla).

Para calcular la varianza general de una muestra, tienes que emplear esa media; recordemos la fórmula:

S2= suma de (Xi-Media)2 / n

Al compartimentar el grupo total en muestras más pequeñitas lo que te ocurrirá es que esos valores extremos no van a estar en todos los grupos, sino que te caerán dentro de sólo uno o unos pocos de ellos. De manera que las medias de cada submuestra pueden ser bastante distintas: algunas (la mayoría) serán bastante “normales”, las esperables, pero otras estarán super-desviadas, que serán aquellas donde te han caído las uvas amargas, o donde a lo mejor te han caído todas juntas las uvas más dulces de tu parcela.

En principio, si no tienes en cuenta esto, a priori podrías decir que para calcular la Varianza del grupo total, simplemente podrías coger las varianzas de las submuestras, sumarlas y dividirlas por el total de submuestras (k). Es decir, la media simple de toda la vida. O lo que es lo mismo, defenderías que:

(1) S2n= Media de las diferentes varianzas

Pero la cuestión es que eso no es verdad, porque no estás teniendo en cuenta que las medias de las diferentes submuestras pueden ser bastante diferentes entre sí debido al sesgo que hemos dicho que tienen. O sea, que el grupo de las medias de las k submuestras tienen a su vez también una varianza (se pueden parecer mucho si todas las uvas son realmente iguales y tener pues una varianza "de medias" pequeña, o ser medias que se diferencian sustancialmente si tienes uvas muy dulces/muy amargas en algunos grupos, con una varianza de medias entonces más grande).
Para no dejar de contemplar este hecho, lo que has de hacer es corregir lo que has dicho antes (1) e incorporar la “varianza de las medias” (2)... o lo que es lo mismo, lo que te pone en la alternativa correcta:

(2) la media de las varianzas más la varianza de las medias

¿Qué tal así? ;)
Responder

Volver a “Estadística, Psicometria...”