En los apuntes CEDE tengo repetidas veces la siguiente fórmula:
R2xy= S2y/S2x
No entiendo por qué, yo suponía que el coeficiente de determinación nos dice qué parte de la Y(VD) es explicada por X(VI), y no al revés.
Si alguien pudiera aclararme esta duda, se lo agradecería eternamente GRACIAS!
COEFICIENTE DE DETERMINACIÓN
Moderador: Solebo
- Solebo
- Administradora del Foro

- Mensajes: 74274
- Registrado: Lun Ene 22, 2007 4:22 pm
- Ubicación: En Córdoba, cuando no en la higuera
- Agradecido : 11194 veces
- Agradecimiento recibido: 8745 veces
- Género:
Estoy de acuerdo con la definición.
De fórmulas entiendo poquísimo pero la que tengo no coincide con la que has puesto.
En el numerador varianza pronosticada de y, en el denominador varianza de y.
Como me lío bastante con estadística, me estudio sólo los conceptos y los aplico en función de que la pregunta sea sobre correlación, fiabilidad o validez. Es posible que no sea lo más adecuado pero mi cabeza no da para más
Pongo unos enlaces donde se habló del tema. También adjunto un archivo porque no sé escribir fórmulas en el foro.
http://www.foropir.es/viewtopic.php?t=3095
http://www.foropir.es/viewtopic.php?t=3222
De fórmulas entiendo poquísimo pero la que tengo no coincide con la que has puesto.
En el numerador varianza pronosticada de y, en el denominador varianza de y.
Como me lío bastante con estadística, me estudio sólo los conceptos y los aplico en función de que la pregunta sea sobre correlación, fiabilidad o validez. Es posible que no sea lo más adecuado pero mi cabeza no da para más
Pongo unos enlaces donde se habló del tema. También adjunto un archivo porque no sé escribir fórmulas en el foro.
http://www.foropir.es/viewtopic.php?t=3095
http://www.foropir.es/viewtopic.php?t=3222
Última edición por Solebo el Lun Feb 15, 2010 7:36 pm, editado 1 vez en total.
"Malditas sean las guerras y los canallas que las hacen" (Julio Anguita)
- Asakamaya
- Usuaria honorífica del foro

- Mensajes: 17737
- Registrado: Mar Ago 15, 2006 12:23 am
- Ubicación: Catalunya
- Agradecimiento recibido: 4 veces
No sé en qué parte de CEDE lo habrás encontrado, pero es que eso sólo es cierto cuando estamos hablando de Psicometría y del cálculo de la fiabilidad según el modelo lineal de Spearman, debido a los supuestos básicos de los que parte. Aunque ahí, más que hablar de las variables X e Y, habla de las variables X y V (puntuaciones observadas y puntuaciones verdaderas). Para el coeficiente de determinación en general, en estadística, lo correcto es lo que te ha puesto Sole
De todas formas, si te apetece ver más o menos el por qué de lo de psicometría y Spearman, y puedes aguantar un chaparrón, ahí va lo que yo entiendo ://13
Partiendo desde el principio, la correlación de Pearson entre dos variables X e Y se calcula así:
Para centrarnos en Psicometría vamos a cambiar Y por las puntuaciones verdaderas V:
Partiendo de que la puntuación observada X es lo mismo que la puntuación verdadera más un poco de error (X = V+e), si cuando te pones a calcular allí donde pone X lo cambias por V+e, después de una larga serie de cálculos y demostraciones que yo no sé poner
llegas a la conclusión de que:
COVxv = S2v
Entonces, como sabemos que el coeficiente de determinación es lo mismo que Pearson al cuadrado, pues cogemos la fórmula de Pearson y la "cuadramos"
:
Cambiamos lo de COVxv por lo que acabamos de decir y queda:
o lo que es lo mismo:
y tachamos un S2v del numerador y otro del denominador, y aquí SÍ que te queda la equivalencia que decías tú al principio:
Por otro lado tiene sentido que lo que hay en el numerador y en el denominador estén situados de esa manera. Si te fijas X por necesidad siempre va a ser un número más grande que V, puesto que como decíamos antes X = V+e.
Si nos inventamos un ejemplo igual se ve más claro, así que vamos a poner la variable CI.
X es el CI observado a través de un test, y digamos que su varianza es de 30 (invención total).
Sin embargo hemos dicho que esa varianza se debe en parte a la varianza verdadera pero también en parte al error de medida del test!!
De manera que la varianza verdadera S2v será más pequeña. Vamos a inventarnos que es de 20, y por tanto la varianza debida a error es de 10, claro.
Lo que estás calculando es cuánto de V es explicado por X, sí, pero en el fondo lo haces mirando del total de X qué parte es la de V. O sea, del total del CI observado con el test (30), qué parte es la verdadera y qué parte es la del error. Así que te preguntarías ¿qué parte es 20 del total de 30? Y evidentemente para calcularlo es la división:
Total, que siguiendo la fórmula tienes que:
r2xv = 20 / 30 = 0'66
o lo que es lo mismo, el 66% del CI verdadero es explicado por el rendimiento en el test de inteligencia.
Enhorabuena si has llegado hasta aquí! ://13 ://13
De todas formas, si te apetece ver más o menos el por qué de lo de psicometría y Spearman, y puedes aguantar un chaparrón, ahí va lo que yo entiendo ://13
Partiendo desde el principio, la correlación de Pearson entre dos variables X e Y se calcula así:
rxy = COVxy / Sx Sy
Para centrarnos en Psicometría vamos a cambiar Y por las puntuaciones verdaderas V:
rxv = COVxv / Sx Sv
Partiendo de que la puntuación observada X es lo mismo que la puntuación verdadera más un poco de error (X = V+e), si cuando te pones a calcular allí donde pone X lo cambias por V+e, después de una larga serie de cálculos y demostraciones que yo no sé poner
COVxv = S2v
Entonces, como sabemos que el coeficiente de determinación es lo mismo que Pearson al cuadrado, pues cogemos la fórmula de Pearson y la "cuadramos"
r2xv = (COVxv)2 / S2x S2v
Cambiamos lo de COVxv por lo que acabamos de decir y queda:
r2xv = (S2v)2 / S2x S2v
o lo que es lo mismo:
r2xv = S2v S2v / S2x S2v
y tachamos un S2v del numerador y otro del denominador, y aquí SÍ que te queda la equivalencia que decías tú al principio:
r2xv = S2v/ S2x
Por otro lado tiene sentido que lo que hay en el numerador y en el denominador estén situados de esa manera. Si te fijas X por necesidad siempre va a ser un número más grande que V, puesto que como decíamos antes X = V+e.
Si nos inventamos un ejemplo igual se ve más claro, así que vamos a poner la variable CI.
X es el CI observado a través de un test, y digamos que su varianza es de 30 (invención total).
Sin embargo hemos dicho que esa varianza se debe en parte a la varianza verdadera pero también en parte al error de medida del test!!
De manera que la varianza verdadera S2v será más pequeña. Vamos a inventarnos que es de 20, y por tanto la varianza debida a error es de 10, claro.
Lo que estás calculando es cuánto de V es explicado por X, sí, pero en el fondo lo haces mirando del total de X qué parte es la de V. O sea, del total del CI observado con el test (30), qué parte es la verdadera y qué parte es la del error. Así que te preguntarías ¿qué parte es 20 del total de 30? Y evidentemente para calcularlo es la división:
20/30
o sea: V / X --> por eso está X en el denominadorTotal, que siguiendo la fórmula tienes que:
r2xv = 20 / 30 = 0'66
o lo que es lo mismo, el 66% del CI verdadero es explicado por el rendimiento en el test de inteligencia.
Enhorabuena si has llegado hasta aquí! ://13 ://13
