Hola
En el último simulacro de Cede viene esta pregunta y su explicación:
086. El coeficiente de correlación de Goodman y Kruskal lo podemos utilizar, señala la incorrecta:
1) Para variables nivel de medida de intervalo.
2) Para variables nivel de medida ordinal.
3) Para variables nivel de medida nominal.
4) Para variables nivel de medida de razón.
Rc:3
RC: Todos los estadísticos se pueden utilizar para el nivel de medida que estén indicados o superior, ya que para utilizar un estadístico hay que cumplir ciertas normas, y siempre y cuando se cumplan, podremos utilizarlo. Así, el coeficiente de correlación de Goodman y Kruskal, que esta propuesto para variables de nivel de medida ordinal está Indicado utilizarse en variables a nivel de medida ordinal O SUPERIOR, no pudiendo de este modo utilizarse con variables nominales ya que en el resto de niveles de medida se sigue cumpliendo la regla “igualdad-desigualdad” (opción 3 incorrecta, que debemos marcar, resto correctas).
Alguien me lo puede explicar? Tenía entendido que en los niveles superiores de medida superiores al nominal, la regla igualdad-desigualdad se cumple también, luego no entiendo por qué este estadístico no sirve para este nivel
Gracias
"It is not because things are difficult that we do not dare, it is because we do not dare that they are difficult."
Alguien me lo puede explicar? Tenía entendido que en los niveles superiores de medida superiores al nominal, la regla igualdad-desigualdad se cumple también, luego no entiendo por qué este estadístico no sirve para este nivel
Con independencia de que las variables nominales cumplan la relación igualdad-desigualdad, el requisito mínimo para la correlación de Goodman y Kruskal es que la variable sea a nivel ORDINAL o SUPERIOR. De ahí para arriba lo puedes aplicar en variables de intervalo y de razón, pero no a nivel nominal.
Edito:
Cuando la muestra consta de muchas observaciones y son muy pocos los valores ordinales alcanzables por ellas, será muy grande el número de empates. En este caso es recomendable la gamma de Goodman y Kruskal
"Malditas sean las guerras y los canallas que las hacen" (Julio Anguita)
En mi humilde opinión, a excepción de que entres a entender cada una de las fórmula de las pruebas, casi que acabamos antes si repites como un mantra:
-Q de Yule nominales (2 filas x 2 columnas)
-Chi cuadrado nominales (2 o más filas x 2 o más columnas) Oooooommmh
Ambas se extraen de una tabla de contingencias fila x columna
-comparación de 2 medias inter (o independientes) Man-Whitney
-de más de 2 medias intra (o relacionadas) Wilconox Oooooooommmmh
-de más de dos medias inter Kruskal-Wallis
-y más de dos medias intra Cochrane Oooooommmh
Estas cuatro, a mi entender son o salen también de tablas de contingencia adaptadas a números ordinales o superiores. por eso en la fórmulas se incluyen varianzas, puntuaciones diferenciales etc, en cambio en las nominales la fórmula incluye solo frecuencias.
No confundas aquello de los niveles (que si nominal, ordinal, intervalo y razón donde las propiedades de cada nivel incluyen a las propiedades de los niveles inferiores), es decir que a un dato de intervalo le puedes hacer todas las manipulaciones que se le pueden hacer a los ordinales y a los nominales por ejemplo.
Solebo escribió:
Cuando la muestra consta de muchas observaciones y son muy pocos los valores ordinales alcanzables por ellas, será muy grande el número de empates. En este caso es recomendable la gamma de Goodman y Kruskal
No confundas aquello de los niveles (que si nominal, ordinal, intervalo y razón donde las propiedades de cada nivel incluyen a las propiedades de los niveles inferiores), es decir que a un dato de intervalo le puedes hacer todas las manipulaciones que se le pueden hacer a los ordinales y a los nominales por ejemplo.[/quote]
StopWars, esto último que has dicho es lo que no entiendo de la pregunta, pues expresamente se refiere a niveles de medida de las variables y pienso que si cada nivel incluye al anterior la prueba debería valer para nominales
Eso es lo que no acabo de entender
"It is not because things are difficult that we do not dare, it is because we do not dare that they are difficult."
Sospechaba que iría por ahí la duda pero fíjate, que una cosa es el nivel de medida
nominal = si-no / lo tiene-no lo tiene / pertenece-no pertenece, etc.
Ahora supón que te interesa comparar dos variables nominales: quieres saber si tienen alguna relación entre sí.
Para ello consigues una muestra de sujetos y les mides a cada sujeto las dos variables nominales.
con el conjunto de los datos puedes crear una tabla de contingencia (léase tabla de "a ver si hay o no contingencia") Si todos los que tienen un valor en una variable tienen el mismo valor de la otra variable, entonces la contingencia es máxima y sería una correlación de 1 ó -1 según se haya dispuesto la tabla.
La Q de Yule y el Chi Cuadrado solo pueden aplicarse a este tipo de tablas de contingencia con datos nominales, pues sus fórmulas se componen de frecuencias (frec. observada y frecuencia que sería de esperar si fuera al azar = frecuencia teórica)
Una prueba Kruskal-Wallis, Willconox, Man-Whitney, Cochrane, Friedman (etc) estan pensadas para operar con datos ordinales o superiores, porque en sus fórmulas no operan solo con frecuencias (como las nominales) sino que en sus fórmulas hay elementos (medias, puntuaciones diferenciales, etc) que no se pueden aplicar a los datos de nivel nominal.
Para acabarlo de ver compara una fórmula de chi cuadrado con una de Kruskal-Wallis y lo veras en seguida el porqué no puedes aplicarla en datos nominales.
A ver si no me hago mucho lío y se entiende bien:
PRUEBAS DE CORRELACIÓN: se aplican para su nivel de medida (nominal, ordinal o cuantitativo) o un nivel superior:
- las PRUEBAS para variables nominales (ejemplo Q de Yule o C de contingencia) las puedes aplicar para variables nominales o superior (ordinal e intervalo-razón)
- las PRUEBAS para variables ordinales (ejemplo Spearman, Kendall o Goodman-Kruskal) se pueden aplicar para variables ordinales o superior (intervalo razón)
- las PRUEBAS para variables cuantitativas (intervalo razón) (ejemplo: rxy) solo se pueden aplicar para variables cuantitativas
Esto es lo mismo que decir que para medir la correlación de las variables cuantitativas (intervalo-razón) pueden utilizarse todo tipo de pruebas, pero sin embargo para la nominales solo se pueden las pruebas específicas de variables nominales.
A pesar de ello, es mejor usar las pruebas que corresponden a cada nivel de variable.