Ostras, pues sí, te lo he puesto mal, ¿ves como no domino tanto la estadística?
Corrijo... De ejemplo he usado dos mitades de un mismo test... Pero da igual, en vez de que X1 y X2 sean dos mitades, imagínate que son dos tests diferentes pero similares ("paralelos").
De hecho la lógica de partir un test en dos es que es como estar creando dos tests paralelos de uno solo
Vale. Inventémonos la situación:
X1 es un análisis de sangre para mirar... yo que sé... el azúcar.
X2 es un análisis de orina para medir lo mismo (no tengo ni idea si se puede ver el azúcar en la orina, me perdonen los médicos presentes si estoy metiendo la pata).
Son tests paralelos porque te sirven para medir lo mismo.
El paciente resulta que tiene fobia a las agujas y el médico le quiere mirar los niveles de azúcar de todos modos. ¿Qué puede hacer? Pues le hace mear en un bote.
X2 (el test de orina) te sirve de predictor para X1 (azúcar si lo midieras en sangre).
Imagínate que lo normal sería que siempre se hallara el doble de azúcar en orina que en sangre. Por lo tanto podrías decir que X1 y X2 se relacionan con la siguiente "recta de regresión":
X2 = 2 * X1
Así que a tu paciente fóbico, viéndole los resultados en orina, le pronosticarías un valor doble para el análisis de sangre (sin habérselo hecho).
El error de predicción, en este caso, sería como tú decías: "la diferencia entre la puntuación de X1 real y la puntuación de X1 pronosticada a través de la recta de regresión", es decir:
la diferencia entre el azúcar que realmente tiene en sangre el paciente (si le pincharas a traición con la aguja), y el azúcar pronosticado en sangre a través de la recta regresión que has establecido con la orina.
¿Así mejor?