Método de Regresión y Correlación Lineal


Después de establecer la muestra poblacional y las dos variables que queremos estudiar, se procede a hacer el análisis de información. 



La organización de la información es de gran importancia.

Normalmente se utilizan dos estrategias: Pares Ordenados y/o Tabla de Datos.







Para empezar con el estudio, se recomienda realizar  en primera instancia el diagrama de dispersión, el cual nos dará una idea de como se encuentran los datos  distribuidos.



Para proceder a desarrollar el método se requiere calcular el Coeficiente de Correlación Lineal (r).





El  Coeficiente de correlación lineal puede tomar valores positivos o negativos. El signo, solo va a indicar la pendiente o inclinación de la recta.  Lo más importante del factor de correlación es que sea lo más cercano a 1 ó -1. Cuando el factor de correlación está más cerca del 1 (sin importar el signo), más eficaz será el método.





Un factor de correlación igual a cero, indica que no existe correlación y por lo tanto no puede aplicarse el Método de Regresión Lineal para obtener una ecuación.




A continuación se detallan las fórmulas necesarias para el cálculo del Coeficiente de Correlación Lineal. 
(Al final se detalla un ejercicio en donde se explica la aplicación de las fórmulas).



FÓRMULAS PARA CÁLCULO DE 
COEFICIENTE DE CORRELACIÓN LINEAL (r)



Después de calcular SSx, SSy y SSxy, se calcula r.




REGRESIÓN   LINEAL
Después de calcular el factor de correlación (r) y sabiendo que efectivamente existe una fuerza lineal entre las variables, se procede a aplicar el método de regresión lineal para encontrar la  ecuación.

El análisis de regresión lineal consiste en encontrar la ecuación de la recta que mejor describe el comportamiento de las dos variables.

El método se usa para obtener una ecuación lineal que describa el describa el comportamiento del problema que estamos investigando.

La ecuación de la recta obedece a la siguiente ecuación:


Las constantes bo y b1  se calculan   con:





Con el objetivo de que quede claro la aplicación del método, se detalla el siguiente ejemplo:




a) Diagrama de Dispersión


Iniciamos con la elaboración del diagrama de dispersión.  Para eso es importante identificar quién es la variable dependiente y quien es la variable independiente.  

Esto es:

El precio depende de los metros cuadrados de construcción.

Por lo tanto:

El precio es la variable dependiente ---- Sería "Y"

m2 de construcción es la variable independiente ---- Sería "X"


Conociendo a "X" y a "Y", procedemos a graficar todos los puntos: (170,850) ; (168,720); (20,950), etc...



En el diagrama de dispersión podemos observar que se tiene una pendiente o  inclinación positiva, por lo que esperamos un coeficiente de correlación positivo (cercano a +1).

b) Coeficiente de correlación lineal

Para calcular el coeficiente de correlación lineal, se recomienda elaborar la siguiente tabla.

Las columnas: casas, m2 de construcción y precio son las que fueron proporcionadas en los datos.

La columna X^2  se obtiene elevando al cuadrado la variable  "M2 de Construcción" (definida como "X" anteriormente). Ejemplo: 170*170 = 28,900

La columna Y^2 se obtiene elevando al cuadrado la variable  "Precio" (definida como "Y" anteriormente).
Ejemplo: 850*850= 722,500

La columna XY se obtiene multiplicando X*Y. 
Ejemplo: (170)(850)=144,500.





Para obtener las sumatorias se efectúan las sumas por columnas. Obteniendo las sumatorias de X, Y, XY, X^2 y Y^2.




Con estas sumatorias es posible calcular:  SSX, SSY y SSXY.  (Se utilizan las fórmulas anteriormente escritas).

***********************************************************************
Cálculo de SSx

**********************************************************************


Cálculo de SSy




**************************************************

Cálculo de SSxy:





*****************************************************

Con los valores SSx, SSy y SSxy se calcula el factor de correlación:





c) Regresión Lineal

Sabemos que la ecuación debe quedar de la forma:


                                      Y = bo + b1x






Calculando:



Por lo tanto:


Y = -28.16 + 4.77 X



d) Precio de la casa para una construcción de 165m2:

Y = -28.16 + 4.77 X

Donde X es la variable "m2 de construcción"
Sustituyendo:

Y = -28.16 + 4.77 (165) = -28.16 + 787.05 = 758.89


Puesto que el precio está dado en miles de pesos:

El precio de la casa es : $758,890



Seguimos en contacto =)
Matepedia


Entradas populares de este blog

Características de una Distribución Normal

Ejemplo de Planteamiento de un Problema en Estadística