Planteamiento III (Regresión Logística)

En este planteamiento vamos a realizar dos ejercicios por separado, que consistirán en separar por un lado los datos de una taquicardia en concreto (TV ó TSV) y por otro lado, todo lo que no sean esos datos (RS y TV o TSV), es decir, si queremos detectar ejemplos de Taquicardias Ventriculares (TV) separaremos esos datos de los datos de Ritmo Sinusal (RS) y de los de la Taquicardia Supraventricular (TSV). Del mismo modo lo haremos en el caso en el cual queramos detectar Taquicardias Supraventriculares (TSV). 

Este planteamiento lo realizamos con vista a poder detectar los casos de taquicardia, discriminando mejor dichos casos de los casos de RS y el otro tipo de Taquicardia. Tomaremos las muestras con 19 características cada una de ellas (RS, TV y TSV).

En ambos problemas que planteamos (por separado), organizaremos los datos de la siguiente manera, etiquetando los valores de la Taquicardia que queramos detectar con un '1', y todo lo que no sean datos de lo que queramos detectar con un '0':


Nuestras variables independientes o predictoras 'X' serán las características tomadas de cada una de las muestras (datos proporcionados en el fichero de casos de entrenamiento), mientras que nuestra variable categórica 'Y' recogerá las etiquetas que hemos establecido para los datos.



Del mismo modo que en los planteamientos anteriores, con el objetivo de minimizar la función de coste más rápido, normalizamos los datos. Seguidamente añadimos la columna de los valores pertenecientes a "X0 = 1" y construimos e inicializamos nuestro vector de parámetros Θ (theta). Tras estos pasos podemos minimizar nuestra función de coste con la función "fminunc" de Optimización Avanzada de la cual obtendremos nuestro vector de parámetros Θ (theta) óptimo.

Una vez tenemos el valor de nuestro vector de parámetros Θ (theta) óptimo, podemos cargar los casos de test (haciendo la misma separación que en el entrenamiento), pasárselos a nuestra función Hipótesis de Regresión Logística y evaluar los resultados obtenidos que son los siguientes:



Al aumentar el número de ejemplos de los casos negativos de Taquicardia para el "aprendizaje" , somos capaces de detectar mejor estos casos negativos y distinguirlos así de los casos de Taquicardia (TV ó TSV).