Detección de Anomalías Cardíacas con Aprendizaje Automático (Machine Learning): Planteamiento I (Support Vector Machine SVM)

En este planteamiento tomaremos las 38 características de cada muestra con datos de ritmo sinusal (RS) y taquicardia (TV ó TSV) con el fin de poder diferenciar los ejemplos de RS/TV de los ejemplos de RS/TSV. La idea de este planteamiento es que tomando datos con Taquicardias (sin eliminar sus características de Ritmo Sinusal RS), podamos diferenciar entre las Taquicardias Ventriculares (TV) y las Taquicardias Supraventriculares (TSV).

Organizaremos los datos de entrenamiento proporcionados en el fichero "cwaNN.mat" de la siguiente manera, distinguiendo los datos pertenecientes a RS/TV de los datos pertenecientes a RS/TSV. Para ello, etiquetaremos los datos pertenecientes a RS/TV con un '0', y los datos pertenecientes a RS/TSV con un '1':

Nuestras variables independientes o predictoras 'X' serán las caracteristicas tomadas de cada una de las muestras (datos proporcionados en el fichero de casos de entrenamiento), mientras que nuestra variable categórica 'Y' recogerá las etiquetas que hemos establecido para los datos.

Una vez que tenemos construidas nuestras variables independientes o predictoras 'X' y nuestra variable categórica 'Y' vamos a pasar a tratar de configurar tanto el parámetro 'C' presente en nuestra función de minimización y el parámetro "sigma" (σ) presente en nuestra función "kernel" gaussiana. Dichos valores los configuraremos en función de como obtengamos mejores resultados, que en este caso, tras analizar diferentes configuraciones, obtenemos mejores resultados con los siguientes valores:

Una vez que hemos elegido los parámetros configurables de nuestra Máquina de Soporte Vectorial (parámetros de la función a minimizar y de la función "kernel" gaussiana), podemos iniciar el entrenamiento con los datos de las muestras proporcionadas y generar así un modelo óptimo que representa el hiperplano de separación buscado por el algoritmo que maximiza la distancia entre las diferentes clases:

Una vez obtenido el modelo del entrenamiento, podemos cargar los casos de test, y mediante el método "swmPredict" obtener la clasificación/predicción correspondiente en función del modelo construido con los datos de entrenamiento y así poder posteriormente analizar los resultados obtenidos:

En las variables "Group1" y "Group2" devueltas por "svmPredict" están recogidos los valores de las predicciones para los casos de test en función del modelo aprendido en el entrenamiento.

Volver a la Pagina Principal (Inicio)