Detección de Soplos Cardíacos usando Medidas Derivadas del Análisis Acústico en Señales Fonocardiográficas

Detección de Soplos Cardíacos usando Medidas Derivadas del Análisis Acústico en Señales Fonocardiográficas E. Delgado1, A.M. Castaño1, J.I. Godino2 an

Author: Yolanda Plaza Ramos

2 downloads 33 Views 184KB Size

Report

DOWNLOAD PDF

Recommend Stories

Derivadas

Ecuaciones en Derivadas Parciales

Ecuaciones en Derivadas Parciales Material preliminar y ejercicios resueltos elaborados por el equipo docente de la asignatura Ecuaciones Diferencial

Ejercicios del curso Ecuaciones en derivadas parciales

Derivadas

Geometria. Funciones. Coseno. Seno

Derivadas

ECUACIONES EN DERIVADAS PARCIALES

ECUACIONES EN DERIVADAS PARCIALES 3 4 DEDICATORIA A mi mujer, Magdalena, y a mis hijas, Irene y Magdalena, simplemente, porque las quiero y ella

SEMIOLOGIA GENERAL SOPLOS

Derivadas

Story Transcript

Detección de Soplos Cardíacos usando Medidas Derivadas del Análisis Acústico en Señales Fonocardiográficas E. Delgado1, A.M. Castaño1, J.I. Godino2 and G. Castellanos1 1

Universidad Nacional de Colombia/Grupo de Control y Procesamiento Digital de Señales {amcastanos,edelgadot,cgcastellanosd}@unal.edu.co Vía al Magdalena Km 7, Campus la Nubia, Manizales, Caldas, Colombia 2 Universidad Politécnica de Madrid/Grupo de Bioingeniería y Optoelectrónica [email protected]

Abstract— The cardiac mechanical information can be inferred from the sounds generated by the heart beats, which can be analyzed by signals known as phonocardiograms (PCG). A methodology based on acoustic analysis of digitized PCG signals is presented, oriented to detection of cardiac murmurs originated by valvular pathologies. Initially, a filtration system based on the wavelet transform is developed to reduce the disturbances that usually appear in the acquisition stage, adjusted and validated according to the clinical requirements. A between-beats segmentation algorithm is developed which uses information of the ECG signal previously acquired in a synchronous way to hook the beginning of the QRS complex with the beginning of the S1 sound of the PCG signal. Intra-beat segmentation is proposed for detecting S1, S2, systole and diastole based on the relationship analysis of energy and threshold. Features derived from the acoustic analysis are extracted on the segments. Feature effectiveness is evaluated by a linear Bayesian type classification model for separating the classes: normal and murmur. The used database of phonocardiographic records belongs to the National University of Colombia, having 164 records as follows: 81 records labelled as “normal” and 83 labelled as “murmur”. Finally, 360 representative beats were chosen by specialist, 180 normal and 180 with evidence of cardiac murmurs. Classification precision, sensitivity and specificity results are obtained. The best result of classification precision was 93,1% with sensitivity and specificity values equals to 93,3% and 92,8%, respectively, using Bayesian classifier and cross-validation procedure of 10 folds. Palabras claves— Análisis acústico, detección de patologías, soplos cardíacos y fonocardiografía.

I. INTRODUCCIÓN Las enfermedades cardíacas son una de las principales causas de mortalidad y morbilidad en la sociedad moderna [1], por lo tanto, cualquier avance en las técnicas de soporte automático de diagnóstico y tratamiento para estas enfermedades, contribuye al entendimiento de la dinámica cardíaca y sus fenómenos subyacentes. La auscultación cardíaca es un procedimiento clínico donde se escuchan los

sonidos del corazón para emitir o aproximar un diagnóstico del estado fisiológico del mismo [2]. El registro que reproduce los sonidos del corazón se conoce como señal fonocardiográfica (FCG), que informa sobre la actividad mecánica cardíaca, a bajo costo económico y fácil adquisición. La literatura reporta el uso de la transformada wavelet (WT) para el procesamiento de señales FCG, por su naturaleza altamente no estacionaria; sin embargo, las wavelets presentan errores relacionados al análisis de distribución de energía (ED), provocando que los resultados no sean los mejores para la detección de eventos [3]. En [4] se afirma que es importante mantener la longitud de la ventana de análisis tan corta como sea posible para garantizar la hipótesis de estacionariedad. El problema es que se reduce la resolución en frecuencia del espectrograma obtenido, aunque si el ajuste del tiempo de deslizamiento es adecuado, los resultados pueden mejorar. En [5] se propone un método de codificación de los sonidos cardíacos para detectar anormalidades. En [6] se proponen dos técnicas para analizar la separación de los sonidos por retraso sin modificar la calidad de los ruidos cardíacos y sin desplazar el espectro: WSOLA (Waveform Similarity Overlap-andAdd) y MTSM (Multiresolutional Time Scale Modification). La validación se realiza mediante la valoración auditiva de 20 médicos expertos. Se demostró que el retraso en tiempo de algunos ruidos cardíacos mejora la capacidad de los médicos para reconocer eventos relacionados a desórdenes cardíacos. En general, se reportan diversos trabajos que proponen distintas formas de procesamiento de la señal FCG; sin embargo, la caracterización orientada a la detección de soplos no facilita la interpretación médica, además de no ofrecer separabilidad determinante debido a que los soplos no son de naturaleza consistente en el tiempo ni en la frecuencia. El procesamiento digital de señales FCG basado en características acústicas tiene la ventaja de convertir el esquema subjetivo tradicional en un análisis objetivo. Para esto, en este trabajo se propone una caracterización basada en técnicas que han ofrecido alto rendimiento en el análisis

Carmen Mueller-Karger, Sara Wong, Alexandra La Cruz (Eds.): CLAIB 2007, IFMBE Proceedings 18, pp. 202–206, 2007 www.springerlink.com © Springer-Verlag Berlin Heidelberg 2007

Detección de Soplos Cardíacos usando Medidas Derivadas del Análisis Acústico en Señales Fonocardiográficas

acústico de voz, particularmente, los coeficientes cepstrales de la escala Mel en frecuencia (MFCC) y el Jitter, para emular de manera aproximada el sistema auditivo, orientado a la detección acústica de cardio-patologías valvulares sobre señales FCG. II. CONSIDERACIONES FISIOLÓGICAS

con una duración de 12 segundos y en posición decúbito dorsal. La frecuencia de muestreo es de 44100 Hz. De esta base de datos etiquetada se usaron 81 registros con etiqueta normal y 83 registros con etiqueta de soplo. Finalmente, con ayuda de los médicos especialistas se eligieron 360 latidos representativos (180 normales y 180 con soplo cardíaco). B. Filtración

A. Válvulas cardíacas El corazón consta de dos cavidades superiores (aurículas) y dos inferiores (ventrículos). Las cavidades inferiores están separadas de las superiores por válvulas, las cuales evitan que la sangre se devuelva. Las válvulas son compuertas de entrada a la sangre que ingresa al ventrículo y compuertas de salida para la sangre que sale del mismo. De acuerdo a esto, el corazón tiene 4 válvulas: Tricuspídea, Mitral, Aórtica y Pulmonar. Es importante anotar que cada válvula define un foco de auscultación cardíaca [2]. B. Acústica cardíaca Los sonidos son generados por el cierre de las válvulas cardíacas. En los casos normales, cada latido consta de dos sonidos y dos silencios. El primer sonido S1 corresponde al cierre de las válvulas mitral y tricuspídea que precede al primer silencio (la sístole) donde se llenan las aurículas de sangre, el segundo sonido S2 corresponde al cierre de las válvulas aórtica y pulmonar, que preceden al segundo silencio (la diástole) donde se llenan de sangre los ventrículos. Después de este último silencio se repite S1. La existencia de soplos cardíacos cambian las características acústicas de los sonidos en intensidad, tiempo, tono, entre otros, debido al flujo turbulento de la sangre provocado por el mal funcionamiento de las válvulas. No necesariamente los soplos cardíacos se escuchan en todos los focos, es posible que un paciente con alguna valvulopatía sea auscultado en algunos focos como sano [2]. III. MATERIALES Y MÉTODOS A. Base de Datos La base de datos pertenece a la Universidad Nacional de Colombia y está conformada por registros FCG de 50 sujetos normales y 98 pacientes con soplo cardíaco (estenosis aórtica, regurgitación mitral, etc.), mayores de edad y sin restricción de género. A cada paciente se le tomaron 8 registros correspondientes a los cuatro focos de auscultación (mitral, tricuspídeo, aórtico y pulmonar) en fase de apnea post-espiratoria y post-inspiratoria, cada uno

_______________________________________________________________

203

Para reducir interferencias acústicas de la etapa de adquisición, sin alterar los sonidos cardíacos, se desarrollaron algoritmos del tipo denoising, usando las reglas de selección del umbral basadas en los métodos de reescalamiento. Se realizaron combinaciones variando el nivel de descomposición desde 1 hasta 10 para diferentes familias wavelets (Haar, Daubechies, Symlets y Coiflets). Posteriormente, un grupo de especialistas en auscultación escucharon los registros originales y filtrados. De acuerdo a sus conceptos se descartaron los algoritmos que alteraron las características sonoras y se eligió el algoritmo que permitía percibir de forma más clara los sonidos cardíacos y los soplos. El método de validación se basó en la relación señal-ruido SNR: 2 ⎛ N ⎜ ∑ ( x (n) − x ) SNR = 10 log ⎜ N n =1 2 ⎜ ⎜ ∑ ( x ( n ) − x ( n ) ) ⎝ n =1

⎞ ⎟ ⎟ ⎟ ⎟ ⎠

(1)

donde x (n ) es la señal original, ~ x (n ) la señal reconstruida, x la media de la señal y N el tamaño de la ventana. C. Técnicas de Segmentación Segmentación entre-latidos: En la clínica, el médico se ayuda de alguna derivación de la señal electrocardiográfica (ECG) para ubicar S1, ya que su comienzo coincide con el inicio del complejo QRS del ECG. La base de datos usada incluye sincrónicamente la derivación DII del ECG. Por lo tanto, el algoritmo de segmentación diseñado encuentra el inicio del QRS y lo hace corresponder con el inicio de S1. De esta forma se determinan los inicios de cada latido FCG. La detección del complejo QRS se obtiene mediante la transformada wavelet usando las escalas 21 a 24 de una spline cuadrática, debido a que el complejo QRS produce dos módulos máximos con signos opuestos y un cruce por cero en el pico R [7]. Segmentación intra-latido: Consiste en segmentar S1, S2, sístole y diástole. Para realizar esta segmentación primero se halla la energía en cada uno de los puntos de la señal: 2 E (i ) = x(i ) , donde i = 1,...., n y n es el numero de puntos

IFMBE Proceedings Vol. 18

__________________________________________________________________

204

E. Delgado, A.M. Castaño, J.I. Godino and G. Castellanos

de x . Después se realiza una filtración de paso bajo 1 l+ j Es ( j ) = ∑ E ( i ) , con j = 1,..., p , donde l es el valor l i= j correspondiente al redondeo superior de n/10 y en Es queda la envolvente de E. Realizando una búsqueda iterativa en la envolvente Es, y usando un procedimiento de umbralización para las magnitudes, se obtienen los puntos de segmentación intra-latido. Cuando las condiciones patológicas no permiten distinguir el inicio y final de cada segmento, se propone el cálculo de tiempos relativos promedio usando las siguientes expresiones:

τ S1 =

τ τ1 τ τ ,τ S 2 = 2 , τ s = 3 , τ d = 4 τ τ τ τ

(2)

donde el tiempo promedio del latido completo, de S1, de S2, de la sístole y de la diástole, están denominados respectivamente por τ, τ 1 , τ 2 , τ 3 y τ 4 . Estas relaciones temporales son tomadas en cuenta al final del algoritmo, de manera que si los tiempos de un nuevo latido están por fuera de estos rangos, los puntos de segmentación quedan asignados usando: τS1 , τS2 , τs y τd . D. Características acústicas Mel-Frequency Cepstral Coefficient (MFCC): Es una representación definida como los cepstrum reales de una señal ventaneada a corto tiempo obtenida mediante la transformada rápida de Fourier (FFT). La diferencia de los MFCC con los cepstrum reales es que se usa una escala no lineal de frecuencia. Los MFCC pueden ser considerados como una aproximación al comportamiento del sistema auditivo humano [8]. El sistema auditivo funciona como un banco de filtros en las que el módulo de amplitud decae exponencialmente, y las frecuencias centrales de cada filtro están espaciadas de forma creciente y logarítmica. Los MFCC intentan emular este comportamiento mediante un banco de filtros que usa la escala Mel para la determinación de las frecuencias centrales de cada filtro. La energía que pasa por cada filtro corresponde a cada MFCC de la señal. En este trabajo se calculan 14 MFCC para cada segmento del latido FCG (S1, sístole, S2, diástole). Se diseñan 14 filtros triangulares cuyas frecuencias centrales van desde 0 hasta fs/2 de forma logarítmica. fs es la frecuencia de muestreo de la señal (fs = 3 kHz). Las amplitudes decaen exponencialmente hacia fs/2. Así, la representación de Fourier de cada segmento del latido, Y, se multiplica por los coeficientes de cada filtro Hd: S (d ) = log10 ( H d Y )

d = 1,...,14

_______________________________________________________________

(3)

Finalmente, se determinan los MFCC (1 por cada filtro) de la siguiente manera: 14 ⎡π ⎤ MFCC( d ) = ∑ S ( k ) cos ⎢ ( d )(k − 0.5) ⎥ d = 1,...,14 (4) ⎣14 ⎦ k =1

Jitter: Es una medida que toma tramos de la señal que contienen al menos un ciclo de la frecuencia fundamental (f0) y determina la variación de la f0 de cada tramo con respecto a la f0 de la señal [8]. Inicialmente, el procedimiento requiere determinar la longitud de ventana que contenga al menos un ciclo de la componente de menor frecuencia con magnitud significativa en el espectro promedio de las señales FCG. Este valor se estimó en 20 Hz, por lo tanto la longitud de la ventana se tomó de 5 ms. Luego, se hace un ventaneo de los segmentos (S1, sístole, S2 y diástole), hallando por medio de la FFT la frecuencia fundamental fo de cada tramo, desplazando la ventana con 80% de solapamiento. Finalmente, se obtiene el vector de frecuencias fundamentales de dimensión N para cada segmento, y se estima el Jitter, como: ⎛ N f o (i − 1) + f o (i ) + f o (i + 1) ⎞ − f o (i ) ⎟ ⎜∑ 3 i =1 ⎠ Jitter = ⎝ N ∑ f0 (i)

(5)

i =1

Transformación logarítmica: Después de estimar los valores que componen la matriz de características, a cada columna se resta la media y se normaliza geométricamente, posterior a esto, se realiza un procedimiento para que la matriz no tenga valores ≤ 0. De esta manera, se procede a obtener el logaritmo natural de la matriz, con la cual se realizarán las pruebas de clasificación. Efectividad de las características y validación: La efectividad de las características orientada a la detección de soplos se evalúa mediante un clasificador bayesiano. La validación se realizó sobre varios bloques de muestras tomadas del conjunto de entrenamiento aleatoriamente. El resultado de validación se halló encontrando el valor medio de precisión de clasificación sobre los valores obtenidos para cada uno de los bloques. IV. RESULTADOS Y DISCUSIÓN El análisis de estacionariedad mostró que la información estadística de un solo latido es suficiente para la detección de soplos. La etapa de filtración permitió a los especialistas etiquetar los registros con menor grado de perturbaciones acústicas. Los mejores resultados se obtuvieron con la wavelet coiflet 4 al octavo nivel de descomposición. La

IFMBE Proceedings Vol. 18

__________________________________________________________________

Detección de Soplos Cardíacos usando Medidas Derivadas del Análisis Acústico en Señales Fonocardiográficas

segmentación entre-latidos usando la señal ECG dio un resultado de precisión del 100%. Para la segmentación intra-latido fueron considerados los siguientes parámetros: TP - número de verdaderos positivos, FP - número de falsos positivos y FN - número de falsos negativos. Los resultados fueron: TPnormal = 713 y TPsoplo = 612 FPnormal = 7 y FPsoplo: 108 FNnormal = 0 y FNsoplo = 0 TP 1325 ×100% = ×100% = 92% TP + FP 1325 + 115 1325 TP Sensibilidad = ×100% = ×100% = 100% TP + FN 1325 + 0

De los resultados mostrados en las Tablas 1 y 2, se observa que la filtración disminuye el número de falsos negativos, lo cual implica que pocos latidos anómalos serán considerados como normales, lo cual es deseable. El hecho de que latidos normales sean considerados como posibles patológicos implica que el cardiólogo deberá comprobarlos visualmente, pero esto no se considera un problema grave. V. CONCLUSIONES

Valor predictivo positivo =

Después de realizar una selección de características para determinar las que ofrecen mayor separabilidad, se encontró que las características relacionadas a los MFCC fueron las más relevantes. La efectividad de las características orientada a la detección de soplos usando clasificador bayesiano sobre señales sin filtrar se expone en la Tabla 1, y el resultado de clasificación sobre características extraídas sobre señales filtradas se muestra en la Tabla 2. Tabla 1 Matriz de confusión para señales sin filtrar S: Soplo N: Normal

Clase real S

Clase etiquetada por el clasificador

N

S

TP = 164

FP = 13

N

FN = 16

TN = 167

Total

180

180

Total 177 183 NS = 360

TP ×100% = 91,1% TP + FN TN Especificidad = × 100% = 92,8% TN + FP TP + TN % PC = ×100% = 91,9% NS

Sensibilidad =

Clase etiquetada por el clasificador Total

Clase real S

N

S

TP = 168

FP = 13

N

FN = 12

TN = 167

180

180

TP × 100% = 93,3% TP + FN TN Especificidad = × 100% = 92,8% TN + FP TP + TN % PC = ×100% = 93,1% NS

Sensibilidad =

_______________________________________________________________

En la clínica, el médico entrena el oído para escuchar de los sonidos cardíacos solo las franjas en las que es más probable encontrar ruidos patológicos. El análisis acústico propuesto en este trabajo emula este procedimiento, y es por esto, que los MFCC fueron las características que ofrecieron mayor capacidad de representación para la discriminación entre las clases. En general, se concluye que la detección de soplos cardíacos sobre señales FCG usando las características acústicas propuestas es realizable. Por otro lado, tomando en cuenta la valoración de médicos expertos en semiología cardíaca, la atenuación de componentes acústicas que no correspondían a la información clínica, sin deteriorar las características auditivas de los sonidos cardíacos, se logró a través de la descomposición y reconstrucción usando la transformada wavelet discreta y umbralización adaptativa. Adicionalmente, el denoising aplicado a señales FCG disminuyó la presencia de falsos negativos, debido a que la filtración resaltó las componentes espectrales de los soplos reduciendo el ruido de envolvente. Así, la filtración mejoró la precisión de clasificación.

AGRADECIMIENTOS

Tabla 2 Matriz de confusión para señales filtradas S: Soplo N: Normal

205

Total 181 179

Este trabajo se enmarca en el proyecto “Técnicas de computación de alto rendimiento en la interpretación automatizada de imágenes médicas y bioseñales”, financiado por la DIMA y la VRI de la Universidad Nacional de Colombia, con código 20201004224. Además, los autores agradecen la colaboración de los médicos especialistas Ana María Matijasevic y Guillermo Agudelo.

NS = 360

REFERENCIAS 1. 2. 3.

del Río, J. A. (2002). Aspectos del perfil de morbimortalidad. Technical report, Hospital Universitario de Caldas, Manizales. Guyton, A. C. and Hall, J. E. (1997). Tratado de Fisiología médica. Mc. Graw-Hill, 9th ed. Ergen, B. and Tatar, Y. (2003). Optimal continuous wavelet analisys of periodograms signals. In IJCI Proceedings of International Conference on Signal Processing, vol. 1, No 2, p.p. 187-191.

IFMBE Proceedings Vol. 18

__________________________________________________________________

206 4. 5. 6. 7.

E. Delgado, A.M. Castaño, J.I. Godino and G. Castellanos Djebbari, A. and Reguig, F. B. (2000). Short–time fourier analysis of the phonocardiogram signal. In 7th International conference on electronics, circuits and systems, vol. 2, p.p. 844–847. Modegi, T. (2001). XML transcription method for biomedical acoustic signals. Medinfo. IOS Press, p.p. 366-370. Telatar, Z. and Erogul, O. (2003). Heart sounds modification for the diagnosis of cardiac disorders. In IJCI Proceedings of International Conference on Signal Processing, vol. 1, p.p. 100–105. Sahambi, J.S., Tandon, S., and Bhatt, R. (1997). Using wavelet transform for ECG characterization. IEEE Tran. Engineering in Medicine and Biology, 16(1):77-83.

_______________________________________________________________

8.

Acero, A. and Hon, H. W. (2001). Spoken Language Processing. Prentice Hall.

Autor: Edilson Delgado Trejos. Instituto: Universidad Nacional de Colombia. Departamento de Ingeniería Eléctrica, Electrónica y Computación. Grupo de Control y Procesamiento Digital de Señales. Dirección: Campus la Nubia, Km 7 vía al Magdalena. Manizales. Caldas. País: Colombia. E-mail : [email protected] – CC: [email protected]

IFMBE Proceedings Vol. 18

__________________________________________________________________