UNIVERSIDAD SIMÓN BOLÍVAR

´ BOL´IVAR UNIVERSIDAD SIMON DECANATO DE ESTUDIOS PROFESIONALES ´ DE INGENIER´IA DE LA COMPUTACION ´ COORDINACION Detecci´ on de Dientes y Paladar en

3 downloads 88 Views 2MB Size

Story Transcript

´ BOL´IVAR UNIVERSIDAD SIMON DECANATO DE ESTUDIOS PROFESIONALES ´ DE INGENIER´IA DE LA COMPUTACION ´ COORDINACION

Detecci´ on de Dientes y Paladar en Fotograf´ıas Intrabucales de Vista Palatina

Por: Kelwin Fern´andez

Realizado con la asesor´ıa de: Carolina Chang

PROYECTO DE GRADO Presentado ante la Ilustre Universidad Sim´on Bol´ıvar como requisito parcial para optar al t´ıtulo de Ingeniero en Computaci´on

Sartenejas, Junio de 2012

iv

Resumen El presente trabajo tiene por objetivo la detecci´on de dientes y paladar en im´agenes a color de vista palatina de la mand´ıbula superior (maxilar superior), es decir, segmentar ´ las regiones de la imagen pertenecientes a dientes y paladar del resto de la imagen. Este constituir´a un primer paso en la detecci´on de enfermedades en dicha zona. La importancia de detectar enfermedades orales radica en el hecho de que alrededor del 70 % de las personas con VIH padecen de alguna enfermedad oral, que puede indicar la presencia o el avance de este virus en SIDA. Para lograr este objetivo se hizo uso de conceptos y t´ecnicas de tres ´areas importantes de la computaci´on, como lo son: visi´on de computadoras, inteligencia artificial y algoritmos de optimizaci´on heur´ıstica, tambi´en conocidos como metaheur´ısticas. Tanto la herramienta desarrollada como su presentaci´on se descompone en dos fases. La primera consiste en la detecci´on de dientes, en la cual la herramienta fue capaz de predecir con exactitud la pertenencia de p´ıxeles a dientes en el 90.28 % de los casos. En esta fase se utiliza una Red Neural para la clasificaci´on de los p´ıxeles, en conjunto con pasos de preprocesamiento para mejorar la calidad de las im´agenes de entrada y de postprocesamiento para limpiar los p´ıxeles mal clasificados. Posteriormente, ocurre una fase de detecci´on del paladar, la cual cuenta con una precisi´on de 88.66 % de p´ıxeles bien clasificados. En esta fase se utilizan algoritmos capaces de ajustar una curva al arco definido por los dientes y un algoritmo que detecta el ancho de los dientes, con el fin de delimitar la frontera entre los dientes y el paladar. En el estudio de la soluci´on a estos problemas se contrast´o, adicionalmente al uso de Redes Neurales, el uso de M´aquinas de Soporte de Vectores. Adicionalmente, se plantean dos extensiones al proyecto. La primera extensi´on determina si una imagen contiene o no un paladar superior y, en caso positivo, delimitar la zona en la cual se encuentra. La segunda extensi´on busca detectar la frontera entre cada par de dientes, de tal forma que la descripci´on generada de la imagen sea m´as completa. Este trabajo ser´a presentado en el “5th Workshop on Artificial Neural Networks in Pattern Recognition” en la ciudad de Trento, Italia, para su posterior publicaci´on en la serie “Lecture Notes in Artificial Intelligence” de la editorial Springer.

v

A Alan Turing, padre de la computaci´on y de la inteligencia artificial, a cien a˜ nos de su nacimiento.

v

Agradecimientos El presente trabajo se llev´o a cabo a lo largo de un a˜ no, tiempo en el cual no s´olo una persona form´o parte de su desarrollo. La menci´on de cada una de esas personas en la presente secci´on no se plantea por orden de importancia. En primer lugar quiero agradecer a mis familiares por el apoyo brindado no s´olo este sino durante todos mis a˜ nos de formaci´on acad´emica. En segundo lugar, quiero agradecer a la Universidad Sim´on Bol´ıvar, por todo lo que me ha brindado, ayud´andome en la formaci´on como un buen profesional. Esperando que este trabajo cierre un ciclo que en ella se inici´o y sea digno de llevar su nombre. Adem´as, quisiera hacer llegar mi agradecimiento a la profesora Carolina Chang, por su ayuda constante en cada uno de los pasos que he dado en esta y otras investigaciones. Hacer por hacer no nos lleva a ning´ un lugar, debemos hacer por causar un impacto positivo en la humanidad. Muy enf´aticamente me gustar´ıa agradecer a la Dra. Vilma Tovar del “Centro de Atenci´on a Personas con Enfermedades Infectocontagiosas Dra Elsa La Corte”, de la Universidad Central de Venezuela. Quien proporcion´o im´agenes acompa˜ nadas de sus diagn´osticos para el desarrollo de este trabajo. Finalmente, dar gracias a Dios, por darme la fortaleza de alcanzar cada meta propuesta a lo largo de mi vida.

´Indice general ´Indice general

VII

´Indice de cuadros

IX

´Indice de figuras

X

1. Introducci´ on

1

2. Marco te´ orico 2.1. Visi´on de Computadoras . . . . . . . . . . . . . 2.1.1. Im´agenes . . . . . . . . . . . . . . . . . . 2.1.2. Filtrado de Im´agenes . . . . . . . . . . . 2.1.2.1. Equalizaci´on de Histograma . . 2.1.2.2. Resaltado de Color . . . . . . . 2.1.2.3. Filtro de Mediana . . . . . . . 2.1.2.4. Suavizado/Resaltado de Bordes 2.1.2.5. Filtrado por Componentes . . . 2.2. Metaheur´ısticas . . . . . . . . . . . . . . . . . . 2.2.1. Definici´on de T´erminos . . . . . . . . . . 2.2.2. B´ usqueda Local . . . . . . . . . . . . . . 2.2.3. B´ usqueda en Vecindades Variables . . . 2.2.4. B´ usqueda Local Iterada . . . . . . . . . 2.3. Aprendizaje de M´aquina . . . . . . . . . . . . . 2.3.1. M´aquinas de Soporte de Vectores . . . . 2.3.2. Redes Neurales Artificiales . . . . . . . . 2.3.2.1. Neurona Artificial . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

5 5 6 7 7 8 9 10 11 12 13 13 16 17 19 19 20 21

2.3.2.2. Redes Multicapa . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2.3. Algoritmo “Backpropagation” . . . . . . . . . . . . . . . . . 2.3.3. Detecci´on de Datos An´omalos . . . . . . . . . . . . . . . . . . . . . . 3. Segmentaci´ on de Dientes y Paladar 3.1. Segmentaci´on de Dientes . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.2. Clasificaci´on de P´ıxeles . . . . . . . . . . . . . . . . . . . . . . . . 3.1.3. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Segmentaci´on de Paladar . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Ajuste de Curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2. Experimentos de Ajuste de Curva . . . . . . . . . . . . . . . . . . 3.2.3. Decisi´on de Ancho de Banda . . . . . . . . . . . . . . . . . . . . . 3.2.4. Resultados Experimentales para la Selecci´on del Ancho de Banda

. . . . . . . . .

. . . . . . . . .

21 22 23 25 26 27 28 29 33 33 36 39 40

4. Detecci´ on de Paladar

43

5. Segmentaci´ on Interdental 5.1. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Identificaci´on de Fronteras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Resultados Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . .

48 49 51 51

6. Conclusiones y recomendaciones

53

Bibliograf´ıa

57

A. Otros Filtros de Im´ agenes A.1. Filtro Homom´orfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2. Filtro de Umbral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60 61 62

B. Descripci´ on General de la Implementaci´ on

65

C. Sistema de Clasificaci´ on de Im´ agenes

67

viii

´Indice de cuadros 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7.

M´aquina de Pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Clasificaci´on de p´ıxeles con SVM y ANN . . . . . . . . . . . . . . . . . . . . Clasificaci´on de p´ıxeles sobre formatos combinados con SVM y ANN . . . . . Filtrado de Componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ajuste de Curvas sobre Im´agenes Clasificadas de Forma o´ptima . . . . . . . Ajuste de Curvas sobre Im´agenes Clasificadas por la Red Neural . . . . . . . Limpieza Iterativa de P´ıxeles Ruidosos. N´ umero de iteraciones promedio y m´aximo hasta alcanzar punto fijo. . . . . . . . . . . . . . . . . . . . . . . . . 3.8. Limpieza Iterativa de P´ıxeles Ruidosos . . . . . . . . . . . . . . . . . . . . . 3.9. Mejora general mediante el ajuste de curva . . . . . . . . . . . . . . . . . . . 3.10. Variaci´on en la clasificaci´on de dientes por la selecci´on del ancho de banda .

29 30 31 32 36 37

4.1. Detecci´on de Paladar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Clasificaci´on de P´ıxeles con Detecci´on de Paladar . . . . . . . . . . . . . . .

44 47

5.1. Segmentaci´on Interdental . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52

38 38 39 41

´Indice de figuras 1.1. Im´agenes con Enfermedades . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

2.1. Algoritmo de Equalizaci´on de Histograma . . . . . . . . . . . . . . . . . . . 2.2. Equalizaci´on de Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Filtro de Color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Filtro de Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Suavizado/Realzado de Bordes . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6. Filtrado de Componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7. Algoritmo de B´ usqueda Local . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Representaci´on Gr´afica del Algoritmo de B´ usqueda Local . . . . . . . . . . . 2.9. Representaci´on Gr´afica del Algoritmo de B´ usqueda en Vecindades Variables . 2.10. Algoritmo B´ usqueda en Vecindades Variables . . . . . . . . . . . . . . . . . . 2.11. Representaci´on Gr´afica del Algoritmo de B´ usqueda Local Iterada . . . . . . 2.12. Algoritmo B´ usqueda Local Iterada . . . . . . . . . . . . . . . . . . . . . . . 2.13. Red Neural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.14. Algoritmo Backpropagation . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.15. Algoritmo de Detecci´on de Datos An´omalos . . . . . . . . . . . . . . . . . .

7 8 9 10 11 12 14 15 16 17 18 19 22 23 24

3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8.

25 26 27 29 32 33 36 38

Fotograf´ıas de Inter´es . . . . . . . . . . . . . . . . Detecci´on o´ptima de Dientes . . . . . . . . . . . . Aplicaci´on de Filtros de Color . . . . . . . . . . . Detecci´on de Dientes usando Redes Neurales . . . Selecci´on de Umbral para Clasificaci´on de P´ıxeles Ajuste ´optimo de Curva . . . . . . . . . . . . . . Zona de Error entre un Par de Curvas . . . . . . Ajuste de Curvas . . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

3.9. Selecci´on de Ancho de Banda. . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10. Selecci´on de Ancho de Banda y Segmentaci´on Diente/Paladar . . . . . . . .

41 42

4.1. 4.2. 4.3. 4.4.

. . . .

44 45 45 46

5.1. Aplanado de Curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Problema con Aplanado de Curva . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Dientes Segmentados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49 50 52

A.1. Filtro homom´orfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2. Porcentaje de Clasificaci´on utilizando distintos umbrales . . . . . . . . . . . A.3. Porcentaje de Clasificaci´on utilizando distintos umbrales . . . . . . . . . . .

62 62 63

B.1. Logotipo de OpenCV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2. Diagrama de Flujo de la Tarea de Clasificaci´on de P´ıxeles como Diente/No Diente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.3. Diagrama de Flujo de la Tarea de Segmentaci´on del Paladar . . . . . . . . .

65 66 66

C.1. Herramientas Utilizadas. Python (izquierda), Django (centro), PostgreSQL (derecha). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.2. Diagn´ostico de Im´agenes (Arriba). Carga de Nuevas Im´agenes (Abajo). . . .

67 68

Im´agenes sin Paladar . . . . . . . . . . . Falsos Negativos en Detecci´on de Paladar Falsos Positivos en Detecci´on de Paladar Im´agenes con Paladar en Menor Escala .

xi

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

Cap´ıtulo 1 Introducci´ on Treinta y cuatro millones de personas ten´ıan Virus de Inmunodeficiencia Humana (VIH) a fines del a˜ no 2010 de acuerdo a la Organizaci´on Mundial de la Salud [WHO]. Un 93.5 % de esas personas residen en pa´ıses en v´ıas del desarrollo y s´olo un 47 % de pacientes en este subgrupo reciben el tratamiento antiretroviral que necesitan. La evidencia sugiere que alrededor del 70 % de estas personas con VIH tienen enfermedades orales, incluyendo Leucoplasia Vellosa, Sarcoma de Kaposi y Candidiasis [C.E88]. El diagn´ostico de estas enfermedades es muy importante porque algunas de ellas pueden indicar la evoluci´on del VIH hacia el S´ındrome de Inmunodeficiencia Adquirida (SIDA) [AT98]. Tristemente, el n´ umero de centros de atenci´on odontol´ogica que tratan enfermedades infectocontagiosas en pa´ıses en v´ıas de desarrollo es limitado, en muchos casos, insuficiente. Debido a sus caracter´ısticas, es posible inferir que algunas enfermedades orales que indican la presencia de VIH/SIDA pueden ser diagnosticadas autom´aticamente. Una herramienta computacional de bajo costo para detectar enfermedades orales infectocontagiosas puede conducir a una mejora en el cuidado de la salud, especialmente en pa´ıses de bajos y medianos ingresos.

2

Este trabajo se enfoca en el problema de segmentar los dientes y el paladar superior en fotograf´ıas de vista palatina de la mand´ıbula superior (maxilar superior) como un paso inicial hacia el diagn´ostico de enfermedades orales. El paladar es un a´rea importante y de gran tama˜ no de la boca donde diversas enfermedades pueden ser observadas. Por ejemplo, en la figura 1.1 se muestran casos de pacientes con enfermedades orales tales como Candidiasis, Hepatitis y Sarcoma de Kaposi.

(a)

(b)

(c)

(d)

Figura 1.1: (a) Paladar saludable. Enfermedades orales: (b) Candidiasis, (c) Hepatitis, (d) Sarcoma de Kaposi.

Los trabajos previos en el uso de im´agenes bucales con fines m´edicos est´an principalmente basados en el uso de radiograf´ıas. Por ejemplo, se tienen los trabajos descritos a continuaci´on, que tienen como objetivo la segmentaci´on interdental en radiograf´ıas dentales para identificaci´on postmorten [Nas06] [LH09]. En [Nas06] un m´etodo basado en redes neurales es propuesto para generar un sistema de identificaci´on postmorten mediante el pareamiento de caracter´ısticas de la imagen extra´ıda de radiograf´ıas dentales. El sistema intenta hacer coincidir radiograf´ıas post-mortem y antemortem de una persona, proponiendo el uso de caracter´ısticas aprendibles inherentes de im´agenes dentales para comparar diente por diente. En [LH09] es propuesto un sistema de clasificaci´on y etiquetado dental que segmenta, clasifica e identifica cada diente en radiograf´ıas de mordida. Las radiograf´ıas son previamente mejoradas para aislar las regiones de inter´es usando filtros de im´agenes. Una vez que los

3

dientes son aislados, una M´aquina de Soporte de Vectores [CZ01,Vap98] clasifica cada diente como molar o premolar. Ambos sistemas est´an basados en radiograf´ıas, en contraposici´on se tiene en [LC10] el problema de segmentaci´on de labios en fotograf´ıas de color. Manejado mediante el ajuste de un modelo Gaussiano a trav´es de la informaci´on de los segmentos de los labios en im´agenes. Dicho trabajo se realiza como paso previo para la generaci´on de un sistema de lectura de labios. Las radiograf´ıas tienen la ventaja de ser tomadas bajo est´andares comunes, con m´aquinas de baja variabilidad pero proveen menos informaci´on acerca de enfermedades comparadas con fotograf´ıas de vista palatina. Por otro lado, las fotograf´ıas son altamente sensitivas a fen´omenos tales como iluminaci´on, calidad de la imagen, punto de vista, falta de est´andares, entre otros. Comparando los costos de obtenci´on, las fotograf´ıas son de mayor acceso para el p´ ublico en general, adem´as de poder ser tomadas por usuarios no relacionados directamente al campo m´edico, expandiendo las posibilidades de implantaci´on del proyecto en sectores con bajos recursos y alta poblaci´on. Por estos motivos, en el presente proyecto se trabaja con fotograf´ıas a color, teniendo como precondici´on que cumplen con ser fotograf´ıas de vista palatina, tales como las mostradas en la figura 1.1. El objetivo general de este proyecto es brindar una descripci´on general de una imagen de vista palatina, con el fin de servir de apoyo a sistemas de detecci´on de enfermedades. El inter´es en este aspecto es la contextualizaci´on de la imagen, permitiendo as´ı un an´alisis m´as profundo de ´esta, conociendo de antemano las estructuras presentes en ella. Con el fin de alcanzar el objetivo general de este proyecto se plantean los siguientes objetivos espec´ıficos: 1. Segmentar las zonas de la imagen en la que se encuentran los dientes y aquellas en las que se encuentra el paladar.

4

2. Generar una soluci´on preferiblemente de bajos costos y de f´acil acceso con el fin de subsanar los problemas de movilizaci´on de los pacientes y de sus costos generados. 3. Evaluar los resultados obtenidos por el sistema, para poder brindar a las pr´oximas fases informaci´on acerca de la precisi´on del sistema. El presente trabajo se encuentra dividido en 6 cap´ıtulos, incluida la introducci´on. El cap´ıtulo 2 expone las definiciones necesarias para comprender los aspectos fundamentales de la implementaci´on dada, la cual se presenta en el cap´ıtulo 3. Los cap´ıtulos 4 y 5 muestran dos extensiones al presente trabajo, en el cap´ıtulo 4 se muestra un procedimiento para romper con la precondici´on establecida, en la cual se exige que las im´agenes de entrada sean fotograf´ıas de vista palatina y en el cap´ıtulo 5 se presenta un m´etodo para segmentaci´on diente a diente en este tipo de im´agenes. Finalmente, el cap´ıtulo 6 contiene las conclusiones y recomendaciones, as´ı como los trabajos futuros a ser realizados con base en el siguiente trabajo.

Cap´ıtulo 2 Marco te´ orico

Este cap´ıtulo presenta los conceptos fundamentales necesarios para el desarrollo de la presente investigaci´on. El cap´ıtulo inicia con la definici´on del ´area de Visi´on de Computadoras, abarcando las t´ecnicas y conceptos de inter´es para este trabajo. Posteriormente, se describen los algoritmos utilizados en la implementaci´on de la presente investigaci´on, siendo ´estos separados en dos bloques: algoritmos metaheur´ısticos y algoritmos de aprendizaje de m´aquina. Del primer bloque, se describen los algoritmos de B´ usqueda Local, B´ usqueda Local Iterada y B´ usqueda en Vecindades Variables, todos ellos como t´ecnicas de mejoramiento de soluciones. Del segundo bloque, correspondiente al Aprendizaje de M´aquina, se describen los enfoques de Redes Neuronales y de M´aquinas de Soporte de Vectores, as´ı como un algoritmo especializado en la detecci´on de datos an´omalos en una muestra.

2.1.

Visi´ on de Computadoras

Se considera Visi´on de Computadoras (CV por sus siglas en ingl´es) como el campo de la computaci´on cuyo objetivo consiste en realizar decisiones u ´tiles sobre objetos f´ısicos reales y

6

escenas basadas en im´agenes censadas [SS01]. Para esto, es necesario extraer informaci´on de la imagen que permita construir una descripci´on de la misma. Por otro lado, muchos investigadores dicen que el objetivo fundamental de la visi´on de computadoras es construir una descripci´on de una escena proveniente de im´agenes. En esta u ´ltima definici´on el proceso previo de obtenci´on de las im´agenes en cuesti´on no es considerado parte fundamental del campo. Autores como Batchelor y Waltz [BW01] consideran esto como una parte ajena a la visi´on de computadoras, incluy´endolo en contraposici´on al campo de la Visi´on de M´aquinas. Si bien el aspecto de la recolecci´on de las im´agenes es importante y tiene por s´ı mismo problemas propios, el presente trabajo se aloja en el campo de la visi´on de computadoras mas que en el de m´aquinas. A´ un cuando el proceso de captura de datos fue contemplada para su desarrollo.

2.1.1.

Im´ agenes

Se puede definir una imagen F como una matriz con un n´ umero fijo de filas (m) y columnas (n). Sea 0 ≤ i < m y 0 ≤ j < n, se define F (i, j) como la informaci´on de una posici´on en F denominada p´ıxel [BW01]. El tipo de retorno de F (i, j) depender´a del formato de la imagen. De esta forma un p´ıxel puede tener un valor escalar, regularmente entre 0 y 255 (por su representaci´on en un byte) correspondiente a la escala de grises o una tupla correspondiente a cada una de las componentes del formato respectivo. En general, se utilizar´a en el futuro la notaci´on g(i, j) para expresar la aplicaci´on de la funci´on g al p´ıxel ubicado en la posici´on (i, j) de la imagen.

7

2.1.2.

Filtrado de Im´ agenes

Tanto en fases posteriores como en fases previas del procesamiento de im´agenes, ´estas deben ser mejoradas. En esta mejora, es posible reducir el ruido y resaltar o suprimir estructuras de inter´es para el problema particular. En general, se puede decir que un operador de mejora de im´agenes facilita la detecci´on de detalles o estructuras importantes en ´estas para un hombre o m´aquina [SS01]. A continuaci´on se define una serie de operadores de filtrado de im´agenes.

2.1.2.1.

Equalizaci´ on de Histograma

Sea una imagen F en escala de grises, es decir, cada p´ıxel es un escalar comprendido en el rango entre 0 y 255, ambos extremos inclusive. Si se define un nivel de gris x como cada uno de los valores en el rango [0 . . . 255], donde el n´ umero de p´ıxeles de dicho nivel se define como la cantidad de p´ıxeles (i, j) que cumplen con que F (i, j) = x, un operador de Equalizaci´on de Histograma busca que la imagen resultante F 0 contenga todos los niveles disponibles de gris y que cada nivel tenga aproximadamente igual n´ umero de p´ıxeles que los otros [SS01]. El algoritmo utilizado en el presente trabajo para la equalizaci´on de histograma es propuesto por la librer´ıa de Visi´on de Computadoras OpenCV [OCV], el cual se puede observar en la figura 2.1:

1 2 3 4

C a l c u l a r e l h i s t o g r a m a H de F . N o r m a l i z a r e l h i s t o g r a m a para que l a suma de s u s e l e m e n t o s s e a 2 5 5 . C a l c u l a r l a i n t e g r a l d e l h i s t o g r a m a : H ’ ( i ) = (+k | 0 , donde x es el vector de entradas y t el valor esperado de salida. n es la tasa de aprendizaje. La entrada proveniente de la unidad i a la unidad j es denotada como x ji y el peso de la unidad i a la j es denotado como w ji. El algoritmo presentado viene dado u ´nicamente para redes con una sola capa oculta, puede

23

1 2 3 4 5 6 7 8 9 10 11 12 13 14

f o r each i n c o n j u n t o e n t r e n a m i e n t o , do Propagar l a e n t r a d a por l a r e d : 1 . I n g r e s a r x a l a r e d y c a l c u l a r su s a l i d a o u , para cada unidad u en l a capa de s a l i d a . Propagar l o s e r r o r e s h a c i a a t r ´a s en l a r e d : 2 . Para cada unidad de s a l i d a k , c a l c u l a r su e r r o r S k = o k ∗ (1 − o k ) ∗( t k − o k ) 3 . Para cada unidad o c u l t a h , c a l c u l a r su e r r o r S h = o h ∗ ( 1 − o h ) ∗sum ( w kh∗ S k ) f o r a l l k i n o u t p u t s 4 . A c t u a l i z a r cada p e s o de l a r e d w j i w ji = w ji + n ∗ S j ∗ x ji repeat until ( criterio parada () )

Figura 2.14: Pseudoc´odigo del algoritmo Backpropagation [Mit97]. ser generalizado para redes con un mayor n´ umero de capas, sin embargo, se ha demostrado que para las funciones de inter´es es suficiente con una capa oculta [Cyb89, Mit97].

2.3.3.

Detecci´ on de Datos An´ omalos

La detecci´on de datos an´omalos consiste en, dado un conjunto de datos, detectar si existe alg´ un subconjunto de ellos que no se adapte bien al modelo inducido por la muestra. Los datos an´omalos pueden estar presentes en un conjunto de datos por errores en la captura de ´estos o porque la naturaleza del problema determina que estos existan. Dado que el n´ umero de datos an´omalos es bajo por definici´on, los algoritmos cl´asicos de aprendizaje supervisado tienden a no ser capaces de generar un modelo capaz de detectar futuros datos an´omalos y pasan a memorizar las instancias ya observadas [Dok]. Por otro lado, el problema de clustering es una t´ecnica de aprendizaje no supervisado, en la que se busca descubrir una agrupaci´on de datos mediante la detecci´on de patrones presentes en ellos. En este trabajo se utilizar´a la t´ecnica de detecci´on de datos an´omalos presentada en [CA]

24

basada en clustering. La idea fundamental consiste en agrupar los datos en conjuntos seg´ un su proximidad,definida por una m´etrica de inter´es. Una vez agrupados, aquellos conjuntos muy peque˜ nos vienen dados por datos que no comparten patrones de inter´es, bajo la m´etrica dada, con el resto de las instancias del conjunto, por lo que pueden ser considerados an´omalos. 1 2 3 4 5 6 7 8 9 10

for d in conjunto datos : i f S = 0: S := S U {{d}} // c r e a r un c l u s t e r con d else : C := min arg ( {C0 i n S , d i s t ( C0 , d ) } ) // c l u s t e r m´a s c e r c a n o a d i f d i s t (C, d )

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.