8
SEGMENTACIÓN NO PARAMÉTRICA ADAPTABLE DE IMAGENES CEREBRALES POR RESONANCIA MAGNÉTICA Guadalupe Desirée – López Palafox 1 y Juan Ramón – Jiménez Alaniz 1 1 Departamento de Ingeniería Eléctrica, Laboratorio de Neuroimagenología, Universidad Autónoma Metropolitana, México Resumen – La deliberación de regiones en un espacio de características multimodal tal como las imágenes por RM de cerebro requieren con frecuencia técnicas de estimación por kernel con anchos de banda que se adapten localmente. La selección del ancho de banda es un aspecto crítico en la etapa de filtrado de la segmentación de imágenes. Este trabajo presenta dos métodos para determinar el ancho de banda adaptable en la aplicación del Corrimiento de Media, como técnica de estimación en la agrupación de regiones del espacio de características de la imagen. Los métodos se aplicaron a datos sintéticos donde uno de los métodos mostró un mejor desempeño. Palabras claves Ancho de Banda, Corrimiento de Media, Filtro Adaptable, Resonancia Magnética, Segmentación Estadística. I. INTRODUCCIÓN La representación visual de la información a través del análisis del espacio de características ha recibido un renovado interés en años recientes, motivado por el contenido de las imágenes médicas. El aumento de las herramientas computacionales, hoy en día permite el manejo de los espacios de características de alta dimensionalidad que contienen millones de datos [1]. La segmentación automática de imágenes por Resonancia Magnética (RM) clasifica los voxeles de las imágenes cerebrales en tres principales tejidos: Materia Gris (MG), Materia Blanca (MB) y Líquido Cefalorraquídeo (LCR). Un análisis volumétrico de diferentes partes del cerebro es útil en la evaluación del progreso de varias enfermedades, como la enfermedad de Alzheimer, epilepsia, esclerosis múltiple y la esquizofrenia [2], [3]. Los enfoques tanto supervisados, como los no supervisados se han utilizado para está tarea. En el enfoque supervisado [4], los valores de intensidad de las muestras de tejido de voxeles etiquetados se deben proporcionar en la fase de aprendizaje. En una fase subsecuente de clasificación, los voxeles sin etiquetar se clasifican, mediante la selección de un clasificador. Este método requiere interacción humana para seleccionar las muestras y por lo tanto se considera un enfoque semiautomático. En enfoques no supervisados las propuestas a menudo se basan en aproximaciones Gaussianas de la distribución de intensidad de los voxeles para cada tipo de tejido [4]. La técnica de segmentación estadística usualmente define un modelo paramétrico para representar al tejido, asumiendo una forma de distribución particular en el espacio de características seleccionado. Este supuesto puede introducir artefactos implícitos en la elección del modelo de densidad. Por otro lado, los métodos no paramétricos no incorporan estas suposiciones [5]. Una técnica de agrupamiento que no requiere conocimiento a priori del número de grupos y no restringe la forma de la distribución de densidad es el método de corrimiento de media; es un método iterativo que estima las modas de una distribución multivariada en el espacio de características, estas modas son consideradas como los centros de las regiones más densas en el espacio. Sin embargo una de las limitaciones del corrimiento de media es la

SEGMENTACIÓN NO PARAMÉTRICA ADAPTABLE DE …itzamna.izt.uam.mx/mexcas2011/D_Lopez_Palafox_etal.pdf · Los estimadores de punto muestral son en si mismos ... en la literatura estadística

  • Upload
    dodung

  • View
    221

  • Download
    2

Embed Size (px)

Citation preview

SEGMENTACIÓN NO PARAMÉTRICA ADAPTABLE DE IMAGENES CEREBRALES POR RESONANCIA MAGNÉTICA

Guadalupe Desirée – López Palafox1 y Juan Ramón – Jiménez Alaniz1

1 Departamento de Ingeniería Eléctrica, Laboratorio de Neuroimagenología, Universidad Autónoma Metropolitana,

México

Resumen – La deliberación de regiones en un espacio de características multimodal tal como las imágenes por RM de cerebro requieren con frecuencia técnicas de estimación por kernel con anchos de banda que se adapten localmente. La selección del ancho de banda es un aspecto crítico en la etapa de filtrado de la segmentación de imágenes. Este trabajo presenta dos métodos para determinar el ancho de banda adaptable en la aplicación del Corrimiento de Media, como técnica de estimación en la agrupación de regiones del espacio de características de la imagen. Los métodos se aplicaron a datos sintéticos donde uno de los métodos mostró un mejor desempeño.Palabras claves – Ancho de Banda, Corrimiento de Media, Filtro Adaptable, Resonancia Magnética, Segmentación Estadística.

I. INTRODUCCIÓN

La representación visual de la información a través del análisis del espacio de características ha recibido un renovado interés en años recientes, motivado por el contenido de las imágenes médicas. El aumento de las herramientas computacionales, hoy en día permite el manejo de los espacios de características de alta dimensionalidad que contienen millones de datos [1]. La segmentación automática de imágenes por Resonancia Magnética (RM) clasifica los voxeles de las imágenes cerebrales en tres principales tejidos: Materia Gris (MG), Materia Blanca (MB) y Líquido Cefalorraquídeo (LCR). Un análisis volumétrico de diferentes partes del cerebro es útil en la evaluación del progreso de varias enfermedades, como la enfermedad de Alzheimer, epilepsia, esclerosis múltiple y la esquizofrenia [2], [3]. Los enfoques tanto supervisados, como los no supervisados se han utilizado para está tarea. En el enfoque supervisado [4], los valores de intensidad de las muestras de tejido de voxeles etiquetados se deben proporcionar en la fase de aprendizaje. En una fase subsecuente de clasificación, los voxeles sin etiquetar se clasifican, mediante la selección de un clasificador. Este método requiere interacción humana para seleccionar las muestras y por lo tanto se considera un enfoque semiautomático. En enfoques no supervisados las propuestas a menudo se basan en aproximaciones Gaussianas de la distribución de intensidad de los voxeles para cada tipo de tejido [4].

La técnica de segmentación estadística usualmente define un modelo paramétrico para representar al tejido, asumiendo una forma de distribución particular en el espacio de características seleccionado. Este supuesto puede introducir artefactos implícitos en la elección del modelo de densidad. Por otro lado, los métodos no paramétricos no incorporan estas suposiciones [5]. Una técnica de agrupamiento que no requiere conocimiento a priori del número de grupos y no restringe la forma de la distribución de densidad es el método de corrimiento de media; es un método iterativo que estima las modas de una distribución multivariada en el espacio de características, estas modas son consideradas como los centros de las regiones más densas en el espacio. Sin embargo una de las limitaciones del corrimiento de media es la

especificación de un parámetro denominado ancho de banda o ancho del kernel. Si bien los resultados obtenidos en [1] parecen satisfactorios, cuando las características locales del espacio difieren significativamente a través de los datos, es difícil encontrar un ancho de banda global óptimo para este procedimiento. Por lo que en este artículo se propone la utilización de un ancho de banda variable, en el procedimiento de corrimiento de media (CM), obtenido de dos maneras distintas, para mejorar los resultados en la etapa de filtrado del proceso de segmentación. El filtrado con ancho de banda adaptable se aplicó a datos sintéticos cerebrales. Los resultados muestran que la segmentación de las imágenes es ligeramente mejor cuando se calcula el ancho de banda con la regla del vecino más cercano.

II. CORRIMIENTO DE MEDIA CON ANCHO DE BANDA FIJOEl estimador de densidad con kernel multivariado K y ancho de banda h se define como [6]:

f ( x)= 1nhd

∑i=1

n

K ( x−xih ) (1)

La función de kernel K ( x) esta definida para vectores d-dimensionales X i ,i=1,. .. , n que son el conjunto de datos multivariados cuya densidad f se desconoce y debe ser estimada. El kernel se toma con radio simétrico, como una función no negativa, centrada en cero e integrable a uno, como por ejemplo, el kernel de Epanechnikov que es un kernel óptimo para minimizar el error en la estimación de la función de densidad:

K ( x)={12cd

−1(d+2)(1−xT ) si xT x<1

0 en otro caso } (2)

donde cd es el volumen de una esfera d-dimensional.Sustituyendo (2) en (1) y después de algunas manipulaciones algebraicas, se obtiene lo que se conoce como corrimiento de media:

Mh(x )=1nx

∑X i∈S h(x)

X i−x (3)

donde el tamaño de la región Sh( x) está en función del ancho de banda h y nx es el número de observaciones X i que caen dentro de S h( x) . Si el gradiente en x o pendiente es cero, correspondiendo a una densidad uniforme sobre la región Sh( x) , el promedio del corrimiento de media será cero debido a la simetría de las observaciones cercanas a x . Sin embargo, con un gradiente de densidad diferente de cero apuntando en la dirección de más rápido incremento de la función de densidad, en el promedio mas observaciones deben de caer a lo largo de su dirección que en cualquier otra dentro de S h( x) . El vector por corrimiento de media se puede mejorar, ponderando cada pixel dentro de una región por una función de confianza de borde, tal que los pixeles que estén situados cerca de un borde influyan menos en la determinación del nuevo centro del agrupamiento. La ecuación (3) modificada por la inclusión de la ponderación de la confianza de borde se establece como:

Mh( x)=1

∑ (1−ϕi)∑

X i∈Sh (x )(1−ϕi) X i− x (4)

donde ϕi es la confianza del borde asociado a X i . La terminología de ancho de banda fijo se debe al hecho de que h se mantiene constante a través de x∈Rd . El uso del ancho de banda, también conocido como parámetro de suavizado h en (1), implica que la versión del kernel colocado en cada punto de los datos x se escala de igual manera en todas las direcciones. Como resultado, el procedimiento con ancho de banda fijo estima la densidad tomando el promedio de los kernels idénticamente escalados.

La manera mas usada para medir la exactitud de f como un estimador de f es a través del error cuadrático MISE (por sus siglas en inglés). El MISE permite observar que uno de los problemas fundamentales de la estimación de densidad son el sesgo y la varianza. Como el sesgo es proporcional a h4 , para que esta cantidad disminuya es necesario que el valor de h sea pequeño. Sin embargo, el que h sea pequeño significa un incremento en la varianza, ya que esta última es proporcional a (nh)−1 . Esto se conoce como el compromiso entre el sesgo y la varianza, y es una cuantificación matemática del papel crítico que desempeña el ancho de banda en la estimación de la función de densidad [7].

III. ESTIMACION DE ANCHO DE BANDA VARIABLE POR METODO DE PUNTO MUESTRAL

La selección de un ancho de banda de datos multivariados es un problema complejo, en gran medida sin respuesta por las técnicas actuales. Uno de lo métodos más utilizado para la adaptación del ancho de banda local, considera el ancho de banda proporcional a la inversa de la raíz cuadrada de la primera aproximación de la densidad local [5]. El ancho de banda h puede variar dependiendo de cada dato, i.e; h=h (X i) . Para cada punto X i , se puede obtener el estimador de densidad de punto muestral.

f sp(x )=1n∑i=1

n 1h (X i)

d K ( x− xih (X i)) (5)

Cada estimación f en x es el promedio de los kerneles escalados diferentemente, centrados en cada punto. Los estimadores de punto muestral son en si mismos densidades, siendo no negativos e integrable a uno. Su característica más atractiva es que la selección de h (X i) toma como recíproco la raíz cuadrada de f (X i)

h (X i)=h0[ λf (X i) ]

12 (6)

que reduce considerablemente el sesgo. En esta ecuación h0 representa un ancho de banda fijo y λ es una constante de proporcionalidad. Ya que f (X i) es desconocida tiene que estimarse a partir de los datos como primer paso. La estimación inicial f (llamada piloto) se utiliza para tener una idea burda de la densidad f ; esta estimación obtiene un patrón de anchos de banda que corresponden a los datos. La estrategia general es la siguiente:

a. Encontrar una estimación piloto f (X i) que satisfaga que f (X i)>0 para todas las

i .b. Definir el factor del ancho de banda λ como:

logλ=n−1∑ log f ( x) (7)

En el primer paso, para la construcción del estimador piloto se puede emplear el procedimiento de corrimiento de media con ancho de banda fijo. No se requiere que el estimador piloto tenga alguna propiedad en particular de suavizado.

IV. ESTIMACIÓN DE ANCHO DE BANDA A PARTIR DE VECINOS MAS CERCANOS

Hay numerosos métodos descritos en la literatura estadística que definen a los anchos de banda que utilizan la estimación de densidad piloto. La manera más simple para obtener esta estimación piloto es por medio de los vecinos más cercanos [1]. La regla de vecinos más cercanos confía en la métrica o función de distancia entre patrones. Una métrica, es una función que proporciona una distancia escalar generalizada entre dos patrones. La métrica de Minkowski es una clase general para la métrica de patrones d-dimensionales, donde el número de k vecinos se debe de elegir los suficientemente grande para asegurar que hay un aumento en la densidad donde todos los kernels tienen anchos de banda hi . Sea hi ,k el k-vecino más cercano del punto xi , por lo que se toma:

hi=∥X i−X i ,k∥1 (8)

donde se usa la norma L1 [1]. La elección de la norma no tiene mayor efecto en el desempeño del ancho de banda.

Una vez terminada la etapa de filtrado utilizando los diferentes anchos de banda, se realiza una etapa de etiquetado, la cual consiste en etiquetar cada una de las modas encontradas por el procedimiento de filtrado de CM. La siguiente etapa es la fusión de regiones, en la cual se unen las regiones con cierta similitud con el objetivo de disminuir la sobresegmentación. La etapa de podado se utiliza para eliminar aquellas regiones muy pequeñas que por si solas no pueden representar un estructura cerebral. La última etapa es la clasificación de las regiones obtenidas después de la etapa de podado, se utiliza información a priori contenida en mapas probabilísticos de Materia Blanca, Materia Gris y Líquido Cefalorraquídeo [10] para realizar la segmentación de la imagen en estás tres regiones de interés.

La metodología de segmentación aplicada se puede resumir de la siguiente manera:I. Cálculo del mapa de confianza de bordes a partir de los datos a segmentar.II. Filtrado de los datos por el procedimiento de CM usando ancho de banda adaptable.III. Fusión de regiones a través de un análisis de adyacencias y podado de regiones.IV. Normalización espacial entre los datos a segmentar y los mapas probabilísticos de

información a priori.V. Clasificación de regiones calculando su probabilidad a posteriori en cada mapa

probabilístico.

V. RESULTADOS

El desempeño del proceso de segmentación por corrimiento de media se evaluó con imágenes sintéticas. Estas imágenes fueron tomadas de la base de datos BrainWeb: Simulated Brain Database, y consisten en imágenes ponderadas en T1 con un tamaño de 181×217×181, la resolución del voxel es de 1 mm3..Para la etapa de clasificación en la segmentación se utilizó información a priori, contenida en mapas probabilísticos disponibles en el McConnell Brain Imaging [9]. Para procesar los datos con el ancho de banda fijo se utilizó un ancho de banda espacial y de intensidad hs=6 y hr=9 respectivamente. En la Fig.1 se muestran los resultados de la etapa de filtrado con los tres diferentes métodos con que se procesaron los datos. El procesamiento con ancho de banda fijo se considera como la estimación inicial de densidad para determinar el ancho de banda variable h (X i ) , que se utiliza en el procesamiento de la información con ancho de banda adaptable y cuyo resultado se muestra en la Fig. 1 en la parte inferior derecha. Para el método de vecinos más cercanos, que es la tercer forma de procesamiento de los datos, se utilizó una k=200 , y el resultado obtenido se muestra en la esquina inferior izquierda de la Fig. 1.

Fig.1 : Imágenes de T1 filtradas por Corrimiento de Media. En la esquina superior izquierda se muestra la imagen original, en la esquina superior derecha el resultado obtenido con ancho de banda fijo con radio espacial de 6 y radio de intensidad de 9, en la esquina inferior izquierda el resultado obtenido con ancho

de banda variable utilizando el método de vecinos mas cercanos para k=200 y en la esquina inferior derecha el resultado de ancho de banda variable de punto muestral.

Fig. 2 : Imagen T1 en su forma original (Parte superior). Imágenes de T1 segmentadas con ambos métodos de la rebanada 70. De lado izquierdo se utilizo el método de Vecinos mas Cercanos y de lado Derecho se utilizó Ancho de

Banda Variable

En la Fig.2 se muestra la segmentación de las imágenes filtradas, clasificando cada una de sus regiones utilizando la información a priori de los mapas probabilísticos. En las imágenes clasificadas, se puede observar con mayor facilidad las regiones homogéneas en intensidad, que en la imagen original. Lo anterior debido a que el corrimiento de media eliminó el ruido en la imagen, dando como resultado regiones homogéneas en intensidad, y posteriormente, la clasificación probabilística refino la segmentación. Las imágenes segmentadas, utilizando los dos tipos de ancho de banda variable en la etapa de filtrado, son muy similares cuantitativamente, como lo muestran los índices de Tanimoto de la Tabla 1, aunque como se puede observar en dicha tabla, la segmentación utilizando la estimación del ancho de banda a partir de vecinos más cercanos tiene una pequeña mejoría en los índices de materia blanca y gris, comparados con el método de estimación por ancho de banda variable. Esta ligera mejoría se sigue conservando al procesar más rebanadas, como se observa en la Tabla 2, que muestra la similitud promedio de un conjunto de 10 rebanadas con respecto a las imágenes de referencia. La segmentación obtenida con ambos métodos de ancho de banda adaptable, requiere un tiempo de procesamiento de 1054.43 segundos para el método de vecinos más cercanos, y de 718.11 segundos para 10 rebanadas del mismo volumen para el método de ancho de banda variable de punto muestral.

Tabla 1 . Índice de Tanimoto para la rebanada 70 de un volumen de imágenes.

Método Otro CSF Materia Gris Materia BlancaVecinos mas Cercanos

0.9971 0.788 0.8596 0.9417

Ancho de Banda Variable

0.9971 0.759 0.834 0.9352

Tabla 2. Índice de Tanimoto en el promedio de la rebanada 60 a 70 de un volumen de imágenes.

Método Otro CSF Materia Gris Materia BlancaVecinos mas Cercanos

0.9781 0.4903 0.7673 0.8619

Ancho de Banda Variable

0.9966 0.3874 0.6746 0.8507

VI. CONCLUSIONES

Los resultados del filtrado de la imagen cuando se usa una técnica de estimación estadística, están influenciados principalmente por el ancho de banda del kernel, debido a que la calidad del filtrado depende fuertemente del ancho de banda empleado. La selección del ancho de banda fijo en la estimación de la función piloto no es relevante [9]. En la etapa de clasificación se puede observar que ambos métodos tienen buenos índices de clasificación y la variación que hay entre ambos es mínima, por lo que se puede seleccionar cualquiera de los dos métodos; una de las desventajas del método de vecinos mas cercanos es el tiempo de ejecución ya que al clasificar todo el volumen su tiempo de ejecución es muy superior comparado con el método punto muestral, por lo que se puede decir, que el método de ancho de banda variable puede ser más adecuado para la segmentación de las imágenes de RM, porque requiere un tiempo menor de procesamiento. Tomando en cuenta los índices de Tanimoto utilizando el método de vecinos más cercano mostró que tiene una mejor clasificación que el método de punto muestral por lo que con estos dos métodos el usuario debe de tomar la decisión si desea un menor tiempo de ejecución o una mejor calidad de clasificación teniendo un tiempo de ejecución mucho mas largo.

VII. BIBLOGRAFÍA

[1] B. Georgescu, I. Shimshoni and P.Meer, Mean Shift Based Clustering in High Dimensions: A Texture Classification Example Proceeding of the Ninth IEEE International Conference on Computer Vision, 2003, pp. 456-463.

[2] A.Mayer and H.Greenspan, An Adaptive Mean-Shift Frame Work for MRI Brain Segmentation International Sympsium Biomedical Imaging , 2006, pp. 319-322.

[3] D. L. Pham, C. Y. Xu, and J. L. Prince,A survey of current methods in medical image segmentation, Annu. Rev. Biomed. Eng., vol. 2, 2000, pp. 315–337.

[4] A. Mayer and H. Greenspan, An Adaptive Mean-Shift Framework for MRI Brain Segmentation, IEEE Trans. Med. Imag.vol.28,no.8, 2009, pp 1238-1250.

[5] J. Jimenez-Alaniz, M. Pohl-Alfaro, V. Medina-Banuelos, and O. Yanez-Suarez, Segmenting brain MRI using adaptive mean shift, in IEEE EMBS, 2006, pp. 3114–3117.

[6] B. W. Silverman, Density Estimation for Statistics and Data Analysis. No. 26 in Monographs on Statistics and Applied Probability, Chapman and Hall/CRC, 1986, pp.7-32

[7] Wand, M.P., Jones, M.C,Kernel Smoothing, Chapman and Hall/CRC, 1986, pp. 19-23

[8] Duda, R.O., Hart, P.E. and Stork, D.G,PatternClassification, Wiley, second edition, 2001.

[9] J. Jimenez-Alaniz, V. Medina-Banuelos, and O. Yanez-Suarez, Data Driven Brain MRI Segmentation Supported on Edge Confidence and A Priori Tissue Information, IEEE Transactions on Medical Imaging, vol. 25 no.1, 2006.

[10] Disponible en www.bic.mni.mcgill.ca/brainweb consultado en la fecha Junio 2011.