Interciencia
versión impresa ISSN 0378-1844
INCI v.34 n.9 Caracas sep. 2009
Clasificación orientada a objetos en fotografías aéreas digitales para la discriminación de usos del suelo
Alberto J. Perea, José E. Meroño y María J. Aguilera
Alberto Jesús Perea Moreno. Ingeniero Agrónomo y estudiante de doctorado, Universidad de Córdoba (UCO), España. Profesor, UCO, España. Dirección: Edificio Einstein, UCO, campus de Rabanales, 14071, Córdoba, España. e-mail: g12pemoa@uco.es
José Emilio Meroño De Larriva. Doctor Ingeniero Agrónomo, UCO, España. Profesor UCO, España.
Maria Jesús Aguilera Ureña. Doctora Ingeniera Agrónoma, UCO, España. Profesora, Departamento Física Aplicada, UCO, España.
RESUMEN
Las técnicas de clasificación tradicionales, basadas en rasgos de la imagen a nivel de píxel, presentan ciertas limitaciones, como lo son la aparición de un característico efecto "sal y pimienta" o su reducida capacidad para extraer objetos de interés. Éstas resultan especialmente problemáticas al aplicarse en imágenes de moderada o alta resolución. Una alternativa a dichos sistemas de clasificación pasa por un proceso previo de segmentación de la imagen. De esta forma se permite el trabajo con la imagen a nivel de objeto, lo cual amplía notablemente la cantidad de información que se puede extraer de la misma. En el presente estudio, el objetivo principal es obtener una clasificación digital de la interfase urbano forestal que pueda ser usada por los servicios contra incendios forestales. Para ello, se ha segmentado y clasificado una imagen aérea digital del sensor DMC, empleando el software eCognition, donde la formación de objetos tiene lugar de forma que la homogeneidad interna se mantiene constante. Los objetos resultantes sirven de base para la posterior clasificación. Se utilizaron fotografías aéreas digitales y datos de 350 parcelas en la provincia de Granada, España, para validar las clasificaciones, consiguiendo una precisión total del 90% y un excelente estadístico Kappa (85%) para la clasificación orientada a objetos.
Object-based classification in aereal digital photography for land-use discrimination
SUMMARY
Traditional classification techniques, basically pixel-based approaches, are limited. Typically, they produce a characteristic "salt and pepper" effect, and are unable to extract objects of interest. These techniques have considerable difficulties in dealing with the rich information content of medium and high-resolution images. One alternative to these classification systems can be a previous segmentation of the image to be classified. In this way, object-based classification can be performed so that a significant increase on the information that can be extracted is obtained. In the present work, the aim is to obtain a digital classification of wilderness-urban interface areas that can be used by fire management services. To this end, a digital aerial image provided by the DMC sensor was segmented and classified using eCognition software, which allows homogeneous image object extraction. The meaningful image objects obtained were then used for the classification. Segmentation before classification worked out as an efficient image analysis technique, overcoming traditional approaches limitations. Digital aerial photographs and data of 350 plots in Granada, Spain, were used to validate the classifications obtained; the overall classification accuracy of 90% and an excellent Kappa statistic (85%) for the object-based classification, proved the validity of this method.
Clasificação orientada a objetos em fotografias aéreas digitais para a discriminação de usos do solo
RESUMO
As técnicas de clasificação tradicionais, baseadas em traços da imagen a nível de pixel, apresentam certas limitações, como são a aparição de um característico efeito "sal e pimenta" ou sua reduzida capacidade para extrair objetos de interesse. Estas resultam especialmente problemáticas ao serem aplicadas em imagens de moderada ou alta resolução. Uma alternativa a ditos sistemas de clasificação passa por um processo prévio de segmentação da imagem. Desta forma se permite o trabalho com a imagem a nível de objeto, o qual amplia notavelmente a quantidade de informação que pode ser extraida da mesma. No presente estudo, o objetivo principal é o de obter uma classificação digital da interfase urbano- florestal que possa ser usada pelos serviços contra incêndios florestais. Para isto, tem sido segmentada e classificada uma imagem aérea digital do sensor DMC, empregando o software eCognition, onde a formação de objetos tem lugar de forma que a homogeneidade interna se mantêm constante. Os objetos resultantes servem de base para posterior classificação. Utilizaram-se fotografias aéreas digitais e dados de 350 lotes na província de Granada, Espanha, para validar as classificações, conseguindo uma precisão total de 90% e uma excelente estatística Kappa (85%) para a classificação orientada a objetos.
PALABRAS CLAVE / Clasificación Orientada a Objetos / Cobertura de Tierra / Fotografía Aérea Digital /
Recibido: 29/03/2009. Modificado: 24/08/2009. Aceptado: 25/08/2009.
En la década de los 70 surgió un nuevo concepto, el de análisis de imágenes orientado a objetos, puesto en práctica con el desarrollo de software especializado diez años después (Flanders et al., 2003). Este tipo de clasificación se basa en la identificación de objetos, definidos como, grupos de píxeles contiguos que poseen un comportamiento similar, de manera que la variabilidad entre los píxeles que lo componen es inferior a la variabilidad entre el objeto y su entorno. Este concepto impulsó el desarrollo de algoritmos y softwares con diferentes grados de complejidad (Flanders et al., 2003). Más allá del método de clasificación orientado a objetos (como metodología analítica) el concepto elemental de "objeto", ha sido utilizado de diversas formas (Thunnissen y Wit, 2000; Dean, 2003; Flanders et al., 2003; Turker y Arikan, 2005). Existen trabajos que demuestran el éxito de este método con respecto a la clasificación puramente espectral (Niemeyer y Canty, 2001; Darwish et al., 2003; Mitri y Gitas, 2002)
La clasificación convencional de imágenes de satélite se basa en la asignación de los píxeles individuales a determinadas clases temáticas. Este sistema, además de su ineficiente capacidad de análisis del contexto, presenta un tipo de problema asociado a la resolución espacial de las imágenes. Los píxeles de borde o mixtos, representan mezclas de dos o más tipos de coberturas. Esto es motivo de las principales causas de error de asignación y, por consecuencia, de la pérdida de exactitud en la cartografía temática generada. Una solución práctica a este problema es aportada por Dean (2003), quien brinda una aproximación operativa utilizando el concepto de objeto para la detección de cultivos dentro de las parcelas, aprovechando las características intrínsecas de los mismos: cubiertas vegetales, coetáneas y homogéneas que se desarrollan en espacios regulares de formas geométricas definidas (parcelas), las que son relativamente estables en el tiempo (años). Esta metodología se basa en la clasificación de las imágenes utilizando información estadística descriptiva (media y varianza) de los píxeles de la zona núcleo de las parcelas, esto es, la zona central libre de píxeles de borde o mixtos. Esta rutina de clasificación, utilizada de manera experimental en otras regiones del mundo, integra información de sensores remotos con cartografía digital (Dean, 2003).
Por otro lado, las mejoras en los procesos de la fotogrametría digital han permitido generar mediante fotografía aérea productos corregidos geométricamente, compatibles con la cartografía convencional detallada y que son capaces de llegar a resoluciones o posibilidad de análisis de elementos territoriales que superan a los que hasta hace poco solo brindaban los satélites de reconocimiento de recursos naturales. La producción de ortofotos digitales es un complemento ideal de los procesos de evaluación medioambiental y planificación territorial que hasta ahora se venían realizando con imágenes de satélite (Moreira, 2005).
Materiales y Métodos
La zona de estudio objeto de este trabajo está situada en la provincia de Granada, España, abarcando parte de los municipios Güevéjar, Nívar y Cogollos de la Vega (Figura 1), y se encuentra entre los 37º15'9'' y 37º16'57''N y los 3º33'43'' y 3º35'52''O. Se trata de una superficie rectangular de 3,84×6,91km y abarca una superficie de ~2654ha.
La complejidad del relieve de la zona deriva de su historia geológica, en la que se formara un sustrato en el que se encuentran distintas unidades y formaciones. Dominan, sobre todo en la parte central y meridional, los materiales alpujárrides, que alternan con maláguides y afloramientos tectónicos de origen subbético. Abundan, en consecuencia, las rocas carbonatadas, sobre todo las dolomías. Los materiales calizos son materia prima para los fenómenos kársticos, provocando un modelado particular del terreno y abundantes oquedades.
El clima mediterráneo es propio de la región, con su característica alternancia estacional de periodos fríos y húmedos con otros cálidos y secos, siempre sobre pautas anuales e interanuales muy irregulares; aunque aquí se manifiesta condicionado por el relieve y la variabilidad altitudinal.
En la zona de estudio conviven numerosas formaciones vegetales, como pinares, olivares y matorrales como el enebro. La mayoría consideradas como hábitats de interés comunitario.
En este trabajo se ha empleado un fotograma proporcionado por el sensor digital aerotransportado DMC de Zeiss/Intergraph. Esta elección se debe, básicamente, a la elevada resolución espacial de este tipo de imágenes, imprescindible para trabajar con escalas de trabajo grandes.
El sensor de la cámara DMC Z/I es del tipo CCD matricial, que proporciona precisiones y resoluciones en el rango del centímetro gracias al sistema digital de compensación del movimiento del avión que incorpora la cámara. La geometría de la cámara es cónica, a diferencia de otras cámaras que tienen geometría de barrido, muy adecuada para la realización de ortofotos, pero que complican mucho los procesos de restitución fotogramétrica. La parte electro-óptica dispone de ocho cabezales, cuatro para imágenes pancromáticas de alta resolución con focal de 120mm y cuatro para imágenes multiespectrales.
Su resolución radiométrica es de 12 bits por píxel, y en cuanto a su resolución espectral el sensor DMC recoge información en modo multi-espectral. Para este estudio se seleccionó una imagen del 15/05/2007. El producto adquirido es una imagen multiespectral formada por cuatro bandas: azul (450-520nm), verde (520-600nm), rojo (630-690nm) e infrarrojo cercano (790-900nm), con 50cm de resolución espacial. El procesado estándar incluía correcciones del sensor y la ortorrectificación de la imagen. Este fotograma presenta unas dimensiones de 7680´13824 píxeles.
Se ha contado para la elaboración de este trabajo con la información procedente de diversas visitas de campo realizadas para definir los usos a clasificar. Estos usos del suelo son: suelo descubierto; coníferas: pino (Pinus pinaster L.), olivar (Olea europaea L.); monte/matorral: enebro (Juniperus communis L.); superficie edificada (urbana, asentamientos humanos).
El proceso se inicia con el cálculo del índice NDVI. Posteriormente, se obtiene una imagen formada por 5 bandas: azul, verde, rojo, infrarrojo cercano e índice NDVI, y se procede a realizar la clasificación orientada a objetos. Por último, se validan los resultados obtenidos de dicha clasificación.
Obtención del índice NDVI
La vegetación tiene un comportamiento espectral muy característico. Presenta una gran absorción para las longitudes de onda correspondientes al rojo y en cambio posee una alta reflectividad en el infrarrojo cercano.
Se ha llevado a cabo la obtención del índice NDVI (normalized difference vegetation index) con el objetivo de resaltar el diferente comportamiento espectral de cada una de las cubiertas. Este índice se basa en la diferencia existente entre la máxima absorción en el rojo (690nm), debida a los pigmentos de clorofila, y la máxima reflexión existente en el infrarrojo cercano (800nm), debida a la estructura celular de la hoja (Haboudane et al., 2004). Usando bandas estrechas hiperespectrales, este índice es cuantificado según la ecuación
siendo RNIR y RRED la reflectancia en la banda del infrarrojo cercano (R800nm) y en la del rojo (R690nm), respectivamente.
Clasificación orientada a objetos
La elevada resolución espacial de las fotografías aéreas digitales conlleva, en cambio, problemas en la respuesta espectral recibida, como pueden ser la aparición de zonas de sombras o la alta texturización y contraste de la imagen. En el presente caso los problemas se maximizaban al haber zonas urbanizadas, por lo que se consideró apropiado el uso de clasificadores de contexto.
Con estas premisas, se optó por emplear el software eCognition, comercializado desde el año 2000 y desarrollado por la empresa Definiens Imaging, para llevar a cabo la segmentación y clasificación de la imagen. Los resultados obtenidos hasta la fecha son, en general, más precisos que los obtenidos con otro tipo de programas, si bien es una técnica relativamente nueva, que está actualmente en desarrollo (Benz et al., 2004). En particular para este trabajo se utilizó la versión eCognition Professional 5.0 (DP, 2006).
La particularidad de este tipo de análisis es que la clasificación se realiza en base a objetos y no a píxeles. Al estar la imagen formada por píxeles, el primer paso en el análisis orientado a objetos es agrupar los píxeles adyacentes mediante técnicas de regiones crecientes, para posteriormente clasificar los objetos extraídos. Con ello el número de parámetros que se pueden valorar aumenta notablemente, permitiendo considerar criterios como el tamaño, la forma, medias de color, máximos y mínimos, proximidad a otros objetos, textura, etc. Al mismo tiempo, la segmentación reduce el número de objetos a clasificar, con lo cual el tiempo de procesado también disminuye.
El criterio de parada en el proceso de la fusión de regiones se produce gracias al parámetro denominado "escala", que puede ser definido por el usuario. Determina el máximo permitido en la heterogeneidad global de los segmentos. Cuanto más grandes son los parámetros de la escala para una base de datos, más grandes son los objetos de la imagen, y puesto que el parámetro de la escala puede modificarse, es posible obtener diferentes tipos de imágenes segmentadas. Así, los objetos generados en una segmentación más grosera heredarán la información de los objetos más pequeños generados con unos parámetros de escala más finos.
Finalmente, los mejores resultados obtenidos en el proceso de segmentación fueron considerando las características espaciales, espectrales y de forma de los grupos de píxeles que definen áreas relativamente homogéneas. Se utilizó la opción de multiresolution segmentation, que realiza la extracción automática de objetos homogéneos. La cantidad de los objetos a crear, parámetro relacionado con la resolución de las imágenes, la escala de trabajo y la heterogeneidad de los datos fue de 103.
El programa tiene en cuenta tres criterios para la segmentación: color, smoothness y compactness. Para la mayoría de los casos color es el más importante y el que tiene mayor peso en la definición de los objetos. El criterio de color tiene en cuenta el porcentaje de homogeneidad espectral. Sin embargo, la forma y su homogeneidad resultan también importantes en la extracción de los objetos. Los criterios para la segmentación de las bandas de la imagen, fueron de 0,8 para color y 0,2 para forma y dentro de forma se consideró 0,5 para smoothness y 0,5 para compactness.
Para la clasificación se empleó el algoritmo del vecino más próximo (nearest neighbour): se eligieron algunas muestras (áreas de entrenamiento) para cada una de las clases. El resto de la escena se clasifica de acuerdo con esto. Es un método muy rápido y sencillo, adecuado cuando la clasificación de un objeto requiere muchas bandas/criterios. Además se tuvieron en cuenta distintos parámetros relacionados con los objetos (área, longitud, media del color, brillo, textura).
La validación de la clasificación se ha realizado siguiendo el criterio propuesto por Chuvieco (2000). Así, se recomienda un mínimo de 50 píxeles por cada clase temática para obtener una estimación fiable del error, criterio que ha sido seguido en este trabajo. La localización de los píxeles de validación se llevó a cabo a partir de la "verdad-terreno" así como del análisis visual de la propia imagen.
Evaluación de la exactitud o validación
La evaluación de la exactitud es un término general para comparar la clasificación con información geográfica que se asume verdadera, con el fin de determinar la veracidad del proceso de clasificación. Se construyó una imagen verdad-terreno a partir de la información contenida en el mapa de cultivos y aprovechamientos de la zona de Granada. Los estadísticos empleados fueron:
Índice de fiabilidad. Este índice, ampliamente usado en clasificación de imágenes, relaciona los elementos bien clasificados con respecto al total de puntos chequeados.
El valor del índice de fiabilidad dará una idea general de la confianza que puede ofrecer la clasificación de las imágenes, si bien no aporta ningún dato sobre una de las clases.
Para obtener información de la fiabilidad de cada una de las categorías, es necesario realizar un análisis de los elementos marginales de la matriz de confusión.
Fiabilidad del usuario. Este valor expresa la ocurrencia de que el valor al que hace referencia una determinada clase de la imagen clasificada coincida con la realidad terreno. Es decir, si un usuario seleccionara en la imagen generada un determinado punto clasificado con un determinado valor, este índice nos determina la probabilidad de que realmente el punto seleccionado, tenga ese valor en la realidad.
Su cálculo para una determinada categoría, se realizará dividiendo el valor del acuerdo realidad-clasificación de esa categoría (elemento de la diagonal principal), entre la suma de todos los valores de los elementos de la matriz clasificados en la realidad con esa categoría.
Fiabilidad del productor. Considerando una categoría de la clasificación, la fiabilidad del productor determina la probabilidad de que los valores del terreno clasificados con ese valor, queden incluidos en esa categoría. Su cálculo se realizará dividiendo el valor de acuerdo a la categoría considerada (elemento de la diagonal principal de la matriz de confusión), entre la suma de todos los valores de los elementos de la matriz clasificados en la realidad con ese valor.
Índice Kappa. El análisis categórico multivariante permite analizar las múltiples relaciones entre las distintas categorías de la clasificación. Con este propósito se calcula el índice Kappa (k), que ofrece una visión del acuerdo entre la clasificación y la realidad, y el que cabría esperar simplemente por azar. Esto supone delimitar la bondad del ajuste de la clasificación, eliminando los efectos debido puramente al azar.
Si se consideran N puntos de control, el valor Kappa será calculado según la expresión
Valores próximos a 100 representan un alto acuerdo entre la realidad y la imagen, mientras que valores próximos a 0 indicarán que el acierto entre la imagen clasificada y los valores de referencia son consecuencia única del azar.
Resultados y Discusión
El resultado obtenido de la segmentación es una nueva imagen que divide la imagen original en regiones tales que los píxeles incluidos en cada una de ellas son más parecidos entre sí que a los píxeles de las regiones vecinas. En el caso de la fotografía aérea digital empleada en este trabajo, se ha obtenido una nueva imagen formada por 178012 regiones. La metodología propuesta se aplicó en el área de estudio, obteniendo la clasificación final que se muestra en la Figura 2.
La matriz de confusión obtenida en la clasificación presenta una proporción de píxeles correctamente asignados respecto al total (diagonal principal de la matriz) bastante elevado. En consecuencia, tanto la exactitud del productor como del usuario, así como el índice Kappa para estas clases son óptimos (Tabla I).
La mayor confusión se produce por asignación de píxeles a olivo mientras que en la "verdad-terreno" se comprueba que pertenecen realmente a la categoría conífera.
Por otro lado, la fiabilidad del productor es bastante alta, con un 93%, que indica que 9,3 de cada 10 píxeles pertenecientes a esta cubierta fueron discriminadas adecuadamente en la clasificación. El índice Kappa obtenido para esta categoría es de 92%, que indica que la clasificación realizada para coníferas es 92% mejor que la esperada al azar.
Como causas posibles a esta confusión del olivar, sobre todo frente a coníferas, se apunta una incorrecta delimitación de las áreas de entrenamiento por la propia heterogeneidad de especies a lo largo de la imagen.
Para el resto de categorías de la leyenda de trabajo, la fiabilidad obtenida se puede considerar buena, ya que tanto la exactitud del productor como del usuario son >65%, consiguiéndose un índice de fiabilidad para el conjunto de todas las clases del 90%. La mayor fiabilidad del productor ha sido alcanzada en el caso de las coníferas, presentando un valor del 93%, mientras que el menor valor ha sido para la superficie edificada (86%). En el caso de la fiabilidad del usuario, el valor más alto ha sido obtenido para la clase olivar (94%) mientras que el más bajo ha sido para la clase coníferas (66%). Por último, cabe destacar que el índice Kappa total es del 85%, lo cual indica que la fiabilidad obtenida es notablemente superior a la esperada al azar.
Conclusiones
Los resultados estadísticos muestran la validez de la metodología empleada, así como la gran utilidad que proporcionan las imágenes procedentes de los sensores digitales aerotransportados, ya que permiten analizar con rapidez y precisión los factores de riesgo en la interfase urbano forestal. Con la clasificación orientada a objetos se han reducido en gran medida los problemas asociados al empleo de imágenes de alta resolución y mejorado, en general, los niveles de precisión. Los mayores problemas en la clasificación se deben a la confusión entre las clases coníferas y olivar. Con este método se ha conseguido un índice de fiabilidad de ~90% y un excelente estadístico Kappa (85%). No obstante, en zonas donde las prácticas agrícolas no siguen patrones regulares el método no alcanza tan buenos resultados.
Se espera que estos resultados mejoren en el futuro, cuando se tenga la información sobre modelos que permitan obtener reflectividad a partir de los niveles digitales registrados en la fotografía aérea digital.
Por otro lado, la metodología propuesta automatiza fases de la actualización de bases de datos reduciendo el grado de intervención humana, puesto que se reduce el número de parcelas que deben ser revisadas. Esto no implica una pérdida de la calidad de la actualización, ya que la revisión se limitaría a aquellos casos correspondientes a cambios o de difícil clasificación.
REFERENCIAS
1. Benz U, Hofmann P, Willhauck G, Lingenfelder I, Heynen M (2004) Multi-resolution, object-oriented fuzzy analysis of remote sensing data for GIS-ready information. Photogram. Eng. Rem. Sens. 58: 239-258. [ Links ]
2. Chuvieco E (2000) Fundamentos de Teledetección Espacial. 3ª ed. Rialp. Madrid, España. 558 pp. [ Links ]
3. Darwish A, Leukert K, Reinhardt W (2003) Image Segmentation for the Purpose Of Object-Based Classification. Geoscience and Remote Sensing Symposium. IGARSS 2003. Proceedings 2003 IEE International 3. 2039-2041pp. [ Links ]
4. Dean AM (2003) An evaluation of per-parcel land cover mapping using maximum likelihood class probabilities. Int. J. Rem. Sens. 24: 2905-2920. [ Links ]
5. DP (2006) Definiens Professional 5.0. User Guide. Definiens AG. München. 249 pp. [ Links ]
6. Flanders D, Hall-Beyer M, Pereverzoff J (2003) Preliminary evaluation of eCognition object-based software for cut block delineation and feature extraction. Can. J. Rem. Sens. 9: 441-452. [ Links ]
7. Haboudane D, Miller JR, Pattei E, Zarco-Tejada PJ, Strachan I (2004) Hyperspectral vegetation indices and novel algorithms for predicting green LAI of crop canopies: modeling and validation in the context of precision agriculture. Rem. Sens. Env. 90: 337-352. [ Links ]
8. Mitri GH, Gitas IZ (2002) The development of an object-oriented classification model for operational burned area mapping on the Mediterranean island of Thasos using LANDSAT TM images. Forest Fire Research & Wildland Fire Safety. Millpress. Rotterdam, Holanda. [ Links ]
9. Moreira JM (2005) Ortofotos digitales de Andalucía, un valor ambiental en alza. Revista Medio Ambiente 49: 35-37. [ Links ]
10. Niemeyer I, Canty MJ (2001) Knowledge-Based Interpretation of Satellite Data by Object-Based and multi-scale image analysis in the context of nuclear verification. In Geoscience and Remote Sensing Symposium. IGARSS 01. IEE 2001 International 7: 2982-2984. [ Links ]
11. Thunnissen H, Wit A (2000) The National Land Cover Database of the Netherlands. ISPRS J. Photogram. Rem. Sens. 33: 223-230. [ Links ]
12. Turker M, Arikan M (2005) Sequiential Masking Classification of Multi-temporal Landsat7 ETM+ images for field-based crop mapping in Karacabey, Turkey. Int. J. Rem. Sens. 26: 3813-3830. [ Links ]