Interciencia
versión impresa ISSN 0378-1844
INCI v.30 n.5 Caracas mayo 2005
USO DE LA TEORÍA DE LÓGICA DIFUSA EN LA CLASIFICACIÓN DE IMÁGENES SATELITALES CON COBERTURAS MIXTAS: EL CASO URBANO DE MÉRIDA, VENEZUELA
Julián Gutiérrez y Hervé Jegat
Julián Gutiérrez. Geógrafo, Ingeniero Forestal, M.Sc. en Manejo de Cuencas y en Manejo de Bosques, Universidad de los Andes (ULA), Venezuela. Estudiante del Doctorado en Ciencias Aplicadas, Facultad de Ingeniería, ULA, Venezuela. Profesor, ULA. Dirección: Escuela de Ingeniería Geológica, Facultad de Ingeniería. Sector La Hechicera, Mérida 5101, Venezuela. e-mail: jgutie@ula.ve
Hervé Jegat. Ingeniero Hidráulico, Instituto Nacional Politécnico de Grenoble, Francia. Doctor en Mecánica de Fluidos, Universidad Científica de Grenoble, Francia. Profesor, Centro Interamericano de Desarrollo e Investigación Ambiental y Territorial (CIDIAT-ULA), Mérida, Venezuela. e-mail: hjegat@ula.ve
Resumen
La Teoría de la Lógica Difusa es una técnica con aplicación en diferentes campos. Describe propiedades que tienen una variación continua en sus valores, asociando partes de esos valores a una etiqueta semántica. Por ejemplo, el cambio que existe al pasar de un bosque denso a un bosque ralo no es inmediato; existe un área de transición que no puede ser clasificada ni con una etiqueta ni con la otra, y que posee características de ambos tipos de bosque. En este caso la lógica difusa sirve para asignar porcentajes de pertenencia para los diferentes tipos de bosque. Igual sucede en zonas agrícolas y en áreas urbanas. Al hacer clasificación supervisada de imágenes satelitales con el fin de generar mapas de uso y cobertura, se presenta este tipo de problema en áreas urbanas, agrícolas y en ecotonos. La clasificación supervisada se ha hecho tradicionalmente con clasificadores "duros" que solo permiten "entrenar" al sistema de modo que un determinado uso o cobertura es exclusivamente de una clase. El uso de la teoría de la Lógica Difusa ha sido propuesto para solventar el hecho que en la superficie terrestre existen zonas de transición o usos mezclados. En este trabajo se desarrollan dos tipos de clasificación supervisada en imágenes satelitales en un área urbana, en Mérida, Venezuela, y sus alrededores: i) la forma tradicional de clasificación "dura", y ii) utilizando la lógica difusa o "suave". Se obtienen dos "imágenes resultado" de aspecto diferentes, siendo la obtenida con la segunda modalidad una representación mas fidedigna de la realidad de la superficie terrestre.
Summary
The Theory of Fuzzy Logic is a technique with applications in different fields. It describes properties with a continuous variation in their values, associating parts from these values to a semantic label. For example, the change when passing from a dense forest to a disperse forest is not an immediate one, a transition area exists that cannot be classified neither with one nor the other label and shows characteristics of both forest types. In this case the Fuzzy Logic theory is useful to assign percentages of coverage for either type of forest. The same occurs in agricultural and urban areas. When making supervised classification of satellite images to generate use and cover maps, this type of problems arises in urban and agricultural areas, and in ecotones. The supervised classification has been made traditionally with "hard" classifiers, which only allow to "train" the system in such a way that a given use or cover is exclusive of others. The use of the Theory of Fuzzy Logic has been proposed to cope with the existence of transition areas or mixed uses in the terrestrial surface. In the present work two supervised classification types are developed for satellite images in an urban area, in Mérida, Venezuela and its surroundings: i) the traditional form of "hard classification", and ii) using fuzzy logic, "soft classification". Two "resulting images" different in aspect are obtained, being the one derived from the second approach a better representation of the terrestrial surface.
Resumo
A Teoria da Lógica Difusa é uma técnica com aplicação em diferentes campos. Descreve propriedades que têm uma variação contínua nos seus valores, associando partes desses valores a uma etiqueta semântica. Por exemplo, a mudança que existe ao passar de um bosque denso a um bosque ralo não é imediata; existe uma área de transição que não pode ser classificada nem com uma etiqueta nem com outra, e que possui características de ambos tipos de bosque. Neste caso a lógica difusa serve para designar porcentagens de pertenças para os diferentes tipos de bosque. Igual sucede em zonas agrícolas e em áreas urbanas. Ao fazer classificação supervisionada de imagens satelitais com o fim de gerar mapas de uso e cobertura, se apresenta este tipo de problema em áreas urbanas, agrícolas e em ecotonos. A classificação supervisionada tem se realizado tradicionalmente com classificadores «rígidos» que somente permitem «treinar» ao sistema de modo que um determinado uso ou cobertura é exclusivamente de uma classe. O uso da teoria da Lógica Difusa foi proposto para justificar o fato de que na superfície terrestre existem zonas de transição ou usos mesclados. Neste trabalho se desenvolvem dois tipos de classificação supervisionada em imagens satelitais numa área urbana, em Mérida, Venezuela, e seus arredores: i) a forma tradicional de classificação «rígida», e ii) utilizando a lógica difusa ou «suave». Obtêm-se duas «imagens resultado» de aspectos diferentes, sendo a obtida com a segunda modalidade uma representação mais fidedigna da realidade da superfície terrestre.
PALABRAS CLAVE / Clasificación Supervisada / Imágenes Satelitales / Lógica Difusa / Mérida / Venezuela /
Recibido: 04/10/2004. Modificado: 30/03/2005. Aceptado: 06/04/2005.
En el procesamiento digital de imágenes satelitales, cuando se llevan a cabo clasificaciones supervisadas de tales imágenes para generar mapas de uso y cobertura, generalmente se asume que todos los usos y coberturas presentes son "puros". Por ejemplo, las coberturas de bosque sólo son bosques, igualmente las coberturas de gramíneas solamente contienen gramíneas, los cuerpos de agua sólo contienen agua. En la realidad se encuentran usos y coberturas que no son "puros". Por ejemplo, en áreas urbanas o zonas agrícolas, es común encontrar diversos usos y coberturas mezclados; en las primeras hallamos parques (concreto, grama, árboles), carreteras (de concreto o de asfalto), casas (techos de tejas, zinc, concreto); en zonas agrícolas hay diferentes tipos de cultivo, y con diferentes estadios en su desarrollo (preparación de la tierra, crecimiento, cosecha). Estos usos y coberturas generan una respuesta espectral mixta. De tal manera, al asumir que los usos y coberturas son puros en todos los casos, se incurre en una representación del espacio geográfico no bien ajustada a la realidad, y por ende se generarían productos de calidad dudosa.
Chrisman (1991) afirma que "calidad" es un término neutro, ajustado para un estándar nacional, y que se evocan mejor sus aspectos por la palabra "error", la cual se considera una "cosa mala"; en resumen, las disciplinas de tecnología de mapeo intentan reducirlo o minimizar su importancia. Señala que reportar el error en otras disciplinas (físicas, biológicas, ciencias sociales) no es signo de debilidad, ya que provee información crucial que debe ser preservada para la correcta interpretación, mientras argumenta que el error es parte integral del procesamiento de la información espacial, y, en vista de que es algo inevitable, debe ser reconocido como una dimensión más de tal información, como posición y atributos.
Para la asignación de atributos en las imágenes de percepción remota se lleva a cabo un proceso de clasificaciones supervisadas en que se "instruye" al sistema sobre los tipos de uso y cobertura presentes en la imagen, mediante muestras de entrenamiento, a diferencia de las clasificaciones no supervisadas, que como su nombre lo indica, solamente se da al sistema una idea del número de clases que pensamos existen en la superficie cubierta y éste clasifica la imagen, sin supervisión o muestras de entrenamiento, en función de grupos de reflectancias o "clusters" estadísticamente similares.
Con la utilización de la Lógica Difusa es posible dar un paso adelante en la descripción de la realidad de la superficie terrestre. Si existen usos y coberturas mezclados o zonas de transición, mediante esta técnica podemos instruir adicionalmente al sistema con esas características complementarias, esto es, le informamos sobre los porcentajes de mezcla o transición, según sea nuestro conocimiento.
En esta investigación se evalúa el uso de la teoría de la Lógica Difusa en la clasificación de imágenes satelitales en áreas urbanas con coberturas mixtas, naturales y antrópicas, y se aplica específicamente para el área de la ciudad de Mérida y zonas adyacentes, como parte de una investigación mayor que pretende incluir productos de tales clasificaciones en modelos de decisión final "suaves" utilizando Sistemas de Información Geográfica y Lógica Difusa en las reglas de decisión.
En primer lugar se hace una clasificación "dura", esto es, se definen usos y coberturas sin mezclas y límites precisos, y posteriormente se hace una clasificación "suave", aplicando la teoría de la Lógica Difusa y generando en ambos casos mapas de usos y coberturas que son comparados y evaluados en su representación de la realidad geográfica.
Antecedentes y Fundamentos Teóricos
Al investigar sobre los sistemas de clasificación de imágenes satelitales para generar mapas temáticos, Lunetta et al (1991) afirman que algunas de las fuentes potenciales de errores inducidos por estos sistemas son la ineficiencia para categorizar clases mezcladas, zonas de transición o sistemas dinámicos; las definiciones de clases ambiguas o pobremente definidas; la subjetividad humana; y la falta de compatibilidad entre los diferentes sistemas de clasificación usados tanto con sensores remotos como con información tradicional. Además, afirman que la prioridad de investigación en la cuantificación del error debe enfatizar el desarrollo de procedimientos estandarizados más eficientes en la evaluación de la exactitud de los productos de sensores remotos, el desarrollo de normas para la recolección de información de verificación de campo y procedimientos para la conversión raster-vector y vector-raster, la evaluación de los aspectos de escala para la incorporación de información de altitud en la georeferenciación, y el desarrollo de diagramas de leyenda temáticos y geométricos confiables.
En el mismo orden de ideas, Gahegan y Ehlers (2000) exponen un análisis interesante en cuanto al modelaje de la incertidumbre (imprecisión, error, calidad de la información) en un Sistema de Información Geográfica (SIG) integrado. Estos autores se concentran en la fusión de actividades entre un SIG y Sensores Remotos (SR); plantean que a medida que la información es procesada desde su forma cruda hasta representaciones más elaboradas usadas por un SIG, pasa por diferentes y numerosos modelos conceptuales de información a través de una serie de transformaciones. Cada modelo y cada transformación contribuye con la incertidumbre total presente en la data. Primero describen varios modelos de espacios geográficos en términos de las características de incertidumbre presente inherente que aplican, lo que es luego trabajado en un formalismo sencillo. Segundo, describen los diferentes procesos de transformación que son usados para formar objetos o clases geográficas a partir de imágenes digitales, y establecen sus efectos en las características de incertidumbre de la información. Finalmente, utilizando el formalismo para describir los procesos de transformación, generan un marco conceptual para la propagación de la incertidumbre a través del SIG integrado.
Los anteriores autores explican que al procesar data geográfica, en una integración SR-SIG, se pasa por diferentes modelos de espacio geográfico, que son el modelo de Campo (C), Imagen (I), Temático (T), y Objeto (O) o característica, los cuales serán explicados mas adelante. Exponen que las fuentes de error generadas en cada etapa y la incertidumbre están restringidas a las siguientes propiedades: valor (incluyendo errores de medición y etiquetado), espacio, tiempo, consistencia y compleción. Se refieren a dos tipos distintivos de incertidumbre, la "generación de error" (introducción de error por uso incorrecto de procedimientos y data) y la "propagación del error" (acumulación de errores en los procesos; Veregin (1999), citado por Gahegan y Ehlers (2000)). Por ejemplo, al pasar del Campo (terreno, información de superficie reflejada) a la Imagen (captura de la imagen) se generan errores debido al sensor, condiciones de toma, relieve, georeferenciación, interpolación, etc. Al pasar de la Imagen al Tema (modelo Temático), esto es la clasificación de la imagen (supervisada o no), se cometen errores de etiquetado (muestras de entrenamiento) y esto puede magnificarse según el proceso (clasificación sencilla, clasificación multitemporal, clasificación utilizando información de apoyo, clasificación usando diferentes sensores). Al pasar del modelo Temático al modelo Objeto, es decir, a puntos, líneas y polígonos (mapa final), los mismos pueden propagar errores de apariencia (shape error), como zonas en las cuales los píxeles han sido erróneamente clasificados, errores posicionales, y errores de definición del objeto.
Al considerar la calidad de la información a procesar, Ariza y Pinilla (2000) exponen que las componentes tradicionales de la calidad del dato geográfico son en primer lugar la posicional y posteriormente la temática. En la actualidad se considera que el dato geográfico posee un mayor numero de componentes que presentan problemas como ambigüedad, falta de métricas y métodos de medición. El dato geográfico es toda información que nos permite conocer lo que ocurre (qué) en una determinada posición del espacio (dónde) y en un tiempo (cuándo). Estas preguntas son básicas en el día a día de la sociedad actual, por lo que la producción de datos y de productos geográficos de valor añadido es cada vez mas común; por este motivo se necesitan mayores esfuerzos para obtener los beneficios sociales que se derivan de la normalización.
En cuanto a la definición y medida de los componentes de la calidad para bases de datos geoespaciales, Veregin (1999) expone los siguientes: Exactitud, Precisión o resolución, Consistencia, Compleción, y Genealogía o Linaje. Veamos algunos. La Exactitud posicional hace referencia a la proximidad entre las coordenadas dadas y las reales. La Exactitud del atributo es similar a la anterior pero referida al valor del atributo del elemento geográfico; existe mayor diversidad debido a que los atributos pueden ser categóricos o numéricos. La Exactitud temporal se refiere a la discrepancia entre el dato codificado en la Base de Datos Geográfica y una coordenada temporal del mismo que sea de interés, siendo la actualidad del dato su exactitud temporal cuando la coordenada de interés es la fecha actual. La Consistencia lógica se refiere a la ausencia de contradicciones en la base de datos, a su validez interna. La Compleción indica la ausencia de errores de omisión en la base de datos. La presencia de todos los objetos del mundo real en nuestro modelo dependerá de la selección de temas y de reglas de generalización, la leyenda debe estar completa, sin elementos extraños. La Genealogía o Linaje es el conocimiento de los procesos, fundamentalmente referido a las fuentes, procesos de captura, métodos de análisis, sistemas de referencia, parámetros de transformación de proyección, resolución de datos, etc.
En este trabajo es de interés la Exactitud del atributo, de tipo categórico. Específicamente, interesan las clases de usos y coberturas presentes en el área de estudio abarcadas en la subimagen satelital, y en la medida de lo posible se deberían tener en cuenta los diferentes usos y coberturas al hacer las clasificaciones automatizadas supervisadas. Pero como se sabe, en la naturaleza, o en general en la superficie terrestre, no solamente encontramos clases de uso y coberturas puras, sin mezclas, sino que existen una serie de usos y coberturas que se encuentran mezclados con otros o, también, que presentan límites difusos, no exactos o precisos. Lo que se busca es evaluar un método que nos permita generar mapas más representativos de la realidad del área de estudio.
Fundamentos de la Teoría de la Lógica Difusa
Ya en el inicio de la década del 90, algunos autores (Wang et al., 1990) reconocieron que los métodos usados en la época para representar información geográfica son inadecuados, ya que no toleran la imprecisión. Ésto conlleva a la pérdida de información e inexactitud en el análisis, problema que se deriva del uso del concepto de membresía de la teoría clásica de conjuntos (classical set theory). Los autores proponen que para mejorar el procesamiento de la información en investigación y aplicaciones con SIG se requiere un concepto alternativo de "membresía" basado en la teoría de la Lógica Difusa (Fuzzy Logic); elaboran entonces un modelo relacional "fuzzy", para el manejo del recurso suelo y su disponibilidad para la agricultura, afirmando que facilita enormemente el análisis de los datos con SIG.
Cabe una breve explicación, con fines de aclaración, de la teoría de la Lógica Difusa (LD; Cox, 1994). Esta teoría provee un método para reducir así como explicar la complejidad de un sistema. Se refiere a un cálculo de compatibilidad, a diferencia de probabilidad, la cual está basada en distribución de frecuencias en una población escogida al azar. La LD tiene que ver con la descripción de las características propias de los entes. Describe propiedades que tienen una variación continua en sus valores, asociando partes de esos valores a una etiqueta semántica. Gran parte del poder de la LD viene del hecho que esas partes pueden solaparse, solapamiento que corresponde a la transición de un estado al siguiente (como los límites borrosos en los espacios naturales, ecotono). Estas transiciones provienen de la natural ambigüedad asociada que ocurre en los estados intermedios de las etiquetas semánticas.
Los Fuzzy Sets (conjuntos o clases difusas) son funciones que mapean un valor que puede ser miembro del conjunto (set) en un número entre 0 y 1 que indica su grado actual de membresía. El nivel 0 significa que el valor no está en el "Juego" y el nivel 1 significa que el valor es completamente representativo del "Conjunto". Fuzziness es una medida de cómo un valor (instancia) encaja en un concepto o ideal semántico, es decir, describe el grado de membresía en un Fuzzy Set (Eastman, 1997).
Los conjuntos fuzzy son conjuntos o clases sin límites precisos, esto es, la transición entre ser miembro y no ser miembro de una "localidad" en el conjunto es gradual (Zadeh 1965, en Eastman, 1997). Un conjunto fuzzy se caracteriza por un grado fuzzy de membresía (también llamado posibilidad) que oscila entre 0,0 y 1,0 indicando un incremento continuo desde no membresía hasta membresía completa. Por ejemplo, al evaluar si una pendiente es fuerte o no, es posible definir una función fuzzy de membresía de manera tal que una pendiente de 10% tiene una membresía de 0, y una pendiente de 25% tiene una membresía de 1,0; entre 10% y 25% la membresía fuzzy se incrementa gradualmente en la escala de 0 a 1 (Figura 1). Esto contrasta con los conjuntos precisos (crisp) clásicos que tienen límites distintivos. Sin embargo, un conjunto preciso puede ser visto como un caso especial de conjunto fuzzy donde la membresía cambia instantáneamente de 0 a 1. La teoría de lógica difusa proporciona una base matemática rica para entender problemas de decisión y para construir reglas de decisión en combinación y evaluación de criterios.
Como ejemplo de experiencias con éste método, Gopal y Woodcock (1994) plantean que el uso de conjuntos difusos (fuzzy sets) en la evaluación de la exactitud de mapas expande la cantidad de información que puede ser generada en relación a la naturaleza, frecuencia, magnitud y fuente de errores en un mapa temático. La necesidad de usar conjuntos fuzzy proviene de la observación de que no todas las locaciones de un mapa se ajustan sin ambigüedades a una simple categoría o clase; los conjuntos fuzzy permiten variar los niveles de membresía para categorías o clases múltiples. La generación de cuatro tablas resultantes del uso de funciones fuzzy, examinadas conjuntamente, proveen mas información que las tradicionales matrices de confusión. Otros autores (Edwards y Lowell, 1996; Zhang y Kirby, 1997; Muller et al., 1998; Cheng y Molenaar, 1999; Foody, 1999; Metternicht, 1999; Zhang y Kirby, 1999; Molenaar y Cheng, 2000; Woodcock y Gopal, 2000) coinciden con los anteriores en el uso de esta técnica para manipular información, generar mapas y evaluar su exactitud, derivados de la clasificación a partir de imágenes satelitales). Warner y Shank (1997) integran la lógica difusa y las redes neuronales para mejorar la evaluación de la exactitud en las clasificaciones fuzzy.
Área de Estudio
El área de estudio abarca la ciudad de Mérida, estado Mérida, Venezuela, y sus cercanías, entre las coordenadas UTM 256.000 y 267.000 O, y 945.500 y 955.600 N, zona 19. El área de interés está constituida por la ciudad de Mérida y sus alrededores, que son zonas de bosques. Desde el punto de vista político-administrativo y según la Ley de División Político Territorial del estado Mérida aprobada en 1992, pertenece al Municipio Autónomo Libertador, abarcando una porción parte del Parque Nacional Sierra Nevada al sureste y una pequeña porción del Parque Nacional Sierra de la Culata al noroeste. Los usos y coberturas existentes en el área de estudio son principalmente bosques densos, bosques ralos y uso urbano.
Materiales y Métodos
Se utilizó una subimagen satelital LANDSAT-TM, bandas 1, 2 y 3, composición en verdadero color. La imagen, año 88, fue facilitada por el Centro de Procesamiento Digital de Imágenes (CPDI) de la Fundación Instituto de Ingeniería, Caracas. El programa para el procesamiento digital de la misma es el IDRISI-32, facilitado por Hervé Jegat.
Método
El trabajo consistió en el procesamiento digital de la subimagen satelital, en verdadero color, del área de la ciudad de Mérida y zonas aledañas. Primero se utilizó el procedimiento tradicional de clasificación supervisada, utilizando un clasificador "duro", módulo llamado MAXLIKE en el programa. Este módulo clasifica una imagen sobre la base de la información contenida en una serie de archivos de signaturas (firmas espectrales), las que son creadas mediante muestras de entrenamiento (usos y coberturas sin mezclas). Tales muestras de entrenamiento son creadas digitalmente a partir de polígonos dibujados sobre la imagen y de los cuales se conoce lo que representan en la realidad. Por ejemplo, se toman muestras de entrenamiento de las zonas de bosques densos, de bosques ralos y del área urbana. Posteriormente, se hace una clasificación "suave", con firmas fuzzy, esto es, muestras de entrenamiento que contienen usos y coberturas mezcladas. Proceso que se explica mas adelante.
Los pasos seguidos para el primer método, utilizando un clasificador "duro", son:
i- Se recorta una subimagen del área de Mérida y sus alrededores, a partir de la imagen LANDSAT-TM original. Para esto se extraen las bandas 1, 2 y 3, y con éstas se hace una subimagen en verdadero color (Figura 2).
ii- Se analiza visualmente la imagen y se define qué coberturas o clases contiene, se establecen sitios de entrenamiento para cada una de las clases. En este caso se establecieron las coberturas de bosque denso, bosque ralo y uso urbano.
iii- Se procede a crear los sitios de entrenamiento mediante el digitalizador en pantalla.
iv- Se definen las clases o firmas espectrales.
v- Se procede, por último, a hacer la clasificación automatizada de la imagen de uso y cobertura, cuyo resultado se muestra en la Figura 3.
Una vez culminado el proceso descrito, se procede a hacer la clasificación supervisada con firmas fuzzy:
i- El primer paso es definir los usos y coberturas (sin mezclas y mixtos) que se conocen en el área de estudio. En este caso, en la imagen denominada MDA (Figura 2) existen los siguientes usos y coberturas:
a) Usos y coberturas presentes sin mezclas
Bosque denso: verde oscuro (Bqd)
Bosque ralo, verde claro (BqR)
Césped, verde mas claro (Ces)
Asfalto (Asf)
Tejas (Tej)
Gramíneas (Grm)
Concreto (platabandas, calles; Cnc)
b) Usos y coberturas mixtos de las zonas urbanas
Parques y pista de aterrizaje (asfalto, concreto y césped; PyP)
Zona urbana del centro (concreto, techos de tejas, gramíneas, asfalto; UrC)
Zona urbana de Hoyada Milla (bosque ralo, techos de tejas, concreto, gramíneas; UrM)
Zona de urbanizaciones (techos de tejas y gramíneas; Urb)
ii- Una vez definidos los usos y coberturas de esa manera, se les asignan los respectivos porcentajes aproximados de membresía que se considera que tiene cada clase. Los sitios sin mezcla tendrán exclusivamente la clase respectiva, pero a sitios mixtos, con mezclas no puras, como PyP, que tiene asfalto concreto y césped, se le asignan los respectivos porcentajes de cada clase que se considera componen tal cobertura. Con la anterior información se estructura la matriz de partición fuzzy (MPF; Tabla I), con los usos y coberturas, puros y mixtos, y sus respectivos porcentajes.
iii- Se construyen las muestras de entrenamiento, todas en un único archivo vector.
iv- Se construye la MPF en el SIG, con el Módulo de base de datos.
v- Se crea un conjunto de representaciones espaciales de esos grados de membresía fuzzy y una imagen para cada clase de cobertura, en la que su proporción en cada clase de entrenamiento es grabada.
vi- Se crean las firmas fuzzy (suaves). Estas firmas se utilizan para clasificar la imagen denominada Mda (Figura 4), utilizando las mismas técnicas del ejercicio previo con las firmas duras. Comparando las imágenes clasificadas resultantes, es posible apreciar las diferencias producidas usando los dos tipos de firmas.
vii- Se calculan las áreas o superficies de usos y coberturas para poder comparar cuantitativamente los resultados, los cuales se presentan en las Tablas II y III.
Resultados y Discusión
La imagen generada con las firmas "duras" (Maxlike; Figura 3), es una expresión de las condiciones que se imponen al sistema, esto es, las muestras de entrenamiento solamente "instruyen" al clasificador que existen tres tipos de usos y coberturas y, por lo tanto, éste genera una clasificación supervisada con esas clases, aunque en la realidad la clase "urbano" está compuesta por una variedad de usos y coberturas. Por otra parte, la imagen generada con las firmas fuzzy (Figura 4) es posible constatar que el sistema genera, igualmente, coberturas de bosque denso y bosque ralo, en sus mismas locaciones, pero, además, genera una clasificación del área urbana más cercana a la realidad, con su variedad característica.
Cabe aclarar que el resultado generado no llega a ser 100% representativo de la realidad, ya que como en toda imagen satelital, existen usos y coberturas que, a pesar de ser diferentes, generan reflectancias parecidas. Tanto en el producto generado por el primer método como en el segundo, existe el problema de los cursos de agua. Por ejemplo, el Río Chama, a lo largo y al suroeste de la ciudad, presenta reflectancias parecidas a las del concreto o el asfalto, de tonalidad clara, por lo que en ambos métodos el sistema lo clasifica como área urbana. A pesar de esto, que es un problema común a ambos métodos, se puede afirmar que el segundo método genera una imagen (Tema) mas representativa de la realidad de la zona, imagen que se utilizará para generar un mapa (Objeto) de uso y cobertura de la zona.
Al analizar las superficies generadas se observa que las coberturas bosque denso y bosque ralo de la clasificación "dura" suman 8896,5ha, y el área urbana es de 2270,16ha, mientras que para la clasificación "suave", bosque denso más bosque ralo suman 8563,23ha y la superficie urbana (clases puras y mixtas) es de 2603,43ha. La disminución de las superficies de bosque (denso o ralo) con respecto a la urbana en la segunda clasificación, pudiera deberse a que, las áreas urbanas incluyen sectores con vegetación (árboles, matorrales, césped), cuyas reflectancias son iguales o muy parecidas a las reflectancias de las coberturas denominadas como bosque (denso o ralo). Al tomar las muestras de entrenamiento para desarrollar las firmas espectrales fuzzy de la segunda clasificación, pudieran incluirse píxeles de valor parecido al de las muestras de entrenamiento de las firmas "duras" de bosque. Por lo tanto, se incluirían esos píxeles en el sector urbano como coberturas mixtas, y se les restaría a las categorías de bosque puro (sea denso o ralo).
Puede concluirse que el segundo procedimiento de clasificación, aplicando la teoría de la Lógica Difusa, genera resultados más detallados de la realidad del espacio geográfico analizado. Lo anterior se deriva del hecho que genera un producto, a partir de clasificaciones de imágenes satelitales, que representa la variedad de usos y coberturas en zonas con clases mixtas, lo que lo hace mas eficiente al momento de querer producir mapas de mejor calidad o más reales.
Recomendaríamos trabajar con esta técnica cuando se pretende reflejar, en los mapas finales generados, que los usos y coberturas no presentan límites precisos; esto es, que existe una transición entre las diferentes clases y casos de zonas con usos y coberturas mezclados. En el campo forestal, si el objeto de estudio es identificar diferentes tipos de especies, que a menudo suelen presentarse mezcladas con otras o en transición, y que manifiestan reflectancias espectrales características, la técnica expuesta es de utilidad.
Las escalas de trabajo dependerán del objeto de estudio y de la extensión de la zona, es decir, si la zona de estudio es muy grande, la escala de trabajo adecuada puede ser (aceptando que estos límites son relativos) pequeña desde 1:250000 hasta 1:100000, o mediana desde 1:100000 hasta 1:25000, por lo que las imágenes LANDSAT-TM pueden ser adecuadas. Si la escala está entre 1:25000 y 1:12500 (escala grande), pudieran ser adecuadas las imágenes SPOT o fotos aéreas con la escala respectiva, mientras que si la zona es pequeña y se requiere que la escala sea aún mayor, se pueden utilizar fotos aéreas con escalas mayores. La teoría de la Lógica Difusa en la clasificación de imágenes satelitales puede ser utilizada en diferentes escalas de trabajo, las que no son una limitante.
Agradecimientos
Los autores agradecen al Consejo Nacional de Investigaciones Científicas y Tecnológicas de Venezuela (CONICIT, actual FONACYT) por beca-crédito a J. A. Gutiérrez, y al Consejo de Desarrollo Científico, Humanístico y Tecnológico (CDCHT) de la Universidad de los Andes, Venezuela y a FUNDACITE Mérida, por el apoyo económico.
REFERENCIAS
1. Ariza FJ, Pinilla C (2000) Las componentes de la calidad del dato geográfico. Mapping 61: 12-30. [ Links ]
2. Cheng T, Molenaar M (1999) Objects with fuzzy spatial extent. Photogram. Eng. Rem. Sensing 65: 797-801. [ Links ]
3. Chrisman NR (1991) The error component in spatial data. Citado en Longlei P, Goodchild M, Macguire D, Rhind D (Eds.; 1999) Geographical Information Systems, Vol. 1: Principles and Technical Issues. 2ª ed. pp. 177-189. [ Links ]
4. Cox E (1994) The Fuzzy Systems Handbook. Academic Press. San Diego, CA, EEUU. 625 pp. [ Links ]
5. Eastman JR (1997) IDRISI for Windows. Advanced student manual. Ver. 2.0. Clark University. Worcester, MA, EEUU. 208 pp. [ Links ]
6. Edwards G, Lowell KE (1996) Modeling uncertainty in photointerpreted boundaries. Photogram. Eng. Rem. Sensing 62: 377-391. [ Links ]
7. Foody G (1999) The continuum of classification fuzziness in thematic mapping. Photogram. Eng. Rem. Sensing 65: 443-451. [ Links ]
8. Gahegan M, Ehlers M (2000) A framework for the modeling of uncertainty between remote sensing and geographic information systems. J. Photogram. Rem. Sensing. 55: 176-188. [ Links ]
9. Gopal S, Woodcock C (1994) Theory and Methods for accuracy assessment of thematic maps using fuzzy sets. Photogram. Eng. Rem. Sensing 60: 181-188. [ Links ]
10. Lunetta R, Congalton R, Fenstermaker L, Jensen JR, McWire K, Tinney L (1991) Remote sensing and geographic information system data integration: error sources and research issues. Photogram. Eng. Rem. Sensing 57: 677-687. [ Links ]
11. Metternicht G (1999) Change detection assessment using fuzzy sets and remotely sensed data: an application of topographic map revision. J. Photogram. Rem. Sensing. 54: 221-233. [ Links ]
12. Molenaar M, Cheng T (2000) Fuzzy spatial objects and their dynamics. J. Photogram. Rem. Sensing. 55: 164-175. [ Links ]
13. Muller SV, Walker DA, Nelson FE, Auerbach NA, Bockhelm JG, Guyer S, Sherba D (1998) Accuracy assessment of land-cover map of Kuparuk river basin, Alaska: considerations for remote sensing. Photogram. Eng. Rem. Sensing 64: 619-628. [ Links ]
14. Veregin H (1999) Data quality parameters. En Longley P, Goodchild M, Maguire D, Rhind D (Eds.) Geographical Information Systems. Vol. 1: Principles and Technical issues. pp. 177-189. [ Links ]
15. Wang F, Brent Hall G, Subaryono (1990) Fuzzy information representation and processing in conventional GIS software: database design and application. Int. J. Geogr. Sci. 4: 261-283. [ Links ]
16. Warner T, Shank M (1997) An evaluation of the potential for fuzzy classification of multispectral data using Artificial neural Networks. Photogram. Eng. Rem. Sensing 63: 1285-1294. [ Links ]
17. Woodcock C, Gopal S (2000) Fuzzy set theory and thematic maps: accuracy assessment and area estimation. Int. J. Geogr. Sci. 14: 153-172. [ Links ]
18. Zhang J, Kirby R (1997) An evaluation of fuzzy approaches to mapping land cover from aerial photographs. J. Photogram. Rem. Sensing. 52: 193-201. [ Links ]
19. Zhang J, Kirby R (1999) Alternative criteria for defining fuzzy boundaries based on fuzzy classification of aerial photographs and satellite images. Photogram. Eng. Rem. Sensing 65: 1379-1387. [ Links ]