SciELO - Scientific Electronic Library Online

 
vol.58 número1Distribución espacial del índice de disponibilidad de humedad mensual en el estado Táchira, VenezuelaEl índice de área foliar en papa estimado a partir de la cobertura del follaje índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Agronomía Tropical

versión impresa ISSN 0002-192X

Agronomía Trop. v.58 n.1 Maracay mar. 2008

 

Propuesta metodológica para el control de calidad de datos de precipitación1

Magdiel Ablan*, Andressen Rigoberto**, Mary Pili Vargas*** y Miguel Acevedo****

1 El proyecto fue financiado por el FONACIT a través de la subvención S1-97000206.

*Investigadores. Universidad de los Andes, Facultad de Ingeniería, Centro de Simulación y Modelos (CESIMO),

**Centro de Investigaciones Atmosféricas y del Espacio (CIAE),

***Escuela de Ingeniería de Sistemas, Mérida, Venezuela.

****Actualmente en el Universidad del Norte en Texas. Instituto de Ciencias Aplicadas y Departamento de Geografía, E.E.U.U.

RESUMEN

Este trabajo tiene como objetivo presentar una propuesta metodológica para analizar datos climáticos históricos a ser utilizados en estudios de la variabilidad temporal de la precipitación en una región. Específicamente, en este caso, se trata de los Llanos venezolanos. La propuesta con la selección de las estaciones a ser utilizadas, continúa con la detección de posibles valores extremos o aberrantes, la estimación de valores faltantes y la verificación de la homogeneidad de las series de datos históricos. Aunque existen un gran número de técnicas para tratar cada uno de los pasos anteriores, en este trabajo, se hace énfasis en técnicas numéricas sencillas que puedan ser fácilmente entendidas y aplicadas en esta u otra región de características geográficas similares. Además, los análisis son realizados en el lenguaje R (http://www.r-project.org), que es software libre, por lo que está disponible para todos los usuarios. Debido a las importantes aplicaciones de los estudios sobre variabilidad climática y a la falta de disponibilidad de datos en Venezuela, esta propuesta viene acompañada de un portal Web (http://cesimo.ing.ula.ve/ENOS/) donde se pueden consultar y descargar los datos utilizados en el proyecto, así como los programas asociados con cada uno de los métodos.

Palabras Clave: Variabilidad climática; métodos de análisis de datos climáticos; Llanos venezolanos.

Methodological proposal for the control  of quality of data of precipitation1

SUMMARY

This paper presents a methodological proposal for the quality control of historical rainfall data, a step previous in any applied climatological analysis, like for example, in studies of the temporal variability of the precipitation in a region; specifically, in this case, it is applied to the Venezuelan ‘Llanos’. The proposal begins with the selection of the stations to be used, then continues with the detection of possible extreme or aberrant values, following with the estimation of missing data and then testing for homogeneity of the historical data series. Although there are various techniques for dealing with the previously mentioned steps, in this paper emphasis is placed on simple numerical methods that could be easily understood and applied in this or another region of similar geographical characteristics. Also, the analyses are carried out in "R" (http://www.rproject.org), a free software that has the advantage of being available for all users. Due to the importance of data quality control and to the limitations on available climate data in Venezuela, this proposal is accompanied with a Website (http://cesimo.ing.ula.ve/ENOS/) from where the data and the programs that are used in this project can be consulted and downloaded.1.

Key Words: Variabilidad climática; métodos de análisis de datos climáticos; Llanos venezolanos.

Recibido: agosto 23, 2007  Aceptado: octubre 23, 2007

INTRODUCCIÓN

La variabilidad temporal de la precipitación influye en múltiples actividades humanas, sobre todo en la gestión y manejo de los recursos hídricos, la prevención de inundaciones y sequías, la planificación y operación de actividades agrícolas, la generación hidroeléctrica y el abastecimiento de agua a la población humana. Debido a su importancia, en este trabajo se propone una metodología o protocolo que permite verificar la calidad de los datos. Este protocolo se siguió como un primer paso en un estudio que tenía como objetivos estudiar la variabilidad temporal de la precipitación en una región determinada.

MATERIALES Y MÉTODOS

Selección de las estaciones

Se elaboró un inventario de todas las estaciones pluviométricas en la zona de estudio. Estas estaciones pertenecen al MPPA y al SM-FAV. Se consideraron 257 estaciones con registros mensuales. Para cada estación se determinó, en lo posible, la información de metadata básica (ubicación de la estación, variables medidas, fecha de inicio, fecha de culminación, etc.) y el período de datos disponibles.

En la selección del período óptimo de datos se trató de conseguir un compromiso entre el número de estaciones disponibles y el número de años de registro de datos sin períodos extensos de datos faltantes. De acuerdo a la Organización Meteorológica Mundial (WMO, 1969), para estudios de variabilidad de la precipitación, en regiones tropicales planas continentales, tales como los Llanos venezolanos, se requiere un mínimo de 40 años de datos.

Por otro lado, es necesario considerar un número suficiente de estaciones para poder dilucidar si existe un patrón geográfico determinado. Finalmente se seleccionaron 68 estaciones, con un registro de 38 años. La mayoría de las estaciones finalmente seleccionadas (78%) poseían 10 o menos valores faltantes.

Selección de las estaciones vecinas

Para cada una de las estaciones consideradas, se realizó una selección de las estaciones vecinas que serían usadas como referencia para la determinación de los valores extremos y el cálculo de valores faltantes. Las estaciones fueron seleccionadas entre las más cercanas, de manera tal, que en lo posible estuvieran orientadas en los diferentes sectores de arcos de 120 grados de un círculo centrado en la estación dada (por ejemplo una estación en la dirección noreste, otra al sur y otra en la dirección noroeste), siguiendo la recomendación propuesta por Paulhus y Kohler (1952). La mediana de la distancia mínima aproximada entre un par cualquiera de las estaciones consideradas fue de 18 km y la de la máxima fue de 33 km.

Detección de valores extremos

Para detectar la posible presencia de valores extremos en un conjunto de datos pluviométricos se usó una función basada en la desviación absoluta de la mediana, mad, un estimador robusto de la variabilidad de los datos que es menos sensible a los valores extremos que los estimadores tradicionales como la desviación estándar. Cuando el valor de la desviación estándar es mayor que cuatro veces el valor de mad, se considera que el conjunto de datos posee valores extremos (Crawley, 2002). Una vez identificado un conjunto de datos con posibles valores extremos, éstos se identificaban graficando los datos mensuales de cada estación con relación a su media y desviación estándar, y estudiando la relación de este valor con los valores registrados en estaciones vecinas para el mismo período de tiempo. Los valores que se consideren extremos reales o aberrantes, se estimarán luego usando el mismo procedimiento que para datos faltantes.

Estimación de datos faltantes

Para seleccionar el método a ser usado para la estimación, se probaron tres de los procedimientos más sencillos, como se indica en Searcy y Hardison (1966), a saber: el método del promedio, el método de regresión lineal múltiple y el método de las normales de precipitación. Para cada estación se determinó el mejor método a usar siguiendo el siguiente procedimiento:

1) Se seleccionó una muestra aleatoria de 30 valores de la estación. Si alguno de los valores seleccionados resultaba ser faltante, este se descartaba y se procedía con la selección del siguiente valor.

2) Se procedió a estimar cada uno de los valores seleccionados con los tres métodos considerados.

3) Se calculó el error cometido en la estimación en cada caso y globalmente para la estación. Para la estimación del error se utilizó el error absoluto y el error cuadrático medio. Una vez determinado el mejor método a usar en cada caso, se procedió a estimar los valores faltantes en cada una de las estaciones.

Verificación de la homogeneidad de las estaciones

Para verificar la homogeneidad de las estaciones utilizadas en este estudio, se siguió el método no paramétrico propuesto por la OMM, que está basado en las series de secuencias (Thom, 1966). En principio, las estaciones no homogéneas no se deben considerar en un análisis de variabilidad climática, ya que podría, erróneamente, interpretarse como evidencia de un cambio climático, lo que en realidad puede ser considerado como consecuencia de cambios en la tecnología, en el personal que efectúa la medición, en los procedimientos empleados en la operación de las estaciones, o cambios de localización de las estaciones o efectos locales. Sin embargo, aunque existen casos en los que las series no son homogéneas, y se pudiera verificar que dicha situación no se debe a errores de observación o de procedimientos, estos no se consideraron en este trabajo, debido a la falta de información de metadata.

RESULTADOS Y DISCUSIÓN

Para la selección de las estaciones a considerar en el estudio, la comparación relativa de los períodos de datos disponibles arrojó como el período más apropiado, el comprendido entre 1960 y 1997, lo que incluye 38 años de registros, apenas un poco por debajo de lo requerido por la Organización Meteorológica Mundial; y una selección de 68 estaciones, con datos mensuales. De las estaciones consideradas, aproximadamente el 72% de las estaciones fueron identificadas como sospechosas de poseer por lo menos un valor extremo.

Sin embargo, luego del procedimiento de comparación con las estaciones vecinas sólo 55 valores del conjunto de datos, aproximadamente el 12%, se consideraron como errores de medición. El análisis de los de datos faltantes reveló que aproximadamente 78% poseían menos de 10 datos faltantes, es decir, menos del 3% con respecto al total de los valores considerados. El mejor método de estimación de los valores faltantes, utilizando como criterio el error cuadrático medio fue el método de regresión lineal (en 47,06% de las estaciones); el método de la normal de precipitación en un 39,71% de los casos y el del promedio simple en el restante 13,23%.

Con respecto a la homogeneidad, de las 68 estaciones consideradas en este trabajo, 16 resultaron ser no- homogéneas.

Por limitaciones de espacio, el siguiente Cuadro muestra algunos de los resultados obtenidos para las estaciones consideradas. Detalles sobre los resultados pueden consultarse en la página web del proyecto http://cesimo.ing.ula.ve/enos

CUADRO. Muestra algunos de los resultados de homogeneidad para las 68 estaciones consideradas.


Serial

Nombre

Ext.

Falt.

Hom.


1751

Puerto La Cruz

si

4

si

1756

El Chaparro-Caserío

si

2

no

1773

Barcelona-Aeropuerto

si

4

si

1796

Bergantín

no

5

si

2170

Guafas

no

14

no

2171

Suruguapo

no

0

si

2239

Agua Blanca

si

0

si

2246

Hacienda Camburito

no

15

si

2253

Hacienda Guache

si

3

si

2259

Payara

si

0

si

2260

Potreritos

si

0

si

2261

Chabasquen

no

19

si

2265

Ospino

si

2

si

2266

Ospino-La Estación

no

0

si

2267

Píritu

si

1

si

2273

Biscucuyi

no

2

si

2277

Colonia Turén- IAN

si

22

si

2282

Desembocadero

no

15

si

2286

Hacienda San Rafael

si

5

si

2295

Campamento Las Marías

si

2

si

2331

San Rafael de Onoto

no

0

no

2348

Morita-Caserío

si

0

si

2350

Galera

si

3

si

2425

Lezama

si

9

si

2426

La Yeguera

si

4

si

2448

Ortiz

si

0

si

2469

El Sombrero

si

8

si

2477

Encrucijada-Calabozo

si

7

si

2505

Guatopo

no

2

no

2507

San Francisco de Macaira

no

22

si

2528

Paso Real

si

2

si

2601

Soublette

no

10

si

2602

San José de Guaribe

si

43

no

2605

Guanape

si

2

si

2608

Clarines

si

1

no

2640

Kilómetro 133 - Coromoto

si

9

si

2647

Guaribe- Tenepe

si

10

si

2648

Onoto

si

2

si

2650

El Chaparro-Pueblo

si

14

no

2703

San Benardino

si

3

no

2713

Curataquiche

si

0

si

2715

Quiamare

no

12

no

2717

Santa Inés

si

2

no

2722

El Carito

si

5

no

2725

San Mateo

si

3

si

2755

Santa Rosa

si

1

si

2757

Anaco

si

6

si

2764

San Joaquín

si

4

no

2766

Cantaura

si

29

no

3126

Barinitas

no

13

si

3128

Barrancas

no

2

no

3136

Quebrada Seca

no

2

si

3149

Altamira - Barinas

no

77

si

3158

Torunos

si

2

si

3162

El Corozo-Palmitas

no

3

si

3173

San silvestre

si

1

si

3212

Sabaneta

si

2

si

3214

Puerto Las Animas

si

1

si

3216

Sipororo

no

0

no

3222

San Hipólito

si

2

si

3261

El Real

si

31

si

3283

Santa Lucia

si

7

si

3403

Los Naranjos

si

2

si

3454

Corozo Pando

si

1

si

3502

Palenque-Dispensario

si

9

si

3712

Pariguan

si

6

si

3762

San Diego de Cabrutica

si

11

no

4404

San Fernando de Apure

si

0

si


Extr.: Extremos; Falt.: Faltantes; Hom.: Homogénea.

CONCLUSIÓN

- Se desarrollaron e implementaron un conjunto de métodos y programas estadísticos que permiten estudiar y analizar la variabilidad de la precipitación en los Llanos venezolanos. Los métodos, datos y resultados de los análisis se encuentran disponibles en un portal web (http://cesimo.ing.ula.ve/ENOS) que permite un mayor uso de los mismos.

- La metodología propuesta es sencilla y tanto los métodos como sus resultados pueden ser aplicados a un gran rango de situaciones donde es de interés caracterizar la variabilidad de la precipitación.

AGRADECIMIENTO

Nuestro agradecimiento a la Lic. Cherly Guerrero por su ayuda con el procesamiento de los datos.

BIBLIOGRAFÍA

1. Crawley, M. 2002. Statistical Computing: An Introduction to Data Analysis using S-plus. John Wiley & Sons, England. 761 p.        [ Links ]

2. Paulhus J. L. H and M. A. Kohler, 1952. Interpolation of Missing Precipitation Records. Monthly Weather Review. 80 p.        [ Links ]

3. Searcy, J. K. and C. H. Hardison. 1966. Double-mass curves. Manual of Hydrology: Part 1. General surface-water techniques. Washington: Geological Survey Water-Supply Paper 1541-B. 66 p.        [ Links ]

4. Thom, H. 1966. Some Methods of Climatological Analysis. Secretaria of the World Meteorological Organization. Geneva, Switzerland.        [ Links ]

5. Organización Meteorológica Mundial (WMO). 1969. A note on climatological normals. Technical Note No. 84. WMO-No. 208.TP.108. Geneva, 19 p.        [ Links ]