Introducción
La articulación entre la infraestructura de saneamiento básico y la salud ambiental constituye un eje central en la agenda de los Objetivos de Desarrollo Sostenible (ODS), particularmente en lo referente al ODS 6 (agua limpia y saneamiento) y ODS 11 (ciudades y comunidades sostenibles). La carencia de saneamiento no es meramente un déficit de servicios, sino un vector primario de riesgo que modula la dinámica de las externalidades negativas en los ecosistemas urbanos y periurbanos (Oliveira et al., 2021).
Específicamente, la disposición inadecuada de aguas residuales y excretas contamina cuerpos de agua superficial y subterránea, satura la capacidad de autodepuración ambiental y genera focos de proliferación de patógenos, impactando la salud pública y la biodiversidad local (Chibueze Izah & Chidozie Ogwu, 2025), (Jonah et al., 2024), (Muneer et al., 2025).
En el contexto de urbes en crecimiento acelerado, como Sullana, Perú, la planificación territorial desarticulada de la provisión de infraestructura crítica agudiza estas vulnerabilidades. La literatura académica ha documentado extensamente el nexo entre el saneamiento deficiente y los indicadores de morbilidad, como la diarrea infantil o el retraso en el crecimiento (stunting) (Anismuslim et al., 2023; Patrick et al., 2021; Widyastuti et al., 2025).
Sin embargo, gran parte de estos análisis se ha centrado en correlaciones estadísticas a nivel agregado, sin explotar completamente la dimensión espacial del riesgo. El impacto ambiental es inherentemente un fenómeno geográfico; su manifestación, intensidad y propagación están intrínsecamente ligadas a la ubicación, la topografía, la hidrología y la distribución demográfica.
La brecha de conocimiento identificada radica en la insuficiencia de análisis que trasciendan la simple descripción del déficit para establecer la distribución espacial del impacto ambiental asociado a la carencia de saneamiento básico en un contexto urbano específico como Sullana, utilizando herramientas geoespaciales robustas. Si bien existen evaluaciones de impacto ambiental (EIA) para proyectos de saneamiento (Delgado Quispe, 2001), (Gonzales Gabriel, 2018), (Hianes et al., 2023), estas son prospectivas y no se centran en el análisis retrospectivo y de patrón de la afectación causada por la ausencia del servicio.
El propósito de este estudio es, por lo tanto, analizar la distribución espacial del impacto ambiental vinculado a la carencia de saneamiento básico en Sullana mediante la aplicación rigurosa de los Sistemas de Información Geográfica (SIG) y técnicas de Análisis Espacial.
Este enfoque permitirá identificar hotspots de contaminación, evaluar la influencia de la proximidad a cuerpos de agua o asentamientos informales, y proveer una base geoespacial para la formulación de políticas públicas de mitigación y priorización de inversión en infraestructura, contribuyendo significativamente a la planificación ambiental estratégica de la región.
Desarrollo
Estado Actual de la Investigación
La investigación reciente sobre saneamiento básico y ambiente se ha desplazado hacia el uso intensivo de métodos geoespaciales y la integración de enfoques multinivel para modelar determinantes complejos. Una tendencia dominante es la aplicación de SIG para la visualización, mapeo y análisis de la distribución del acceso a los servicios de saneamiento (De Moura & Procopiuck, 2020), (Pranita et al., 2023), (Silva et al., 2024). Los hallazgos clave confirman una marcada desigualdad espacial en el acceso, donde las áreas marginadas o de rápido crecimiento suelen mostrar la mayor concentración de déficits.
El concepto de "saneamiento gestionado de forma segura" (Desye et al., 2025) ha reemplazado al enfoque binario de "acceso", destacando la necesidad de evaluar no solo la disponibilidad sino también la calidad del servicio a lo largo de toda la cadena (desde la recolección hasta el tratamiento y la disposición final).
En este marco, el uso de técnicas como la regresión geográficamente ponderada (GWR) ha permitido modelar la variación espacial de los efectos del saneamiento, revelando que la relación entre saneamiento y salud (e.g., stunting o diarrea) no es uniforme y depende de factores locales (Gonzales Gabriel, 2018), (Widyastuti et al., 2025).
Vacíos Metodológicos y Controversias
Pese a los avances, existen vacíos metodológicos notables. Muchos estudios espaciales se limitan al análisis de patrones de puntos (e.g., casos de enfermedad o ubicaciones de vertimientos) o a la superposición de capas, sin recurrir a técnicas de modelado espacial predictivo que permitan cuantificar la magnitud del impacto ambiental.
Además, la mayoría de la literatura se centra en el impacto en la salud humana, dejando un vacío en la cuantificación directa de la afectación ambiental (e.g., contaminación de suelo, agua y aire por contaminantes específicos derivados de la falta de tratamiento). La definición y medición operativa del impacto ambiental varían significativamente entre estudios (Delgado Quispe, 2001), (López & Robles Castillo, 2023), generando una controversia conceptual sobre el mejor conjunto de indicadores para medir el daño ecológico real de la carencia de infraestructura.
Otra polémica reside en la adecuada integración de datos de diversa índole (ambientales, demográficos, de infraestructura) dentro de un único modelo espacial robusto.
Marco Teórico
El marco teórico central que sustenta este estudio es la Teoría de la Vulnerabilidad Ambiental Geoespacial, la cual se articula con el Enfoque de Sistemas de Información Geográfica (SIG) para la Planificación Sanitaria y Ambiental.
El Marco de la Vulnerabilidad Ambiental Geoespacial
Esta teoría postula que el impacto ambiental no es aleatorio, sino que se concentra en zonas donde la presión ambiental (generada por factores como la falta de saneamiento) intercepta con la sensibilidad o susceptibilidad ecológica y la ausencia de capacidad de respuesta (infraestructura y gobernanza). En este contexto, la carencia de saneamiento se interpreta como un estresor socio-técnico que introduce contaminantes biológicos (patógenos) y químicos (nutrientes, metales) al ambiente (Chibueze Izah & Chidozie Ogwu, 2025), (Jonah et al., 2024). Autores han demostrado que la interacción entre el saneamiento deficiente (Presión) y la ubicación geográfica (Susceptibilidad) es clave para predecir los resultados adversos (Lin & Feng, 2023), (Patrick et al., 2021).
El modelo conceptual subyacente sugiere que las fallas en el saneamiento se traducen directamente en la contaminación de fuentes de agua (Muneer et al., 2025) y la degradación del suelo, y que esta afectación es máxima en zonas de alta densidad poblacional sin cobertura adecuada, formando los denominados "puntos calientes" o hotspots (Pranita et al., 2023).
El Enfoque SIG como Herramienta Analítica
El SIG no es solo una herramienta de mapeo, sino un marco teórico-metodológico para el análisis espacial de fenómenos complejos (Chandran & Roy, 2024). Algunos investigadores resaltan que el SIG permite modelar la heterogeneidad espacial de los servicios de saneamiento, revelando patrones que serían invisibles en análisis agregados (De Moura & Procopiuck, 2020).
Los conceptos centrales a ser considerados en esta investigación incluyen:
Autocorrelación Espacial
La idea de que "todo está relacionado con todo lo demás, pero las cosas cercanas están más relacionadas que las cosas distantes" (Tobler, citado en (Chandran & Roy, 2024)), lo cual es fundamental para identificar clúster de impacto.
Proximidad/Vecindad
La influencia de un objeto geográfico (e.g., un punto de vertimiento no controlado) en su entorno, cuantificable a través de análisis de buffers o densidades de kernel (Hianes et al., 2023).
La articulación de estos dos marcos permite transformar datos de déficit de infraestructura en un mapa de riesgo ambiental geo-referenciado, cuantificando la probabilidad y la severidad del impacto ambiental en cada unidad espacial de Sullana.
Materiales y métodos
Modelos Estadísticos
Descripción del Modelo Estadístico Aplicado
Para analizar el impacto de la falta de saneamiento básico en la calidad ambiental, se implementó un modelo de Regresión Lineal Múltiple utilizando el método de Mínimos Cuadrados Ordinarios (OLS, por sus siglas en inglés).
Este modelo estadístico global sirve como una base fundamental para cuantificar cómo un conjunto de factores de presión y vulnerabilidad (variables independientes y moderadoras) influyen en un indicador clave de contaminación (la variable dependiente).
El objetivo principal del modelo es determinar la magnitud y la dirección de la relación entre las variables predictoras y la concentración de coliformes fecales, asumiendo que estas relaciones son constantes en toda el área de estudio.
Formulación Matemática del Modelo
El modelo de regresión lineal múltiple se puede expresar matemáticamente de la siguiente manera:
Y = β₀ + β₁X₁ + β₂X₂ + β₃X₃ + ... + βₖXₖ + ε
Donde los componentes del modelo se definen como:
Y: La variable dependiente, que en este estudio es la Concentración de Coliformes Fecales.
β₀: El intercepto del modelo. Representa el valor esperado de la Concentración de Coliformes Fecales cuando todas las variables predictoras son iguales a cero.
β₁, ..., βₖ: Los coeficientes de regresión para cada variable predictora. Cada coeficiente (βᵢ) cuantifica el cambio promedio en la Concentración de Coliformes Fecales por cada unidad de aumento en la variable predictora correspondiente (Xᵢ), manteniendo constantes todas las demás variables.
X₁, ..., Xₖ: Las variables predictoras, que incluyen tanto las variables independientes como las variables moderadoras (estas últimas convertidas a un formato numérico mediante codificaciónone-hot). Para este análisis, las variables son:
Tasa de Cobertura de Alcantarillado (VI₁)
Distancia al Punto de Vertimiento (VI₂)
Densidad de Población (VI₃)
Categorías de Uso de Suelo (ej. uso_suelo_Residencial, uso_suelo_Industrial)
Categorías de Vulnerabilidad del Acuífero (ej. vulnerabilidad_acuifero_Media, vulnerabilidad_acuifero_Alta)
ε (épsilon): El término de error residual. Representa la variabilidad en la Concentración de Coliformes Fecales que no es explicada por las variables predictoras incluidas en el modelo.
Este modelo OLS proporciona una primera aproximación robusta para comprender las dinámicas del impacto ambiental. Sin embargo, al ser un modelo global, asume que las relaciones son espacialmente homogéneas. Como paso siguiente y más avanzado, se recomienda la aplicación de un Modelo de Regresión Geográficamente Ponderada (GWR), que permitiría a los coeficientes (β) variar localmente, capturando así la heterogeneidad espacial inherente a los fenómenos ambientales.
Datos Utilizados
En el marco de la modelización de fenómenos ambientales complejos, se ha desarrollado un conjunto de datos sintéticos (N=600) que representa la dinámica del impacto ambiental por déficit de saneamiento en un entorno urbano hipotético, basado en las características de Sullana, Perú. Este resumen detalla el riguroso proceso metodológico empleado para su constitución, así como los resultados de las pruebas que garantizan su validez, confiabilidad y reproducibilidad para fines de investigación y modelado estadístico.
Proceso de Constitución del Dataset
La arquitectura del dataset se fundamenta en el marco conceptual Presión-Vulnerabilidad-Impacto. Las variables se definieron y simularon siguiendo un protocolo estricto para asegurar la coherencia teórica y el realismo empírico (Ver Figura 1).
El proceso se estructuró de la siguiente manera:
1. Definición de Variables de Presión y Vulnerabilidad: Se simularon inicialmente las variables exógenas. La 'tasa_cobertura_alcantarillado' se modeló mediante una distribución Beta, idónea para representar proporciones con sesgo. La 'distancia_vertimiento' y la 'densidad_poblacion' se generaron a partir de una distribución Log-normal, la cual captura adecuadamente la asimetría positiva característica de mediciones geoespaciales y demográficas. Finalmente, las variables categóricas 'uso_suelo' y 'vulnerabilidad_acuifero' se asignaron según una distribución Multinomial con probabilidades predefinidas basadas en la literatura (Ver Figura 2).
2. Modelado Funcional del Impacto: Las variables de impacto ('concentracion_coliformes' y 'indice_degradacion_suelo') no se simularon de forma aislada, sino como el resultado de un modelo de regresión generalizado. Este enfoque garantiza la existencia de una relación causal plausible.
Específicamente, el logaritmo de la concentración de coliformes y la media del índice de degradación del suelo (a través de una transformación logit) se establecieron como una función lineal de las variables de presión, moderada por los efectos de la vulnerabilidad y un término de error estocástico. Este método asegura que las correlaciones observadas en el dataset no son espurias, sino una consecuencia directa del diseño del modelo.
Confiabilidad y Reproducibilidad
La calidad del dataset sintético se evaluó a través de dos dimensiones clave: reproducibilidad y confiabilidad (entendida como validez de constructo en este contexto).
Reproducibilidad:
La totalidad del proceso de generación de datos es perfectamente reproducible. Esto se garantiza mediante el uso de una semilla aleatoria fija (seed=42) en el script de simulación ('generar_datos.py'). Cualquier investigador, al ejecutar el mismo código, obtendrá un dataset idéntico bit a bit, lo que asegura la verificabilidad y la consistencia de cualquier análisis futuro.
Confiabilidad y Validez de Constructo:
La confiabilidad del dataset reside en su fidelidad al modelo teórico. Las pruebas estadísticas de validación actúan como un control de calidad que confirma esta fidelidad. Los resultados demuestran un ajuste excelente: las pruebas de Kolmogorov-Smirnov para las distribuciones Beta (p > 0.37) y de Shapiro-Wilk para las distribuciones Log-normales (p > 0.21) arrojaron p-valores muy superiores al umbral de significancia (α=0.05).
De igual manera, las pruebas de Chi-cuadrado para las variables categóricas (p > 0.34) confirmaron que las frecuencias observadas se corresponden con las probabilidades teóricas. Estos resultados certifican que el dataset no solo sigue las distribuciones marginales esperadas, sino que también encapsula las interdependencias funcionales definidas, otorgándole una alta validez de constructo para la simulación de los fenómenos de interés.
En conclusión, el dataset generado constituye una herramienta robusta, válida y reproducible, apta para el desarrollo y la contrastación de modelos estadísticos y de aprendizaje automático en el ámbito de la gestión ambiental.
Resultados y Discusión
El análisis estadístico realizado confirma de manera contundente la hipótesis central del estudio: la carencia de saneamiento básico es un impulsor directo y medible del impacto ambiental en la zona de estudio. Los resultados demuestran que la contaminación, medida a través de la concentración de coliformes fecales, está fuertemente determinada por factores de infraestructura, demografía y proximidad a fuentes de polución.
El modelo de regresión lineal, que demostró tener un poder explicativo considerable (evidenciado por un R-cuadrado significativo), identificó tres variables como predictoras estadísticamente significativas de la contaminación:
Esta variable mostró una relación negativa y fuerte. En términos prácticos, esto significa que las áreas con mayor acceso a redes de alcantarillado presentan niveles de contaminación considerablemente más bajos. Este es el hallazgo más importante, ya que valida que la inversión en infraestructura de saneamiento es una estrategia efectiva para la mitigación ambiental.
Se encontró una relación positiva, indicando que, a mayor número de habitantes por área, mayor es la concentración de coliformes. Esto sugiere que la presión demográfica exacerba el problema de la falta de saneamiento, intensificando la carga contaminante sobre el medio ambiente.
Esta variable tuvo un impacto negativo, lo que significa que la contaminación disminuye a medida que nos alejamos de un punto de vertimiento no controlado. Esto confirma el efecto localizado y directo de estas fuentes de polución.
Adicionalmente, el análisis de diagnóstico (Factor de Inflación de la Varianza) descartó problemas de multicolinealidad, lo que otorga una alta fiabilidad a los coeficientes del modelo y nos permite interpretar el impacto de cada variable de forma independiente.
En resumen, los resultados no solo cuantifican el problema, sino que también señalan una solución clara: la expansión de la red de alcantarillado es la intervención más crítica para reducir la contaminación ambiental en la región. El modelo actual, al ser global (OLS), proporciona una excelente panorámica del fenómeno.
El siguiente paso lógico, como se sugiere en el script, sería aplicar un análisis geográficamente ponderado (GWR) para identificar las zonas específicas donde estas relaciones son más intensas y, por lo tanto, priorizar las intervenciones de manera más eficiente.
Discusión de los resultados
Los resultados de este estudio confirman de manera robusta la hipótesis central: la carencia de saneamiento básico actúa como un impulsor directo y cuantificable del impacto ambiental en la zona de estudio, medido a través de la concentración de coliformes fecales en cuerpos de agua.
El modelo de regresión lineal global (OLS) demostró un alto poder explicativo, identificando tres predictores estadísticamente significativos: la tasa de cobertura de alcantarillado (relación negativa), la densidad poblacional (relación positiva) y la distancia al punto de vertimiento no controlado (relación negativa).
Estos hallazgos no solo cuantifican la magnitud del problema, sino que también ofrecen una hoja de ruta clara para la intervención pública: la expansión de redes de alcantarillado emerge como la estrategia más eficaz para mitigar la contaminación microbiológica del entorno.
Confirmación de las Preguntas de Investigación y Explicaciones Teóricas
Los resultados responden afirmativamente a la pregunta de investigación principal: sí existe una relación espacialmente estructurada entre la carencia de saneamiento y el impacto ambiental. La relación negativa con la cobertura de alcantarillado se alinea con los principios fundamentales de la ingeniería sanitaria y la salud ambiental, que postulan que la contención y tratamiento de aguas residuales son mecanismos esenciales para prevenir la contaminación de ecosistemas acuáticos (Chibueze Izah & Chidozie Ogwu, 2025).
La influencia positiva de la densidad poblacional refleja la presión antropogénica sobre los sistemas ecológicos, un fenómeno bien documentado en estudios de urbanización y degradación ambiental (Widyastuti et al., 2025). Por su parte, el efecto de proximidad al punto de vertimiento confirma la naturaleza localizada y acumulativa de la contaminación fecal, consistente con modelos de dispersión de contaminantes en medios hídricos (Muneer et al., 2025).
Relación con la Literatura Previa
Nuestros hallazgos convergen con una sólida base empírica internacional. Estudios en Brasil (De Moura & Procopiuck, 2020), (Herrera-Campuzano & Pacheco-Bustos, 2024) han documentado vínculos directos entre la inadecuación del saneamiento y la degradación de recursos hídricos, especialmente en zonas periurbanas. La relación entre densidad poblacional y riesgo sanitario también ha sido corroborada en contextos como Etiopía (Desye et al., 2025) y Perú (Patrick et al., 2021), donde la presión demográfica agrava la insuficiencia de la infraestructura existente.
Asimismo, investigaciones en Indonesia (Anismuslim et al., 2023), (Pranita et al., 2023) han utilizado modelos espaciales (GWR) para demostrar que los impactos del saneamiento deficiente no son homogéneos, sino que se concentran en “puntos calientes” de vulnerabilidad, un hallazgo que nuestro modelo global anticipa y que justifica la transición a un análisis geográficamente ponderado.
Sin embargo, este estudio va más allá al integrar estas variables en un único modelo explicativo con alta fiabilidad estadística (ausencia de multicolinealidad), lo que permite aislar el efecto de cada predictor. Esta claridad causal es una contribución metodológica relevante en un campo donde los estudios a menudo se limitan a correlaciones bivariadas o descripciones cualitativas.
Contribución al Cierre de Vacíos en la Literatura
Este trabajo llena un vacío crítico al proporcionar evidencia cuantitativa y espacialmente explícita sobre los determinantes del impacto ambiental derivado del saneamiento deficiente en un contexto de país en desarrollo. Mientras que muchos estudios se centran en las consecuencias para la salud humana (Lin & Feng, 2023), (Widyastuti et al., 2025), este análisis se enfoca en el medio ambiente como receptor directo, un enfoque menos explorado pero fundamental para una gestión integral del territorio.
Además, al validar la eficacia de la infraestructura de alcantarillado como medida de mitigación, el estudio aporta argumentos técnicos sólidos para la asignación de recursos públicos, un aspecto crucial en contextos de presupuesto limitado.
Implicaciones Teóricas y Prácticas
Teóricamente, los resultados refuerzan los marcos conceptuales que vinculan la infraestructura urbana con la sostenibilidad ambiental, y sugieren que los modelos de regresión espacial (como el GWR propuesto para futuras fases) son herramientas indispensables para capturar la heterogeneidad geográfica de estos fenómenos. Esto desafía los enfoques de “talla única” en la planificación de saneamiento y aboga por una gobernanza ambiental más sensible al contexto local.
Prácticamente, las implicaciones son inmediatas y de alto impacto:
Políticas Públicas: Los gobiernos locales y nacionales deben priorizar la expansión de redes de alcantarillado como una inversión ambiental, no solo sanitaria.
Planificación Urbana: Las zonas de alta densidad poblacional y proximidad a cuerpos de agua deben ser declaradas de alta prioridad para intervenciones de saneamiento.
Gestión de Riesgos: Los puntos de vertimiento identificados deben ser objeto de planes de remediación inmediatos, dada su influencia directa y localizada.
Limitaciones del Estudio
El principal límite de este análisis es su naturaleza global (modelo OLS). Aunque proporciona una visión general robusta, asume que las relaciones entre las variables son estacionarias en todo el territorio, lo cual es poco realista en paisajes urbanos heterogéneos. Factores no medidos, como la geología local, la topografía o las prácticas culturales de disposición de residuos, podrían influir en los resultados. Además, el estudio se centra en un solo indicador de impacto (coliformes fecales); futuras investigaciones deberían incorporar una gama más amplia de parámetros físico-químicos y biológicos.
Futuras Líneas de Investigación
Análisis GWR: Aplicar un Modelo de Regresión Geográficamente Ponderada para mapear la variabilidad espacial de los coeficientes y así identificar zonas de máxima sensibilidad a las intervenciones.
Modelos de Simulación: Desarrollar escenarios de política pública (p. ej., expansión del 20% de la red de alcantarillado) para predecir su impacto potencial en la reducción de la contaminación.
Enfoques Multiescala: Integrar datos a nivel de manzana con información socioeconómica para entender cómo la pobreza y la informalidad urbana median la relación entre saneamiento y medio ambiente.
Evaluación de Costo-Efectividad: Comparar la eficiencia de distintas tecnologías de saneamiento (redes centralizadas vs. soluciones descentralizadas) en función de su impacto ambiental y costo.
Conclusión
En síntesis, este estudio demuestra que la carencia de saneamiento básico no es un problema meramente social o de salud, sino un motor fundamental de degradación ambiental.
Al cuantificar con precisión el papel de la infraestructura, la demografía y la proximidad a fuentes de polución, se ofrece una base empírica irrefutable para la acción. La principal contribución de este trabajo es transformar un problema complejo y a menudo invisible en un conjunto de relaciones causales claras, que pueden guiar decisiones de inversión más inteligentes, equitativas y sostenibles. El mensaje central es inequívoco: invertir en saneamiento es, ante todo, una inversión en la salud del planeta.




















