Prediccion mediante redes neuronales artificiales de la transferencia de masa en frutas osmoticamente deshidratadas

Millán Trujillo¹, Félix Rafael; Ostojich Cuevas², Zoitza

Servicios Personalizados

Revista

Articulo

Indicadores

Citado por SciELO
Accesos

Links relacionados

Similares en SciELO
uBio

Otros
Otros

Permalink

Interciencia

versión impresa ISSN 0378-1844

INCI v.31 n.3 Caracas mar. 2006

Prediccion mediante redes neuronales artificiales de la transferencia de masa en frutas osmoticamente deshidratadas

Félix Rafael Millán Trujillo¹ y Zoitza Ostojich Cuevas²

¹Félix Rafael Millán Trujillo. M.Sc. en Ciencia y Tecnología de Alimentos, Universidad Simón Bolívar (USB), Venezuela. Profesor, USB, Venezuela. Dirección: Departamento de Tecnología de Procesos Biológicos y Bioquímicos, Edificio de Química y Procesos, Piso 1. Apartado Postal 89000. Sartenejas. Baruta. Edo. Miranda. Venezuela. e-mail: fmillan@usb.ve

²Zoitza Ostojich Cuevas. Ingeniero Químico y Estudiante de Maestría en Ciencia de los Alimentos, USB, Venezuela.

Resumen

Este trabajo tuvo como objetivo predecir las manifestaciones macroscópicas de los dos principales fenómenos de transferencia de masa en tres frutas (melón, lechosa y manzana) osmóticamente deshidratadas. Se consideró el efecto de cinco variables de proceso: tipo de alimento, concentración de la solución osmótica, tamaño de la fruta, temperatura y tiempo de proceso, sobre la pérdida de agua y ganancia de sólidos de las frutas. Para ello se desarrolló un modelo neuronal artificial compuesto por cinco neuronas de entrada y dos capas ocultas de procesamiento de información compuestas por cinco neuronas cada una, utilizando funciones sigmoides como medio de comunicación, y dos neuronas de salida representando a las variables dependientes del modelo. La arquitectura neuronal desarrollada y entrenada mediante el algoritmo Levenberg-Marquardt permitió predecir más del 90% de la variabilidad de los datos en los dos fenómenos de transferencia estudiados, constituyéndose en un modelo alternativo a las ecuaciones paramétricas desarrolladas hasta el momento.

mass transfer prediction by artificial neural networks in osmotically dehydrated fruits

Summary

The purpose of this work was to predict the macroscopic behavior of the two main mass transfer phenomena in three fruits (melon, papaya and apple) osmotically dehydrated. The effect of five process variables was considered: type of food, osmotic solution concentration, fruit size, temperature and process time. The two dependent output variables were water loss and solid gain of the fruits. An artificial neural network model was developed, consisting of an input layer of five neurons and two hidden information processing layers of five neurons each, using sigmoid transfer functions for communication, and two output neurons in order to represent the dependent variables of the model. The neural architecture, trained by the Levenberg-Marquardt algorithm, predicted more than 90% of the data variability for two transfer phenomenon studied, becoming an alternative model to parametric equations developed up to now.

predição mediante redes neuronais artificiais da transferência de massa em frutas osmoticamente desidratadas

Resumo

Este trabalho teve como objetivo predizer as manifestaçðes macroscópicas dos dois principais fenômenos de transferência de massa em três frutas (melão, mamão e maça) osmóticamente desidratadas. Considerou-se o efeito de cinco variáveis de processo: tipo de alimento, concentração da solução osmótica, tamanho da fruta, temperatura e tempo de processo, sobre a perda de água e ganho de sólidos das frutas. Para isto se desenvolveu um modelo neuronal artificial composto por cinco neurônios de entrada e duas capas ocultas de procesamento de informação compostas por cinco neurônios cada uma, utilizando funçðes sigmóides como meio de comunicação, e dois neurônios de saída representando as variáveis dependentes do modelo. A arquitetura neuronal desenvolvida e treinada mediante o algoritmo Levenberg-Marquardt permitiu predizer mais de 90% da variabilidade dos dados nos dois fenômenos de transferência estudados, constituindo-se em um modelo alternativo às equaçðes paramétricas desenvolvidas até o momento.

Palabras clave: Deshidratación Osmótica, Frutas, Redes Neuronales.

Recibido: 16/05/2005. Modificado: 17/01/2006. Aceptado: 18/01/2006.

Introduccion

La deshidratación osmótica es una tecnología que ha sido aplicada principalmente en frutas, con el objeto de reducir la actividad de agua y el contenido de humedad de las mismas, para así generar alimentos de humedad intermedia con una estabilidad relativamente limitada, por lo cual, el proceso osmótico es usualmente combinado con otra técnica de preservación que permita extender la vida útil del alimento (Panagiotou et al., 1998).

Generalmente, el proceso se desarrolla mediante la inmersión de trozos de fruta en soluciones de sacarosa, mediante el control de variables como temperatura, agitación y tiempo de proceso. En el curso de la tecnología se suscitan tres fenómenos de transferencia de masa: la migración de agua desde la fruta hacia la solución de impregnación, la transferencia de solutos de la solución a la fruta y la salida de solutos propios del alimento a la solución.

El tercer fenómeno de transferencia resulta cuantitativamente despreciable en comparación con los dos primeros, los cuales caracterizan el proceso y permiten el logro de los objetivos ulteriores de la tecnología: la estabilidad del alimento mediante el control de su contenido de humedad y la actividad de agua, y la posibilidad de aplicación de efectos de formulación específicos mediante componentes específicos del flavor (Panagiotou et al., 1998).

En tal sentido, el modelado predictivo tanto de la pérdida de agua como de la ganancia de sólidos en alimentos sometidos a la deshidratación osmótica, reviste importancia para la exploración predictiva de condiciones no experimentadas, con el objeto de optimizar los fenómenos de transferencia de masa y reducir el costo del proceso.

Son diversos los modelos matemáticos de naturaleza mecanicista o empírica, propuestos hasta el momento para modelar la deshidratación osmótica. En la presente investigación se plantea un enfoque de modelado predictivo basado en el uso de redes neuronales artificiales.

Aún cuando la aplicación mas conocida de las redes artificiales, se basa en la creación de máquinas con cierta capacidad de aprendizaje y las novedosas aplicaciones de la robótica, los modelos basados en redes neuronales artificiales también constituyen hoy en día una aplicación novedosa para el reconocimiento de los patrones no lineales característicos de los procesos biológicos y como útil herramienta para el control de procesos (Eerikäinen et al., 1993; Horimoto et al., 1995; Ni y Gunarasekaran, 1998; Millán et al., 2001).

En tal sentido, el objetivo de la presente investigación es desarrollar un modelo de red neuronal artificial basado en un algoritmo de retropropagación del error, para el modelado predictivo de los fenómenos de pérdida de agua y ganancia de sólidos en frutas osmóticamente deshidratadas.

Materiales y Métodos

Proceso de deshidratación osmótica

Las frutas usadas en la investigación, lechosa, melón y manzana, seleccionadas en virtud de su naturaleza porosa y por ende facilitadora de los fenómenos de transferencia de masa, se obtuvieron de un mismo establecimiento comercial, sin lesiones externas y con características similares de forma, tamaño y color. Se determinó el contenido de humedad inicial de las frutas, de acuerdo a la metodología de la AOAC (AOAC, 1990), obteniéndose los siguientes resultados: lechosa 88,93% ± 0,71% (n=5), melón 93,07% ± 0,85% (n=5) y manzana 87,32% ±0,82% (n=5). Una vez lavadas, las frutas fueron picadas en cubos mediante la utilización de un vernier y un cuchillo previamente desinfectado. Es importante señalar que las frutas, con características similares de madurez (de acuerdo a la relación ºBrix / pH), fueron asignadas aleatoriamente a cada condición experimental (1 fruta o individuo por tratamiento) y se obtuvieron 10 unidades experimentales (cubos) de cada fruta para conformar una réplica de cada i-ésimo tratamiento (Tabla I). La obtención de cubos de geometría regular con características finitas, permitió reducir la dimensión característica de las frutas y minimizar los tiempos de impregnación empleados. Una vez cortadas y registrado el peso inicial de las muestras de frutas, las mismas se sumergieron en las soluciones de impregnación (soluciones de sacarosa), para cada una de las condiciones experimentales (Tabla I). Para satisfacer cada una de las condiciones de temperatura, las soluciones fueron colocadas en baños de agua y tapadas para evitar la evaporación de las soluciones. Al finalizar el tiempo de proceso, los trozos de fruta fueron cuidadosamente secados con papel absorbente para remover el exceso de solución osmótica de la superficie y su peso se registró inmediatamente. Posteriormente, las muestras se secaron en un horno de convección a 60ºC por 16h., y posteriormente en una estufa al vacío a 70ºC por 24h., para determinar la masa seca de las frutas osmóticamente tratadas y calcular por balance de masa el contenido de humedad de las mismas (Panagiotou et al., 1998). Cada condición experimental se realizó por duplicado. Con la primera réplica se entrenó la arquitectura neuronal artificial y con la segunda, constituida a partir de muestras de frutas totalmente independientes de las utilizadas para la primera réplica, se validó la habilidad predictiva y de generalización del modelo (Millán et al., 2001).

Como se señaló en la introducción, los dos principales fenómenos de transferencia de masa que se suscitan en la deshidratación osmótica, se evidencian macroscópicamente mediante la pérdida de agua (PA) y la ganancia de sólidos (GS), las cuales pueden ser definidas por las ecuaciones

donde M₀: masa inicial de fruta antes de ser sometida al tratamiento osmótico, M: masa de fruta luego del tratamiento osmótico, m₀: masa seca inicial de la muestra de fruta, y m: masa seca de la fruta luego del tratamiento osmótico.

Desarrollo del modelo neuronal artificial

Se desarrolló una estructura neuronal de retropropagación del error con 5 neuronas de entrada, constituidas por las variables tipo de alimento (melón, lechosa y manzana), concentración de la solución de impregnación, tamaño de la muestra de fruta, temperatura y tiempo de proceso, y dos neuronas de salida, representativas de la pérdida de agua y ganancia de sólidos, como manifestaciones macroscópicas de la transferencia de agua desde la fruta hacia la solución de impregnación y la transferencia de solutos desde la solución de impregnación hacia la fruta, respectivamente. Los valores de entrada a las i-ésimas neuronas de entrada estuvieron constituidos por los valores que conforman las variables independientes mencionadas (Tabla I). A estos valores se asoció aleatoriamente un peso de conexión de poca magnitud, que permitió la propagación de la información a la primera capa de neuronas ocultas de procesamiento de datos. La asignación aleatoria de los pesos de inicio de poca magnitud es la técnica normalmente usada cuando no se dispone de información previa acerca del sistema que se está modelando, ya que impide la temprana saturación de la red por cuanto induce a la ruptura de simetría. Así, la entrada neta de la j-ésima neurona de la capa oculta puede representarse a través de la ecuación

donde x_pi: entrada que recibe la neurona procedente de la i-ésima unidad de entrada, w_jih: peso de la conexión y q_jh: término de tendencia. El índice h se refiere a magnitudes de la capa oculta y el subíndice p al p-ésimo vector de entrenamiento. El establecimiento del número de capas ocultas y el número de neuronas que conforman dichas capas se seleccionó mediante un proceso de ensayo y error (Bochereau et al., 1992; Arteaga y Nakai, 1993; Gerbi et al., 1998; Chen et al., 2001).

Luego, la salida de las j-ésimas neuronas de la capa oculta se transfirió a las neuronas de la capa de salida mediante una función de transferencia f_j^h. Dicha salida se representa por la ecuación

donde y_pj: salida neta de cada j-ésima neurona de la capa oculta, y net_pjh: entrada neta a la j-ésima neurona de la capa oculta. La función de transferencia más empleada en las redes de retropropagación del error es la tangente hiperbólica (Reed y Marks, 1999).

Luego, la entrada neta a la capa de neuronas de salida, representadas por el número de variables dependientes del sistema, en este caso la pérdida de agua y la ganancia de sólidos de las frutas osmóticamente deshidratadas, se representa mediante la ecuación

donde el índice 0 se refiere a magnitudes de la capa de salida, y_pj: entrada procedente de la j-ésima neurona oculta, w_kj0: peso de conexión entre la j-ésima unidad oculta y la k-ésima neurona de salida, q_k0: término de tendencia asociado a la k-ésima neurona de salida, y netpk: entrada neta a la k-ésima neurona de salida. Finalmente, la salida de las neuronas de salida se comparó con un vector objetivo constituido por los valores experimentales de pérdida de agua y ganancia de sólidos y se generó la siguiente función de error, constituida por la suma de errores cuadráticos (Reed y Marks, 1999):

donde ESSE: suma de cuadrados del error, p: vector de entrenamiento o conjunto de datos experimentales, i: salida emitida por las neuronas de salida de la red, y t_pi y y_pi representan el objetivo o conjunto de valores observados y la salida de la red, respectivamente.

El proceso de entrenamiento y aprendizaje de la red se basó entonces en la reducción de la función de error anterior, a través de un proceso iterativo de actualización de pesos de conexión y términos de tendencia que se representa esquemáticamente en la Figura 1.

La arquitectura neuronal, así como el proceso de entrenamiento, aprendizaje y posterior simulación de la red, se desarrollaron con el módulo de redes del programa Matlab 6.0.

Resultados y Discusión

A partir de los 202 datos experimentales obtenidos en la deshidratación osmótica de las tres frutas estudiadas, se utilizaron los 101 datos contenidos en la Tabla I, para estructurar la arquitectura neuronal artificial. Mediante el lenguaje de programación Matlab se procedió a crear la estructura inicial de la red mediante la instrucción

donde P constituye una matriz N×2 de vectores de entrada en la que cada fila contiene los valores máximo y mínimo de la i-ésima neurona de entrada, es decir, de los niveles de las variables: tipo de alimento, concentración de la solución de impregnación, tamaño de la fruta, temperatura de la solución y tiempo de proceso. Si es el tamaño de la i-ésima capa de neuronas ocultas o de procesamiento de la información hasta la n-ésima capa de neuronas ocultas S_n. A partir de los datos experimentales se ensayaron diversas arquitecturas de red, por cuanto no existe una regla pre-establecida para determinar el número de capas ocultas de neuronas de procesamiento ni el número de neuronas que constituyen dichas capas (Peters et al., 1996; Mittal y Zhang, 2000; Afagui et al., 2001). F_i representa las funciones de transferencia entre capas de la arquitectura neuronal hasta la n-ésima capa de neuronas ocultas F_n y los pares (w1,b1), (w2, b2), (w3, b3) son los pesos de conexión y términos de tendencia entre la capa de neuronas de entrada y la primera capa de neuronas ocultas, entre la primera capa de neuronas ocultas y la segunda, y entre la segunda capa de neuronas ocultas y la capa de neuronas de salida, respectivamente. Finalmente se desarrolló un modelo compuesto por dos capas ocultas de cinco neuronas cada una.

Luego, la comunicación entre neuronas ocultas y entre estas y la capa de neuronas de salida del sistema, constituida por las variables dependientes estudiadas, se estableció mediante Fn funciones de transferencia. Luego de ensayar con varias funciones, se seleccionó la logarítmica sigmoidal para transferir la información desde la primera capa de neuronas ocultas hacia la segunda, y la función tangente hiperbólica como función de transferencia desde la segunda capa oculta hacia las neuronas de salida. La utilización de varias funciones de transferencia ha sido sugerida por algunos autores como un método coadyuvante para el aprendizaje de la red (Reed y Marks, 1999; Mittal y Zhang, 2000).

Así, el proceso de inicio generó una matriz inicial de pesos de conexión y términos de tendencia w_i y b_i, respectivamente, mediante la función de iniciación de la red de retropropagación en Matlab (initff), los cuales constituyen una medida del grado de conexión o efecto de las variables independientes o neuronas de entrada, y el objetivo a alcanzar por la red a la salida de la última capa de neuronas.

La asignación de pesos de conexión en forma aleatoria y de baja magnitud al inicio del entrenamiento tuvo por finalidad promover la ruptura de simetría en la red para así evitar la saturación de la misma. La ruptura de simetría es necesaria para que las neuronas de la capa oculta computen diferentes funciones. En el caso de una simetría perfecta, todas las neuronas tendrían el mismo vector de pesos de conexión y todas las neuronas ocultas computarían una única función, comportándose como si en realidad existiera una única neurona oculta. Por otra parte, la utilización de pesos de gran magnitud en el inicio de la red proporcionaría una amplificación desproporcionada de los estímulos provenientes de la capa de neuronas de entrada, lo cual a su vez incrementaría la suma de pesos que sirve de insumo a las neuronas de procesamiento, pudiendo provocar la formación de regiones planas en la superficie del error a partir de las cuales solo podrían obtenerse derivadas muy pequeñas y la detención del proceso de aprendizaje.

Para el entrenamiento de la red se utilizó la instrucción

La función trainlm en el lenguaje de programación Matlab, entrena la red iniciada con la función initff, mediante el algoritmo de aprendizaje Levenberg-Marquardt. De esa manera, en la instrucción anterior se incorpora la matriz T, la cual está constituida por los datos experimentales de pérdida de agua y ganancia de sólidos de las frutas osmóticamente tratadas. Así, la comparación de los datos de salida de la red con el vector objetivo T permitió la generación de errores cuadráticos, utilizados por el algoritmo de aprendizaje para la actualización de los pesos de conexión (Figura 1).

Se requirió de 150 iteraciones en el entrenamiento de la red de retropropagación del error para finalmente alcanzar una sumatoria de errores cuadráticos de 1×10^-3 (Figura 2).

La factibilidad de crear y entrenar la arquitectura neuronal artificial desarrollada, para predecir los dos principales fenómenos de transferencia de masa en diversidad de alimentos de forma simultánea, es de suma importancia en el campo de la ciencia e ingeniería de alimentos por cuanto permite predecir comportamientos no experimentados durante el tratamiento osmótico de frutas, facilitando la optimización del proceso a escala industrial debido al número de variables que pueden manejarse y relacionarse simultáneamente.

Finalmente, se realizó una simulación de la red entrenada mediante la función simuff

donde las instrucciones logsig (logarítmica sigmoidal), tansig (tangente hiperbólica) y purelin (función lineal) son funciones de transferencia para la primera y segunda capa de neuronas ocultas y la capa de neuronas de salida, respectivamente. [a] representa la matriz de predicciones hechas por la red neuronal entrenada, x es una matriz conformada por los niveles de las variables independientes o neuronas de entrada considerados en el modelo y simuff es el comando de simulación en Matlab para las redes entrenadas.

En el proceso de entrenamiento, se pudo controlar el sobre-entrenamiento de la red mediante la selección apropiada de las variables tasa de aprendizaje h y momento a. Para la tasa de aprendizaje se seleccionó, a través de un proceso de ensayo y error, un valor de 0,1 (entre valores sugeridos que oscilan entre 0,05 y 0,75) y un valor de momento de 0,9 (Reed y Marks, 1999). La tasa de aprendizaje y el término de momento, se relacionan a través de una expresión conocida como tasa de aprendizaje eficiente

Así, el término de momento utilizado (relativamente grande) actuó como un amplificador de la tasa de aprendizaje moderada o relativamente pequeña, para garantizar una tasa de aprendizaje eficiente.

En la Figura 3 se observa la correspondencia entre el resto de los valores experimentales y los datos predichos. En todos los casos, el modelo neuronal logró predecir mas del 90% de la variabilidad experimental, alcanzando una magnitud de 1×10-3 en el término de error, que si bien no significa el error global mínimo de la red, sí constituye un error local mínimo de gran importancia práctica en el modelado del proceso de deshidratación osmótica. En ese sentido, la obtención de un error de aproximación en el orden antes mencionado, aunado a la factibilidad de modelar el proceso osmótico de manera simultánea para distintas frutas y condiciones de proceso a través del modelo neuronal desarrollado, lo perfila como una tecnología de amplio potencial en la industria procesadora de frutas, bien sea en las operaciones de fabricación de materias primas pre-procesadas para el desarrollo de otros productos o para su suministro a servicios de alimentación institucional.

Agradecimiento

Los autores agradecen el apoyo económico del Decanato de Investigación y Desarrollo de la Universidad Simón Bolívar.

Referencias

1. Afagui M, Ramaswamy HS, Prasher SO (2001) Thermal process calculations using artificial neural network models. Food Res. Int. 34: 55-65. [ Links ]

2. AOAC (1990) Official methods of analysis. 15a ed. Association of Official Analytical Chemists. Washington, DC, EEUU. 777 pp. [ Links ]

3. Arteaga GE, Nakai S (1993) Predicting protein functionality with artificial neural networks: foaming and emulsifying properties. J. Food Sci. 58: 1152-1156. [ Links ]

4. Bochereau L, Bourgine P, Palagos B (1992) A method for prediction by combining data analysis and neural networks: application to prediction of apple quality using near infrared spectra. J. Agr. Eng. Res. 51: 207-216.

5. Chen CR, Ramaswamy HS, Alli I (2001) Prediction of quality changes during osmo-convective drying of blueberries using neural network models for process optimization. Drying Technol. 19: 507-523. [ Links ]

6. Eerikäinen T, Linko P, Linko S, Siimes T, Zhu Y-H (1993) Fuzzy logic and neural network applications in food science and technology. Trends Food Sci. Technol. 4: 237-242. [ Links ]

7. Gerbi V, Zeppa G, Beltramo R, Carnacini A, Antonelli A (1998) Characterization of white vinegars of different sources with artificial neural networks. J. Sci. Food Agric. 78: 417-422. [ Links ]

8. Horimoto Y, Durance T, Nakai S, Lukow OM (1995) Neural networks vs principal component regression for prediction of wheat flour loaf volume in baking tests. J. Food Sci. 60: 429-433. [ Links ]

9. Millán FR, Roa V, Tapia M (2001) Modelado matemático de isotermas de adsorción de humedad en alimentos usando redes neuronales artificiales. Interciencia 26: 190-194. [ Links ]

10. Mittal GS, Zhang J (2000) Prediction of freezing time for food products using artificial neural network. Food Res. Int. 33: 557-562. [ Links ]

11. Ni H, Gunarasekaran S (1998) Food quality prediction with neural networks. Food Technol. 52: 60-65. [ Links ]

12. Panagiotou NM, Karathanos VT, Maroullis ZB (1998) Mass transfer modelling of the osmotic dehydration of some fruits. Int J Food Sci Technol. 33: 267-284. [ Links ]

13. Peters G, Morrissey MT, Sylvia G, Bolte J (1996) Linear regression, neural network and induction analysis to determine harvesting and processing effects on surimi quality. J. Food Sci. 61: 876-880. [ Links ]

14. Reed RD, Marks IIRJ (1999) Neural Smithing. Supervised Learning in Feedforward Artificial Neural Networks. Massachusetts Institute of Technology Press. Cambridge, MA. EEUU. pp. 49-67. [ Links ]