Introducción
El desarrollo ágil se ha convertido en una metodología fundamental para la entrega rápida y efectiva de proyectos en diferentes industrias, especialmente en los proyectos de e-commerce ya que según eCommerce-Worldwide, entre el 50% - 70% de todos los proyectos de e-commerce fracasan. En este escenario los LLMs brindan un aporte significativo en un mercado tan cambiante y dinámico.
Por ello el objetivo de este estudio es evaluar como los diferentes LLMs, pueden mejorar el desarrollo ágil de proyectos de e-commerce; llevando para ello una comparación de 4 herramientas de Inteligencia Artificial Generativa (GenAI) como Sage, Bard, ChatGPT, Claude-Instant.
Los análisis propuestos por los 4 modelos de LLMs permitió identificar que gestiones son las más importantes y que contribuyeron a la toma de decisiones, brindando a los equipos de desarrollo una guía valiosa y práctica para la ejecución exitosa del proyecto.
A lo largo de este estudio, se utilizarán métricas y criterios de evaluación específicos para comparar los diferentes LLMs. Además, se considerarán casos de estudio reales de implementaciones de desarrollo ágil en comercio electrónico para enriquecer el análisis.
Al finalizar este estudio, se espera que los resultados y conclusiones obtenidos brinden a los profesionales de la gestión de proyectos y a las organizaciones dedicadas al desarrollo e implementación de proyectos de e-commerce una base sólida para tomar decisiones informadas sobre la elección y utilización de LLMs en el ámbito ágil.
Desarrollo
Inteligencia artificial (AI)
Aspectos generales
En la humanidad atravesamos la llegada de una cuarta revolución industrial, que tiene la tecnología inteligente como herramienta de éxito sin precedentes. La incorporación de desarrollos como la inteligencia artificial, Internet de las cosas, conectividad 5G, bioingeniería, etc., avanzan a gran velocidad en los diferentes ámbitos de la sociedad. Esta transformación sin precedentes está rediseñando desde cómo vivimos, trabajamos y nos relacionamos, hasta el infinito de oportunidades y retos que se nos presentan.
Alan Turing preguntaba en 1950: “¿Pueden las máquinas pensar?”. objetivo que se propondrá más adelante. Como relata John McCarthy en 1956, la informática se ocupa de que las computadoras se comporten como humanos. Para Marvin Minsky, en "la IA es la ciencia de hacer máquinas que hagan cosas que requiere inteligencia como si las hicieren los hombres" (Fajardo, 2021).
¿Qué es la inteligencia?
La noción tradicional de la inteligencia, entendida como una capacidad que se puede medir o un conjunto de habilidades específicas, había llevado a la mayoría de los planteamientos clásicos a considerar la inteligencia asociada sólo a las habilidades cognitivas. Pero en oposición a estos planteamientos que podríamos calificar de reduccionistas, Gardner nos anuncia una propuesta diferente y, hasta cierto punto, difícil de aceptar, que considera las inteligencias múltiples, lo que nos lleva a revisar la inteligencia más allá de los aspectos cognitivos.
Según Gardner, la inteligencia no puede ser descifrada sólo tomando en cuenta una única dimensión. Todo lo contrario, él propone que las inteligencias múltiples van acompañadas también de las características y prestaciones de cada una de ellas. Las inteligencias son las que poseen también no sólo aspectos cognitivos como el razonamiento lógico o matemático, sino también habilidades emocionales, sociales, creativas o físicas.
Según Gardner, las capacidades cognitivas de los humanos las clasifica en ocho tipos de inteligencias diferentes, éstas son; la inteligencia verbal-lingüística, la lógico-matemática, la corporal cinestésica, la visual-espacial, la musical-rítmica, la interpersonal-social, la intrapersonal-introspectiva, y, posterior a estos percibimientos añadió una octava para denominarla la inteligencia naturalista (Mercadé, 2019).
¿Qué es la inteligencia artificial?
La inteligencia artificial se plantea también como una posible manera de replicar la inteligencia humana, y construir sistemas que fueran en parte autónomos, que fuesen capaces de aprender de las experiencias pasadas de forma autónoma y que pudieran ir mejorando, de algún modo, en el tiempo.
John McCarthy, un gran científico de la computación, fue uno de los precursores en acuñar el término inteligencia artificial y un autor que dilató a través de la conferencia de Dartmouth en 1956, los fundamentos para su disciplina y de este modo fue una de las personas que dio pie a este tipo de estudios en la inteligencia humana. La investigación de la inteligencia artificial se ha convertido en la actualidad en un campo interdisciplinario, donde deben abocarse una serie de campos (Sanabria et al., 2023).
La inteligencia artificial está en evolución, ya no en términos tecnológicos sino en la utilización de esta tecnología en diversas esferas; se convirtió en un campo que permite realizar ciertas actividades, categorizables desde la industria, pasando por la investigación científica. Pero también va ofreciéndonos problemas éticos y sociales cuales la toma de decisiones éticas, los problemas de las arenas como la confidencialidad y privacidad de los posibles datos y el impacto en el empleo (Dharma et al., 2023).
Relación existente de la IA, Aprendizaje máquina y Aprendizaje profundo
Se dice que la inteligencia artificial es el área general que contiene tanto el aprendizaje de máquina como el aprendizaje profundo, ya que el aprendizaje profundo está dentro del aprendizaje de máquina y este se encuentra dentro de la inteligencia artificial (Haleem, 2023). Tal y como se observa en la Figura 1, la relación que existe entre las mismas es la siguiente:
El aprendizaje de máquina es simplemente una subdisciplina del área de la inteligencia artificial que tiene como objetivo elaborar algoritmos y modelos que permiten a las computadoras realizar procesos de aprendizaje que producen decisiones basadas en datos, pero sin ser -dichas computadoras- programadas de manera explícita. Este aprendizaje de máquina es el área dedicada a cómo las máquinas pueden aprender y adquirir talento a partir de la experiencia, así como a partir del procesamiento de grandes conjuntos de datos.
El aprendizaje profundo es una subdisciplina específica del aprendizaje de máquina, el cual tiene como referente el funcionamiento del cerebro de los seres humanos y que utiliza principalmente redes neuronales de estructuras complejas. En este caso, el aprendizaje profundo utiliza múltiples capas de redes neuronales para procesar datos complejos, como son las imágenes, los sonidos o los textos.
El aprendizaje profundo trata de obtener características de los datos, así como patrones significativos en ellos, que posteriormente son utilizados para el reconocimiento de imágenes, para el procesamiento de lenguajes naturales, así como para el procesamiento del reconocimiento de voz, etc. (Dharma, 2023).
Para resumirlo sería posible afirmar que el machine learning es un elemento esencial de la AI que se encarga del desarrollo de algoritmos de machine learning, pero el deep learning sería una técnica concreta en el interior del machine learning que se basa en redes neuronales profundas para modelar y hacer interpreta los datos complejos.
Tres principales escuelas de pensamiento
Simbolismo
El proceso cognitivo de los humanos es el proceso de inferencia y operación de varios símbolos. Un ser humano es un sistema de símbolos físicos, al igual que una computadora. Las computadoras, por lo tanto, pueden ser utilizadas para tratar de simular el comportamiento inteligente de los humanos.
El núcleo de la AI reside en la representación del conocimiento, la inferencia del conocimiento y la aplicación del conocimiento. El conocimiento y los conceptos pueden ser representados con símbolos. La cognición es el proceso de procesamiento de símbolos mientras que la inferencia hace referencia al proceso de resolución de problemas utilizando el conocimiento heurístico y la búsqueda. Representante del simbolismo: inferencia, incluida la inferencia simbólica y la inferencia automática.
Conexionismo
La base del pensamiento son las neuronas más que el proceso de procesamiento de símbolos. Los cerebros humanos varían de las computadoras. Se propone un modo de trabajo de computadora basado en conexiones para reemplazar el modo de trabajo de computadora basado en una operación simbólica. Representan el conexionismo, las redes neuronales y el aprendizaje profundo.
Comportamiento
La inteligencia depende de la percepción y la acción. Se propone el modo de percepción-acción del comportamiento inteligente. La inteligencia no requiere conocimiento, representación o inferencia.
La IA puede evolucionar como la inteligencia humana. El comportamiento inteligente sólo puede demostrarse en el mundo real a través de la interacción constante con el entorno circundante. Representante del comportamiento: Control del comportamiento, adaptación y computación evolutiva.
Tipos de inteligencia artificial
IA Fuerte
La visión de IA fuerte sostiene que es posible crear máquinas inteligentes que realmente puedan razonar y resolver problemas. Tales máquinas se consideran conscientes y autoconscientes, pueden pensar independientemente sobre los problemas y buscar soluciones óptimas a los problemas, tienen su propio sistema de valores y visiones del mundo, y tienen todos los mismos instintos que los seres vivos, tales como las necesidades de supervivencia y seguridad. Puede ser considerado como una nueva civilización en cierto sentido.
IA Débil
La visión de la IA débil sostiene que las máquinas inteligentes realmente no pueden razonar y resolver problemas. Estas máquinas sólo parecen inteligentes, pero no tienen inteligencia real o autoconciencia.
LLM
Un LLM (Large Language Model por sus siglas en inglés) es un tipo de modelo de lenguaje de inteligencia artificial diseñado para comprender y generar texto en lenguaje humano (Shanahan, 2023). Utiliza técnicas de aprendizaje automático para aprender patrones y estructuras del lenguaje a partir de grandes cantidades de datos de entrenamiento, de aquí su inicial L por large.
MLL. Revisión de modelos de lenguaje avanzados
Las metodologías de tipo ágil para la gestión de proyectos de software han venido constituyendo un método popular con centro en la colaboración, en la flexibilidad y en la adaptación continua, ya que permiten a los equipos de desarrollo reaccionar de forma efectiva a los cambios y ofrecer productos de calidad, incluso con un tiempo de entrega reducido. En este caso, los LLM (Lenguajes de Modelado de Lógica) son un componente importante y permiten proporcionar un marco para la especificación precisa de los requisitos, el diseño del sistema y la verificación de propiedades críticas y, en este sentido, su implicación en la celebración de las metodologías ágiles es importante (Tikayat, 2023).
MLL más usados
A continuación, mostramos una explicación detallada de cada modelo de lenguaje en un punto aparte, incluyendo su mecanismo, arquitectura, modelo estadístico, aplicaciones destacadas y casos de éxito conocidos:
BERT:
Se trata de un tipo de modelo de lenguaje, y se propone una arquitectura de Transformer y un entrenamiento pre-entrenado y luego ajustado. Este modelo puede tener la capacidad de entender el contexto de una palabra a partir de la información que proviene de las palabras precedentes y siguientes a lo largo de una oración.
Así funciona: BERT utiliza la arquitectura de Transformer y un entrenamiento pre-entrenado y después afín; la principal singularidad de BERT es que puede comprender el contexto de la palabra mediante el hecho de que tiene en cuenta las palabras anteriores y las palabras siguientes a lo largo de una oración.
Arquitectura: BERT utiliza una red neuronal basada en la arquitectura de Transformer, con lo que es capaz de atender relaciones a distancia en el texto.
Modelos estadísticos: El sistema de BERT es capaz de utilizar aprendizaje a partir de la atención y procedimientos de entrenamiento no supervisados para poder generar representaciones de palabras contextualizadas.
Aplicaciones más exitosas: BERT se implementó para tareas de procesamiento del lenguaje natural tales como búsquedas semánticas, preguntas y respuestas, análisis de sentimientos o clasificación de textos, entre otros.
Casos de éxito: BERT ha utilizado en muchas aplicaciones y también ha tenido éxito en competiciones como por ejemplo SQuAD donde los resultados de BERT mejoraron el rendimiento humano en la tarea de preguntas y respuestas.
GPT-3:
Modelo de lenguaje que se entrena utilizando machine learning y grandes conjuntos de datos en formato textual. Es capaz de generar texto coherente y relevante en complemento a una entrada de texto dada.
Mecanismo: GPT-3 es un modelo de lenguaje que se entrena utilizando deep learning y grandes conjuntos de datos textuales, capaz de generar texto coherente y relevante en complemento a una entrada de texto dada.
Estructura: GPT-3 se basa en una arquitectura Transformer para procesar y comprender texto en base a palabras o incluso oraciones completas.
Modelado estadístico: GPT-3 utiliza un modelo de aprendizaje no supervisado a fin de describir patrones y estructuras que existen en el conjunto de datos de entrenamiento usado, capaz de generar texto de manera generativa.
Aplicaciones destacadas: GPT-3 ha sido utilizado en aplicaciones como traducción automática, asistencia al cliente utilizando chatbots o generación de contenido como escritura asistida.
Casos de éxito: GPT-3 ha evidenciado su capacidad de generar texto de forma relevante en casos como, por ejemplo, generación de noticias y artículos o generación de diálogos realistas en chatbots.
XLNet:
Modelo de Lenguaje: Este es un modelo de lenguaje que resuelve el problema de la bidireccionalidad de otros modelos al desordenar el texto de entrada y permitir que el modelo aprenda a predecir cualquier palabra en cualquier lugar del texto. Utiliza una arquitectura tipo Transformer y un enfoque de aprendizaje no supervisado.
Mecanismo: XLNet es un modelo de lenguaje que corrige el modelo de lenguaje a través de la permutación del texto de entrada y permite que el modelo aprenda a predecir las palabras en cualquier posición, evitando la limitación que presenta la bidireccionalidad en otros modelos.
Arquitectura: XLNet utiliza una arquitectura de tipo Transformer y una técnica conocida como la permutación de tokens para poder modelar la dependencia existente entre todas las posiciones del texto.
Modelado estadístico: XLNet adopta un enfoque de aprendizaje no supervisado y un método de máxima verosimilitud para poder hacer predicción de las palabras desordenadas en el texto de entrada.
Casos de uso: XLNet se ha utilizado en tareas del procesamiento del lenguaje natural.
BARD:
BARD LLM es un método de entrenamiento para los modelos de lenguaje que establece un mecanismo, que también es conocido como la destilación de conocimiento bidireccional. Este modelo se apoya en la arquitectura de las Redes Neuronales de tipo Transformer y se entrena de forma previa a la cual se le efectúa su ajuste. El modelo BARD LLM presenta la capacidad de familiarizarse con el contexto de una palabra considerando información de las palabras anteriores o igualmente de las posteriores a ella en una oración determinada.
Al igual que BERT, BARD LLM también explora en su seno una red neuronal que se basa en la arquitectura de la red de tipo Transformer, esto lo que hace es que permite captar relaciones en el texto incluso aunque estén a larga distancia. Este modelo se apoya en técnicas de aprendizaje basado en la atención y aprendizaje no supervisado para generar representaciones de las palabras que estén bien contextualizadas.
Se aplica a diferentes tareas de procesamiento del lenguaje natural como preguntas y respuestas, la clasificación del texto, el análisis de sentimientos o bien la búsqueda semántica. En las competencias ha tenido resultados destacados, donde incluso ha alcanzado rendimientos en el análisis de preguntas y respuestas superiores a los alcanzados por humanos en los mismos ángulos.
ELMo (Embeddings from Language Models)
Utiliza representaciones contextuales para capturar el significado de una palabra en función de su contexto en una oración o un texto más largo. Se basa en redes neuronales recurrentes bidireccionales para generar representaciones contextuales de palabras.
Mecanismo: ELMo utiliza representaciones contextuales para capturar el significado de una palabra en función de su contexto en una oración o un texto más largo. Incorpora información contextualizada para generar vectores de palabras.
Arquitectura: ELMo utiliza una red de redes neuronales recurrentes bidireccionales para generar representaciones contextuales de palabras.
Modelo estadístico: ELMo utiliza aprendizaje supervisado y se entrena para generar vectores de palabras que capturan el significado y la variabilidad contextual de las palabras.
Aplicaciones destacadas: ELMo se ha utilizado en análisis de discurso, procesamiento del lenguaje en entornos médicos y otras tareas donde se tiene que hacer un mejor entendimiento del significado contextual de las palabras.
Casos de éxito: ELMo ha sido utilizado con éxito para tareas de procesamiento del lenguaje natural como la resolución de correferencia y la detección de intenciones en diálogos.
Transformer-XL:
Es un modelo de lenguaje basado de nuevo en la arquitectura Transformer en el que se incorpora una memoria relativa para capturar relaciones de largo alcance y mantener información contextual a largo plazo.
Mecanismo: Transformer-XL aborda la limitación de la longitud de contexto con la incorporación de la memoria para recordar y utilizar contextos que son más largos.
Arquitectura: Transformer-XL se basa en Transformer y con la memoria relativa permite capturar relaciones de largo alcance en el texto, así como permitir mantener información contextual a largo plazo.
Modelo estadístico: Transformer-XL utiliza el aprendizaje no supervisado y la máxima verosimilitud para entrenar el modelo y generar representaciones contextualizadas de palabras.
Aplicaciones: Transformer-XL ha sido utilizado en tareas como Language modeling Long-Range, la generación de código y la lectura contextual.
Casos de éxito: Transformer-XL ha demostrado su potencial en la generación de texto coherente y en la comprensión de relaciones de largo alcance, aunque no hay casos exitosos.
SAGE:
El SAGE LLM se entiende como "Semi-supervised Adaptive Generative Encoder Language Model", es un modelo que fusiona técnicas de semi-supervisión, generación de lenguaje y codificación adaptativa. A continuación, se presenta un resumen de SAGE LLM:
Mecanismo: El SAGE LLM aplica una arquitectura de modelo de lenguaje basada en la generación de texto y aprendizaje semi-supervisado. Se aprecian técnicas de codificación adaptativa y generación de lenguaje para hacer la comprensión y la explicación del texto coherente.
Aprendizaje semisupervisado, es decir, el SAGE LLM utiliza ambos tipos de datos, los datos etiquetados y los no etiquetados para el entrenamiento. De esta forma se lleva a cabo una mejor captura de la diversidad y riqueza del lenguaje.
Generación de lenguaje, es decir, el SAGE LLM genera texto de forma coherente y verosímil usando técnicas de generación de lenguaje, o lo que es lo mismo, genera texto que cumple con las convenciones y características del lenguaje humano.
Codificación adaptativa, es decir, el SAGE LLM utiliza una técnica denominada codificación adaptativa, que permite que un modelo responda y se adapte a diferentes contextos y estilos de lenguaje, permitiendo generar/explicar y/o comprender texto adaptado a la forma de hablar y a la intención deseadas.
Claude LLM
Claude LLM es un modelo de lenguaje diseñado por OpenAI. Utiliza arquitectura Transformer y utiliza un enfoque de aprendizaje automático supervisado para generar representaciones de texto contextualizadas. Claude LLM se entrena con alto volumen de texto y es capaz de comprender y producir texto.
Este modelo de lenguaje se usa en aplicaciones de generación de texto, traducción automática, análisis de sentimientos, y más. Claude LLM se ha distinguido por su capacidad de capturar relaciones de largo plazo en el texto y de producir resultados de alta calidad en tareas del lenguaje
Tabla 1 Modelos de Lenguaje
| Modelo | Creador | Fecha Creación | Aplicaciones | Casos de Éxito |
|---|---|---|---|---|
| BERT | Google AI | 2018 | Preguntas y respuestas, análisis de sentimientos, clasificación de texto, búsqueda semántica | Superó el desempeño humano en SQuAD (análisis de preguntas y respuestas) |
| GPT-3 | OpenAI | 2020 | Traducción automática, asistencia al cliente mediante chatbots, generación de contenido | Ampliamente utilizado en generación de texto y casos de éxito en generación de noticias y diálogos realistas |
| XLNet | Google AI | 2019 | Resumen de texto, traducción automática, análisis de sentimientos | Mejoras en tareas de procesamiento del lenguaje natural, sin casos de éxito específicos conocidos |
| ELMo | Allen Institute | 2018 | Análisis de discurso, procesamiento del lenguaje en entornos médicos | Aplicaciones exitosas en resolución de correferencia y detección de intenciones en diálogos |
| Transformer-XL | Google AI | 2019 | Modelado de lenguaje a largo plazo, generación de código, comprensión de texto en contextos amplios | Mejorar la generación de texto y comprensión de relaciones a largo plazo en el texto |
| Sage | Google AI | 2022 | Traducción de idiomas, escritura creativa, escritura de diferentes tipos de contenido creativo, respuesta a preguntas de manera informativa | Respuestas precisas, consistentes y relevantes a preguntas abiertas, desafiantes y extrañas. |
| Bard | Google AI | 2023 | Traducción de idiomas, escritura creativa, escritura de diferentes tipos de contenido creativo, respuesta a preguntas de manera informativa | Respuestas precisas, consistentes y relevantes a preguntas abiertas, desafiantes y extrañas. |
| Claude-Instant | OpenAI | 2023 | Traducción de idiomas, escritura creativa, escritura de diferentes tipos de contenido creativo, respuesta a preguntas de manera informativa | Respuestas precisas, consistentes y relevantes a preguntas abiertas, desafiantes y extrañas. |
Posibles aplicaciones
Los LLM más empleados en la aplicación de metodologías ágiles incluyen:
Permiten especificar de manera formal los requisitos y el diseño de sistemas. Proporcionan notaciones gráficas y semánticas precisas que ayudan a los equipos ágiles a comunicarse y colaborar de manera efectiva en la definición y el refinamiento de los requisitos del proyecto.
Lenguajes de modelado de procesos: Estos lenguajes, como el BPMN y el Event-driven Process Chain (EPC), permiten modelar y analizar los procesos de negocio dentro de un proyecto ágil. Facilitan la visualización y comprensión de los flujos de trabajo, la identificación de dependencias y cuellos de botella, y la optimización de los procesos.
Lenguajes de establecimiento de propiedades: Este tipo de lenguajes (por ejemplo, el Lenguaje para Especificar Modelos (MSL) y el Lenguaje para Especificar y Verificar Modelos (MVL)), son lenguajes que se utilizan para establecer propiedades del sistema que sean relevantes o críticas, como por ejemplo la seguridad, la integridad, el rendimiento, etc. Aceptan la posibilidad de hacer formales verificaciones y analizar los modelos para asegurar que el sistema concreto cumpla con estas propiedades en todas las etapas del desarrollo.
Prompt
Un Prompt se puede entender como una breve unidad de texto que es visualizada en pantalla de nuestro ordenador, en el instante en el que un usuario de un equipo abre una terminal o consola de su ordenador.
A efectos de procesamiento del lenguaje natural un prompt tendrá la finalidad de ayudar a guiar al modelo de tal forma que puede ayudar al inicio de la generación de texto o bien al inicio de la realización de una tarea determinada. En ese sentido el prompt puede ser la formulación de una frase completa, una oración incompleta o incluso una palabra o frase muy corta que se usa como punto de partida o inicio para la generación de texto (Wang et al., 2023).
Gestión de proyectos
La dirección de proyectos en el desarrollo de software se refiere al control, la planificación, la organización y la verificación de todas las actividades necesarias para realizar un software que va desde la idea inicial hasta su entrega final. Es una disciplina que se apoya sobre enfoques y metodologías estructuradas para conseguir que el software sea realizado con eficiencia, dentro del presupuesto, y de acuerdo con lo que se requiere por parte del cliente. En este trabajo se dan a conocer el significado de los principales conceptos de la dirección de proyectos en el desarrollo de software y algunos autores referenciados dentro de este ámbito (Mishra & Alzoubi, 2023).
La dirección de proyectos de software está constituida de diferentes fases; la primera de ellas es la definición del ámbito y de los objetivos del proyecto. Así, esta implica identificar los requisitos del software que se desea construir, determinar los recursos que son necesarios, elaborar un plan de trabajo detallado, etc. A esta fase le corresponde fijar una estructura de desglose del trabajo e incluir un plan cronológico que determine la organización del trabajo a realizar y la verificación del avance que se va logrando en el proceso del proyecto.
En la gestión de proyectos, una vez definido el plan, incluye la asignación de los recursos, la coordinación de las actividades y el seguimiento del equipo de desarrollo. Ello implica la comunicación eficaz, la gestión de riesgos y de los cambios, el seguimiento del avance del proyecto en relación a los hitos y objetivos definidos. Asimismo, la gestión de proyectos incluye la gestión de las expectativas de los grupos de interés y la resolución de conflictos, a fin de garantizar un entorno de trabajo colaborativo y productivo.
Gestión de proyectos ágil
La gestión de proyectos ágiles en el desarrollo de software es un enfoque colaborativo y flexible que se centra en la entrega de valor de manera rápida y continua. Contrariamente a los enfoques de gestión de proyectos más tradicionales, las metodologías ágiles se basan en la adaptabilidad, la colaboración y la rápida respuesta ante cambios. Este artículo explicará cuáles son los conceptos clave de la gestión de proyectos ágiles en el desarrollo de software, y al mismo tiempo, resaltará ciertas referencias para complementar este campo de conocimiento (Marnada et al., 2021).
La gestión de proyectos ágiles se fundamenta en cuatro valores básicos y doce principios que se establecen en el Manifiesto Ágil, los cuales propician la adecuada comunicación cercana de los miembros del equipo, la correcta forma de colaborar con los stakeholders y la recepción constante y rápida ante cambios. Además, los proyectos ágiles son llevados a cabo en iteraciones cortas y con rango predefinido, es decir, en sprints, donde se planifican, desarrollan y prueban incrementos de software que son funcionales.
En el ámbito de la gestión de proyectos ágiles se utilizan distintas metodologías, pero las más relevantes son Scrum y Kanban. Scrum es una metodología basada en equipos autoorganizados que trabajan en sprints y se apoyan en reuniones diarias de seguimiento, revisión y retrospectiva para mejorar el proceso. En cambio, Kanban es una metodología más sencilla en la que se visualiza el flujo de trabajo en un tablero y se limita el trabajo en curso para facilitar la mejora de la eficiencia (Kadenic et al., 2023).
Algunos de los elementos clave de la gestión de proyectos ágiles incluye la priorización de los ítems del backlog en función del valor de negocio, las entregas frecuentes de incrementos de software funcional, las retroalimentaciones constantes desde el lado de los stakeholders así como la mejora continua del proceso. La comunicación y la coordinación son básicas en el éxito de los proyectos ágiles, ya que potencian las decisiones conjuntas y aceleran la resolución de los problemas.
E-Commerce
El comercio electrónico o e-commerce, ha crecido en gran medida durante las últimas décadas de la centuria XX. El comercio electrónico o e-commerce, de forma análoga a la evolución de la tecnología digital, el Internet y los dispositivos móviles, se ha definido como la forma que engloba la definición y desarrollo de las transacciones comerciales a través del medio en línea. Entendemos por comercio electrónico la forma de efectuar la compra de productos y de servicios de manera online, de manera que puedan efectuarse pagos electrónicos por una gran variedad de opciones de compra de bienes y de servicios desde el hogar de cada consumidor.
El e-commerce ha transformado la forma de hacer negocios de las empresas con respecto a sus consumidores finales, así como de los consumidores finales que efectúan las compras. Su condición es importante porque permite la explotación de los mercados geográficos, controla los costes, las barreras de la entrada, etc., la accesibilidad y la conveniencia de los consumidores finales, etc. También el crecimiento del e-commerce es sobresaliente, pues las cifras de ventas por Internet no cesan de aumentar a escala mundial.
El comercio electrónico ha modificado las maneras en las que las empresas se comunican con los consumidores, así como la manera en la que los consumidores efectúan sus compras. Lo importante del comercio electrónico viene dado por varios motivos: la extensión de los mercados geográficos, la reducción de costes y de barreras de entrada; la facilitación del acceso y el confort para los consumidores, entre otros muchos. Por otro lado, el crecimiento del comercio electrónico es altísimo, con cifras de ventas que se van incrementando de forma continua a nivel internacional.
Tendencias del E-commerce
Crecimiento Global del E-commerce
El fenómeno del comercio electrónico ha emergido de manera continuada en todo el mundo durante los últimos años. Las cifras de ventas online han llegado a ser cada vez más considerables y, por otro lado, hay un número en creciente aumento de consumidores que se decantan por la realización de compras online por medio del comercio electrónico. A continuación, se describirán las cifras estadísticas del comercio electrónico y las previsiones sobre el crecimiento que previsiblemente tendrá el mismo, así como su impacto a nivel macroeconómico, así como a nivel del funcionamiento de las empresas.
Mobile Commerce (M-commerce)
El M-commerce o comercio basado en móviles, se ha erguido como una tendencia muy significativa dentro del e-commerce. Por la creciente cantidad de usuarios UI (interfaz usuario) móviles, los consumidores pueden ejercer el derecho a comprar en línea valiéndose de sus smartphones o tablets. Para poder ofrecer experiencias de compra móvil optimizadas, se estudiará de qué manera se ha transformado la relación de los consumidores con el e-commerce y, por otro lado, la manera en que los comercios han tenido que calibrar la forma de comercializar sus productos.
Comercio Social
El comercio en red se manifiesta como la combinación de las plataformas de comercio electrónico en red dentro de las plataformas de e-commerce. En el comercio electrónico los consumidores, ya pueden descubrir productos, compartir recomendaciones o, incluso, finalizar sus pedidos. Se mostrará cómo el comercio en red ha ayudado a la relación de los consumidores al e-commerce y de qué manera las empresas pueden utilizar la red para aumentar sus ventas en línea.
E-commerce Omnicanal
El E-commerce Omnicanal alude a la integración y a la completa sincronización de los múltiples canales de venta, tanto en línea como fuera de línea. Los consumidores esperan tener una experiencia de compra digna de ser creída y coherente en todo canal vendido, lo que obliga a las compañías a integrar su plataforma online con sus tiendas y sus canales de venta. El contenido del texto considera analizar las ventajas del E-commerce Omnicanal, las desventajas y las maneras de lograrlo.
Otras Tendencias Emergentes
Junto a las tendencias previamente mencionadas encontramos también otras que emergen y que son dignas de saberlas. Incluyen el uso de IA y Machine Learning para la personalización de las experiencias de compra; la adopción de tecnologías de realidad aumentada y realidad virtual para la mejora de la visualización de los productos; la utilización de nuevas formas de pago, etcétera.
En definitiva, se analizará las tendencias más relevantes del e-commerce, desde el crecimiento global hasta la influencia del M-commerce, la conexión con el Social Commerce y la conveniencia del E-commerce Omnicanal. Conociendo las tendencias, las empresas pueden adecuarse a las oportunidades que ofrece la atmósfera del e-commerce en la que se aprecian continuos cambios.
Un Language Model (LLM) en el e-commerce es un modelo de lenguaje avanzado, que tiene un gran tamaño y se utiliza para resolver problemas que se aplican en el e-commerce. Los LLM son el modelo de AI, como en el caso de GPT-3 OpenAI, donde los modelos de AI saben entender el texto y producir textos en el lenguaje natural con alta coherencia y contexto.
En el ámbito del e-commerce, un LLM se puede aprovechar para las aplicaciones que se describen a continuación:
Generación de descripciones de productos: Los LLMs asisten en la generación de descripciones de productos en línea que sean detalladas y atractivas para los usuarios, aumentando las probabilidades de compra.
Atender preguntas y necesidades de usuarios: Un LLM puede ser entrenado para responder preguntas frecuentes de los usuarios contestando en tiempo y forma de una manera útil y precisa.
Personalización y recomendaciones: Los LLMs son capaces de descubrir patrones en datos de usuarios, en historiales de compra, o preferencias de usuarios para proporcionar recomendaciones de productos personalizados que mejoren la experiencia de compra mientras los usuarios están conformes con la recepción de las recomendaciones.
Análisis del sentimiento: Los LLMs pueden procesar opiniones de los usuarios o comentarios que los usuarios han dejado en los cuales pueden analizar el sentimiento y satisfacción de los usuarios para que las empresas sean capaces de ayudarles en la detección de potenciales áreas de mejora, o las empresas pueden tomar decisiones estratégicas.
Generación de contenido para marketing: Los LLMs pueden ayudar a generar el contenido para campañas de marketing, como pueden ser las copys de anuncios, emails promocionales, o publicaciones en las redes sociales optimizando así la comunicación entre las empresas y los usuarios.
Traducción automática: Los LLM pueden ser entrenados en varios idiomas y utilizados para traducir automáticamente descripciones de productos, preguntas de clientes y otros contenidos relevantes para el comercio electrónico, facilitando las transacciones internacionales.
Revisión de la literatura
Dentro de nuestra investigación abordamos el uso de LLM (Large Language Models) para obtener respuestas basadas en un prompt, que refiere a la entrega de un plan de proyectos ágiles para el desarrollo de un producto (Ecommerce), nos enfocamos en los LLM ya que han demostrado notables habilidades de aprendizaje y razonamiento, lo que los hace prometedores como controlador para seleccionar, sintetizar y ejecutar modelos externos para resolver tareas complejas; además el uso de LLM para solucionar problemas específicos tiene mucho aún por entregar, ya que podemos obtener mejores resultados a través de la manipulación de varios modelos expertos de dominio. Esto se propone bajo un enfoque LLM+RLTF (Reinforcement Learning from Task Feedback), que combina LLM con aprendizaje reforzado para optimizar el desempeño en la resolución de tareas (Ge et al., 2023).
En 2014 se publicó un artículo que desafiaba las ideas convencionales en el campo de la inteligencia artificial (IA) y sigue siendo innovador hasta hoy. Nos referimos a las redes generativas, las cuales para la mayoría de las personas resultan misteriosas y nos acercan al mundo de la ciencia ficción.
Estas redes tienen la capacidad de generar texto como si estuviéramos teniendo una conversación con ellas, así como también pueden crear imágenes bajo solicitud. Algunas de estas redes incluso pueden realizar ambas tareas simultáneamente (Goodfellow et al., 2014).
Estas redes generativas son enigmáticas y nos sumergen en un terreno cercano a la ciencia ficción, ya que tienen la asombrosa capacidad de producir texto que parece provenir de una conversación con ellas, así como de generar imágenes a pedido. Incluso algunas de estas redes tienen la habilidad de combinar ambas capacidades simultáneamente. A partir de octubre de 2022, ha surgido un creciente interés en estas redes generativas, especialmente en aquellas que pueden extrapolar características de los datos u objetos con los que trabajan y crear nuevos objetos similares. Ejemplos notables incluyen DALL-E 2 y chatGPT (Martínez & Bravo, s.f).
Tomamos como referencia “ChatGPT and large language model (LLM) chatbots: The current state of acceptability and a proposal for guidelines on utilization in academic medicine”, porque resumen pautas a seguir para el uso de ChatGPT/LLM en el mundo académico.
ChatGPT o LLM no deben citarse como autor en manuscritos científicos.
Si se considera el uso de ChatGPT o LLM para trabajos académicos, los autores deben tener al menos un conocimiento básico de lo que es ChatGPT o LLM.
No use ChatGPT o LLM para producir la totalidad del texto en los manuscritos; los humanos deben ser responsables del uso de ChatGPT o LLM y los contenidos creados por ChatGPT o LLM deben ser editados y verificados meticulosamente por humanos.
ChatGPT o LLM se pueden usar para editar y refinar el texto.
Cualquier uso de ChatGPT o LLM debe ser transparente y debe estar claramente descrito en los manuscritos científicos y reconocido.
Metodología
Revisión de la literatura
El diseño del prompt ha seguido la técnica Zero-Shot(0S) comprensión por cadena de conocimiento, donde no se permiten demostraciones, se le solicita al modelo que el resultado sea paso a paso y solo se le entrega una instrucción en lenguaje natural describiendo la tarea. Se seleccionó esta técnica para evitar que los modelos inclinen sus respuestas por una demostración entregada como la realizan las técnicas one-shot y few-shots, ejemplo del prompt.
Pretende ser un experto en la gestión ágil de proyectos, {construye un plan detallado fase a fase para el desarrollo de un e-commerce utilizando gestión ágil de proyectos en un periodo de tiempo de 3 meses, indicando [el monto del presupuesto en dólares, cantidad de integrantes del equipo y cómo realizar la gestión del riesgo]}.
El proceso que se usó para pedir a un Modelo de Lenguaje de Aprendizaje (MLL) que responda a nuestro requerimiento para la elaboración de un plan de gestión de un E-comerce fue el siguiente (Ver Figura 2):
-
Diseño el Prompt: utilizando la metodología Zero Shot comprensión por cadena de conocimiento.
Selección de 4 modelos de lenguaje largo (Bart, ChatGPT, SAGE, Claude-Instant).
Ejecución de prompt a cada modelo seleccionado.
Obtención de respuesta.
Análisis de las respuestas obtenidas.
-
Elaboración de preguntas para expertos.
-
Envío a los expertos para obtención de opinión valorada.
Análisis de valoraciones obtenidas.
Resultados y Discusión
Resultados
A continuación, se presenta el análisis comparativo basado en las herramientas LLM’s y expertos en la materia.
Tabla 2 Aspectos considerados al emplear LLMs en proyectos de eCommerce, primera iteración
| Aspecto | Sage | Bard | ChatGPT | Claude-Instant |
|---|---|---|---|---|
| Fases del proyecto | Planificación | Requerimientos, diseño y desarrollo | Planificación | Evaluación y definición inicial |
| Diseño | Pruebas y corrección de errores | Ejecución | Desarrollo | |
| Implementación | Implementación y pruebas de aceptación de usuario | Cierre | Pruebas, corrección de errores y lanzamiento | |
| Entrega y cierre | Explicado en sprints | |||
| Duración del proyecto | 3 meses | 3 meses | 3 meses (13 semanas) | 3 meses |
| Enfoque de gestión | Gestión ágil de proyectos | No se especifica | Gestión Ágil de Proyectos | Gestión Ágil de Proyectos |
| Presupuesto | Se estima el presupuesto y recursos necesarios | Se especifica un presupuesto de $100,000 | Se especifica un presupuesto de $80,000 | Se especifica un presupuesto de $90,000 |
| Riesgos del proyecto | Se identifican riesgos y se crea un plan de mitigación | Se mencionan algunos riesgos y estrategias de mitigación | No se especifica | No se especifica |
| Equipo del proyecto | No se especifica el equipo | Se mencionan roles como gerente de proyecto, desarrolladores, ingenieros de calidad y despliegue | Se menciona de forma resumida la conformación del equipo de proyectos. | No se especifica el equipo |
| Comunicación del proyecto | No se menciona un plan de comunicación | Se especifican métodos de comunicación con los interesados | No se menciona un plan de comunicación | No se menciona un plan de comunicación |
| Gestión de cambios | No se menciona un plan de gestión de cambios | Se mencionan procedimientos para gestionar cambios en el alcance, el cronograma o el presupuesto | No se menciona un plan de gestión de cambios | No se menciona un plan de gestión de cambios |
| Documentación del proyecto | No se menciona una lista específica de documentos | Se mencionan varios documentos que se crearán | No se menciona una lista específica de documentos | Se menciona generación de documentación para el usuario y desarrollador |
| Criterios de éxito | No se especifican criterios de éxito | Se mencionan criterios de éxito como el desarrollo dentro del presupuesto y la satisfacción del cliente | Reunirse con el cliente para la evaluación del éxito del proyecto | No se especifican criterios de éxito |
| Lecciones aprendidas | No se mencionan lecciones aprendidas | Se mencionan algunas lecciones aprendidas | Muestra un resumen para tomar en cuenta. | No se mencionan lecciones aprendidas |
Fuente: Elaboración Propia
Tabla 3 Aspectos considerados al emplear LLMs en proyectos de eCommerce, segunda iteración: Fuente: Elaboración Propia
| SAGE | Bard | ChatGPT 4.0 | Claude instant | |
|---|---|---|---|---|
| Fases del proyecto | Fases del proyecto | Inicio, diseño, desarrollo, pruebas, implementación | Inicio, planificación, desarrollo, pruebas, lanzamiento | Inicio, planificación, desarrollo, pruebas, lanzamiento |
| Duración del proyecto | Duración del proyecto | 3 meses | 3 meses | 3 meses |
| Enfoque de gestión | Enfoque de gestión | Tradicional | Ágil | Ágil |
| Presupuesto | Presupuesto | $100,000 | $180,000 | $50,000 |
| Riesgos del proyecto | Riesgos del proyecto | Cambios en los requisitos, retrasos en el desarrollo, problemas de calidad | Cambios en los requisitos, retrasos en el desarrollo, problemas de calidad | Cambios en los requisitos, retrasos en el desarrollo, problemas de calidad |
| Equipo del proyecto | Equipo del proyecto | Gerente de proyecto, desarrollador, diseñador, gerente de marketing | Gerente de proyecto, desarrollador, diseñador, gerente de marketing, QA Engineer | Gerente de proyecto, desarrollador, diseñador, gerente de marketing, QA Engineer |
| Comunicación del proyecto | Comunicación del proyecto | Reuniones semanales, tablero de proyecto, correo electrónico, Slack | Reuniones diarias, tablero de proyecto, correo electrónico, Slack | Reuniones diarias, tablero de proyecto, correo electrónico, Slack |
| Gestión de cambios | Gestión de cambios | Cambios controlados a través de un proceso formal | Cambios controlados a través de un proceso informal | Cambios controlados a través de un proceso informal |
| Documentación del proyecto | Documentación del proyecto | Documento de requisitos, plan de proyecto, plan de pruebas, plan de implementación | Documento de requisitos, plan de proyecto, plan de pruebas, plan de implementación | Documento de requisitos, plan de proyecto, plan de pruebas, plan de implementación |
| Criterios de éxito | Criterios de éxito | El sitio web de comercio electrónico se implementa a tiempo, dentro del presupuesto y cumple con los requisitos del cliente | El sitio web de comercio electrónico se implementa a tiempo, dentro del presupuesto y cumple con los requisitos del cliente | El sitio web de comercio electrónico se implementa a tiempo, dentro del presupuesto y cumple con los requisitos del cliente |
| Lecciones aprendidas | Lecciones aprendidas | El equipo debe estar preparado para cambios en los requisitos. El equipo debe usar una herramienta de gestión de proyectos para rastrear el progreso. El equipo debe comunicarse regularmente con el cliente | El equipo debe ser flexible y adaptable. El equipo debe usar una metodología de desarrollo ágil. El equipo debe realizar pruebas exhaustivas | El equipo debe ser organizado y eficiente. El equipo debe usar una herramienta de gestión de proyectos para rastrear el progreso. El equipo debe comunicarse regularmente con el cliente |
Resumen de respuestas de los expertos de acuerdo a la variable costos
Tabla 4 Resumen de respuestas de los expertos según las variables costos
| Muy Realista | Realista | Regular | Poco Realista | Muy Poco Realista | Total | |
|---|---|---|---|---|---|---|
| Sage | 2 | 3 | 0 | 0 | 0 | 5 |
| Claude | 3 | 1 | 1 | 0 | 0 | 5 |
| ChatGPT | 0 | 1 | 0 | 4 | 0 | 5 |
| Bard | 0 | 3 | 2 | 0 | 0 | 5 |
Fuente: Elaboración Propia
Tabla 5 Resumen de respuestas de los expertos según la variable de recursos/equipo de personal a utilizar
| Muy Realista | Realista | Regular | Poco Realista | Muy Poco Realista | Total | |
|---|---|---|---|---|---|---|
| Sage | 1 | 4 | 0 | 0 | 0 | 5 |
| Claude | 0 | 5 | 0 | 0 | 0 | 5 |
| ChatGPT | 4 | 1 | 0 | 0 | 0 | 5 |
| Bard | 0 | 0 | 0 | 2 | 3 | 5 |
Fuente: Elaboración propia

Fuente: Elaboración propia
Figura 4 Resumen de respuestas de acuerdo a la variable recursos / equipo
Tabla 6 Resumen de respuestas de los expertos según la variable de riesgo
| Muy Realista | Realista | Regular | Poco Realista | Muy Poco Realista | Total | |
|---|---|---|---|---|---|---|
| Sage | 0 | 0 | 1 | 4 | 0 | 5 |
| Claude | 0 | 0 | 0 | 0 | 5 | 5 |
| ChatGPT | 0 | 0 | 0 | 5 | 0 | 5 |
| Bard | 0 | 3 | 1 | 1 | 0 | 5 |
Fuente: Elaboración propia
Discusión
De la comparación de las 2 iteraciones podemos obtener las siguientes discusiones.
Los modelos LLM mencionan la aplicación de metodología scrum para el desarrollo de Ecommerce, ya que es la más utilizada en proyectos ágiles.
Los modelos presentan presupuestos similares, en promedio $ 90,000 dólares americanos para la ejecución del proyecto.
Los modelos presentan que la documentación del proyecto es importante en el desarrollo del trabajo.
Los modelos presentan información del éxito del proyecto, mencionan que el cliente tiene un papel importante en esta validación.
Los cuatro planes son similares en términos de alcance, duración y presupuesto.
Los cuatro planes difieren en su enfoque de gestión, equipo, comunicación, gestión de cambios, documentación y criterios de éxito.
El plan de Sage es el más tradicional, mientras que el plan de ChatGPT 4.0 es el más ágil. El plan de Bard es una combinación de los dos enfoques.
El plan de Sage es probablemente el más adecuado para proyectos que tienen requisitos bien definidos y un cronograma fijo.
El plan de ChatGPT 4.0 es probablemente el más adecuado para proyectos que tienen requisitos cambiantes y un cronograma flexible.
El plan de Bard es probablemente el más adecuado para proyectos que tienen un equilibrio entre requisitos bien definidos y cambiantes, y un cronograma fijo y flexible.
Es importante elegir el plan de gestión de proyectos adecuado para el proyecto específico. Eligiendo el plan correcto, se pueden aumentar las posibilidades de éxito del proyecto.
Conclusiones
La GenAI Sage entrega respuestas más realistas sobre los importes que se deben considerar para realizar un proyecto de ecommerce en 3 meses aplicando metodología ágil, mientras que el 80% de los encuestados considera que la herramienta IA ChatGPT entrega valores poco realistas cuando fue consultada.
La GenAI ChatGPT entrega respuestas realistas y muy realistas sobre los recursos que se deben considerar para realizar un proyecto de ecommerce en 3 meses aplicando metodología ágil, mientras que la herramienta IA Bard entrega valores poco realistas y muy poco realistas cuando fue consultada bajo esta variable. Del mismo modo los expertos consideran en un 100% que la herramienta IA Claude entrega información realista de los recursos que se deben utilizar para desarrollar el trabajo.
Podemos mencionar que la mayoría de expertos no encuentra información realista sobre los riesgos del proyecto entregada por las herramientas GenAI, solo la GenAI Bard tiene un 60% de expertos que concuerdan en que se entregó solo información realista para la gestión del proyecto bajo metodología ágil.


















