SciELO - Scientific Electronic Library Online

 
vol.29 número2Experimentación y prueba: Dos Dimensiones de las Matemáticas desde la Escuela PrimariaLínea de investigación conocimiento e investigación (LICOIN) índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Paradígma

versión impresa ISSN 1011-2251

Paradìgma v.9 n.2 Maracay dic. 2008

 

Errores y dificultades en la resolucion de problemas verbales inherentes al teorema de bayes: Un Caso con Futuros Profesores de Matemática

Nelly A. León Gómez

Profesora de la Universidad Pedagógica Experimental Libertador, Núcleo Maturín. Venezuela Magister en Estadística Aplicada por la Universidad de Pittsburgh Magister en Educación Mención Administración de la Educación Superior. Líneas de Investigación: Problemática de la Enseñanza de la Matemática Coordinadora del Núcleo de Investigación de Educación Matemática (NIEMAT) nellyleong@hotmail.com

RESUMEN

Como parte de su formación académica, los estudiantes de Matemática de la Universidad Pedagógica Experimental Libertador (UPEL) en Maturín, Venezuela, deben cursar la asignatura  Probabilidad y Estadística Inferencial,  ubicada en el séptimo semestre de la carrera, la cual, según investigaciones previas, es una de las que presenta mayor dificultad para los alumnos, quienes manifiestan tener limitaciones en la comprensión de los enunciados de los problemas, especialmente los relativos al Teorema de Bayes, debido, entre otras razones, a la forma verbal en que están expresados y a la cantidad de datos y condiciones involucradas en los mismos. El docente es investigador y profesor del curso y los 20 estudiantes inscritos son sujetos de estudio. El propósito fue ensayar y evaluar  alternativas de instrucción que han dado buenos resultados en otros ámbitos, centradas en el uso de un  modelo particular de solución de problemas, la consideración de objetos de diversa naturaleza (como proporciones, razones y probabilidades) y el uso de diferentes estrategias de representación (como las tablas de doble entrada y los diagramas de árbol y de área). Los resultados muestran que, aún cuando se dedicó más tiempo del reglamentario a la instrucción y a la ejercitación, no se logró lo esperado en cuanto a la comprensión del tema por parte de los estudiantes; sus principales limitaciones se manifiestan en la identificación de los eventos y de sus respectivas probabilidades, en el uso de esquemas de representación y en la presencia de las falacias de la tasa base, del eje de los tiempos y de la condicional transpuesta.

Palabras clave: Teorema de Bayes, Resolución de problemas, Probabilidad condicional, Razonamiento bayesiano.

 Difficulties and mistakes solving verbal problems on  bayes´s theorem: A Case with Future MathTeachers

 ABSTRACT

As part of their academic training, math students from Universidad Pedagógica Experimental Libertador, Maturín, Venezuela, must approve a course in probability and inferential statistic (semester seven) According to previous research, this course is one of the most difficult in relation to understanding the theory and solving problems like Bayes’ theorem. Among other reasons, the difficulties are related to verbal expression, the amount of data and conditions involved. This is a qualitative interpretative case study with an orientation toward action in the classroom. The author is at the same time researcher and professor and her 20 students are subjects under study. The  purpose was to evaluate alternative  instructional strategies that have been successful in other contexts, centered in the use of a particular solving problem model, the use of different kind of objects such as frequencies, proportions, percentages and probabilities, and the use of different representation strategies like two way tables, tree  and  area diagrams. Results show that, even when it took longer time than expected, the goal was not achieved in term of students understanding of concepts and abilities for solving Bayes’ theorem problems. Their main restrictions were the identification of events and their probabilities, the use of the variety of representations and failures in reasoning about probability, such as the  bases-rate fallacy, time axis misconception and  the fallacy of the transpose conditional.

Key Words: Bayes’ theorem, Problem solving, Conditional probability, Probability reasoning.

Recibido: 15 04 2008 Aceptado: 18 09 2008

INTRODUCCIÓN

En la resolución de problemas de probabilidad, los estudiantes de Matemática en el Instituto Pedagógico de Maturín (UPEL–IPM, Venezuela) confrontan una serie de dificultades que comienzan con la traducción, al lenguaje probabilístico, de los enunciados escritos en su lengua materna (castellano),  proceso éste que implica la identificación de eventos y sus probabilidades y de las condiciones que permiten buscar respuesta(s) a la (s) pregunta(s) del problema.

Reconocer probabilidades, una tarea de por sí compleja, se dificulta aún más cuando éstas no aparecen en forma explícita sino que vienen expresadas en términos de otros elementos matemáticos tales como frecuencias, porcentajes o razones, o bien cuando se trata de eventos que están condicionados por la ocurrencia de otros sucesos, entrando así en el ámbito de lo que se conoce como la probabilidad condicional.

En este campo se ha realizado una amplia investigación, enfocada principalmente hacia la determinación de errores en el razonamiento probabilístico condicional, que conlleve a la búsqueda de alternativas para mejorar el proceso de enseñanza y aprendizaje de este tema, tan importante en la toma de decisiones en situaciones de incertidumbre que se presentan en la vida cotidiana, donde con frecuencia cualquier acontecimiento está condicionado a una serie de eventualidades que alteran las posibilidades de que éste ocurra.

En muchos casos, dado un suceso A, existe una serie de eventos Bi que pueden ocasionarlo, para los cuales se conoce la probabilidad inicial o a priori de su ocurrencia, P[Bi], pero el conocimiento de que ya  A ha sucedido modifica dichas probabilidades dando origen a lo que se llama probabilidades inversas o a posteriori, P[Bi/A], y eso es precisamente lo que atañe al razonamiento bayesiano; es decir, sabiendo que el suceso A ha ocurrido, interesa determinar cuál de las posibles causas tiene más probabilidad de haberlo originado, utilizando para ello el Teorema de Bayes.

En este artículo se presenta una experiencia de abordaje de situaciones de razonamiento bayesiano a través de la resolución de problemas como estrategia no sólo de aplicación sino más bien de acercamiento e internalización de los elementos que conducen a la aplicación de este importante teorema, destacando las dificultades más resaltantes que confrontan los estudiantes cuando se enfrentan con problemas de esta naturaleza.

EL OBJETO DE ESTUDIO

El pensum de estudio de la especialidad de Matemática en la Universidad Pedagógica  Experimental Libertador, en Maturín,  contempla un curso obligatorio de Probabilidad y Estadística Inferencial, cuya inclusión en el currículum está justificada por la pertinencia de que un profesor de Matemática, durante su formación inicial, aprenda a manejar los conocimientos básicos y desarrolle un cierto nivel de razonamiento para actuar en situaciones de incertidumbre y manejar  la información  disponible que brinda una variedad de posibilidades en la toma de decisiones apropiadas.

El curso está ubicado en el 7º semestre y tiene como prerrequisitos asignaturas del área del  Cálculo Infinitesimal, tanto en una como en varias variables, lo que indica que los participantes deben poseer los conocimientos previos requeridos para la comprensión de los temas que se tratan en dicha asignatura, entre los cuales se encuentran, en la primera unidad, los relativos a la conceptualización de la probabilidad y sus propiedades y la probabilidad condicional que abarca tres teoremas importantes: La Regla de la Multiplicación, el Teorema de la Probabilidad Total y el Teorema de Bayes.

La experiencia de la autora, como facilitadora del curso durante muchos lapsos académicos, le permite afirmar que los contenidos de esta primera unidad son de difícil comprensión por parte de los estudiantes, aún para aquellos que han obtenido altos niveles de rendimiento académico en las asignaturas vinculadas con el Cálculo Infinitesimal.  Esta evidencia se convirtió en el objeto de estudio de Ricciardi y Pérez (2006) quienes investigaron sobre los factores que influyen en la baja comprensión de los temas de probabilidad por parte de estos estudiantes, confirmando algunos resultados hallados en estudios previos, entre los que destacan:

  • Dificultad para la comprensión de los enunciados y para su traducción al lenguaje matemático y al probabilístico.
  • Escasa preparación en análisis combinatorio y falta de desarrollo del pensamiento combinatorio.
  • Concepciones de los estudiantes sobre la naturaleza del curso, quienes lo perciben como diferente al resto de las asignaturas tanto del área de Cálculo como del Álgebra, donde los ejercicios, por lo general, tienen un enunciado bastante escueto del tipo: “Determine la derivada de la siguiente función….”, “Demuestre que la siguiente estructura es un grupo abeliano”. En contraposición los estudiantes manifiestan que en probabilidad cada problema pareciera ser completamente distinto a los otros, aunque se ajuste a algunos de los modelos probabilísticos  estudiados.

Aún cuando nos ubicamos en la corriente emergente en relación con la comprensión intuitiva de los conceptos de probabilidad desde los primeros niveles educativos, igualmente pensamos que abordar problemas más complejos requiere un buen manejo de las operaciones combinatorias, más allá de la simple aplicación de fórmulas, que abarque la comprensión de situaciones de diversa naturaleza que impliquen la necesidad de contar el número de casos posibles.  Por ello, en la búsqueda de opciones a la problemática planteada, se ha hecho hincapié en el estudio del análisis combinatorio previo a la instrucción en probabilidad y se ha tratado de sistematizar el proceso de resolución de problemas siguiendo el modelo de Polya, haciendo énfasis en el paso inicial que corresponde a la comprensión del enunciado.

Cuando se trata de probabilidad condicional se presentan aún más dificultades, sobre todo para reconocer los eventos condicionado (A) y condicionante (B), y para distinguir entre P[A/B] y P[B/A].  Esto ha sido un tema ampliamente investigado, en particular lo referido a los sesgos  de razonamiento en la probabilidad condicional.

Esta rama de estudio ha sido desarrollada especialmente por Tversky y Kahneman (1982) en su libro Judgment under uncertainty: Heuristics and biases, donde muestran resultados sobre la presencia de heurísticas y sesgos en el razonamiento probabilístico, los cuales fueron reforzados por estudios posteriores llegándose a determinar las heurísticas de la representatividad y de la disponibilidad, las falacias de la conjunción, eje de los tiempos y de la tasa base, algunas de las cuales se desarrollarán más adelante.

Díaz y De la Fuente (2007), en un estudio para la validación de un cuestionario de razonamiento probabilístico  condicional presentan una visión bastante global sobre las  investigaciones más importantes referidas a la  temática, las cuales se muestran de manera resumida en el Cuadro 1.

Cuadro 1

Conclusiones de Varios Autores sobre Razonamiento Probabilística Condicional

Autor(es)

Problemática

Conclusiones

Fishben y Gazit (1964)

Tipo de muestreo

Los problemas de probabilidad son más difíciles en situaciones de muestreo sin reemplazo que en las de muestreo con reemplazo.

Tversky y Kahneman (1982)

Condicionamiento y causación

Algunas personas no distinguen entre condicionalidad y causalidad

Gras y Totohasima (1995)

Falacia del eje del tiempo

(Falk, 1989)

Creencia  que la probabilidad de un suceso no puede condicionar la de otro que haya ocurrido con anterioridad

Sánchez y Hernández (2003)

Situaciones sincrónicas y diacrónicas (Falk, 1989)

Los sujetos no perciben que las situaciones sincrónicas (secuencialidad) y las diacrónicas (simultaneidad) son formalmente equivalentes.

Sánchez (1996) Estrada, Díaz y De la Fuente (2006)

Concepto de independencia

 

Tversky y Kahneman (1982)

Falacia de la conjunción

Algunas personas creen que es más probable la intersección de dos eventos que cada una de ellas por separado.

Falk (1982)

Batanero y Sánchez (2005)

Falacia de la condicional transpuesta

Con frecuencia las personas confunden las dos probabilidades condicionales P[A/B] y P[B/A]

Lonjedo y Huerta (2004)

Gigerenzer (1994)

Ojeda (1996)

Naturaleza de los datos

Los datos en los problemas de probabilidad pueden presentarse en forma de frecuencias, porcentajes, razones o probabilidades. Se sugiere un enfoque frecuencial de la probabilidad antes que ésta se muestre de una manera formal.

Fuente: Elaborado por la autora con base en Díaz y De la Fuente (2007)

A pesar de no haber realizado investigación formal alguna sobre las situaciones problemáticas señaladas en el Cuadro 1, a través de los años hemos podido percibir la presencia de cada una de ellas en el razonamiento probabilístico de los estudiantes al seguir el curso Probabilidad y Estadística Inferencial en la UPEL-IPM, llevándonos a tenerlas presentes en el momento de la instrucción.

Entre los problemas de la probabilidad condicional, se encuentran los que tienen que ver con la determinación a posteriori de la probabilidad de uno de los sucesos Bi que condicionan un evento A, sabiendo que el mismo A ya ha ocurrido.  Este es, en esencia, el planteamiento del Teorema de Bayes.  Se trata entonces de problemas de probabilidad condicional que tienen un mayor grado de dificultad  para los estudiantes porque los enunciados son más engorrosos y por la presencia indiscutible de la falacia del eje de los tiempos que limita comprender cómo un evento que ya ocurrió pueda estar condicionado por otro que aún no lo ha hecho o que ocurre simultáneamente, siendo esta la motivación principal para la realización de esta investigación que ha tenido como propósitos:

1.      Explorar las dificultades de los estudiantes en la comprensión y resolución de problemas inherentes al Teorema de Bayes, y

2.      Ensayar estrategias que conlleven a superar las limitaciones de los alumnos en la interpretación y aplicación de dicho teorema. 

ALGUNOS ANTECEDENTES

En la realización de esta investigación hemos tomado como referencia los trabajos de Rossman y Short (1995); Lonjedo y Huerta (2005); Díaz (2007) y Díaz y De la Fuente (2006), cuyos resultados y conclusiones pasamos a comentar.

Rossman y Short (1995) señalan que en los cursos de Estadística en su país, Estados Unidos,  tan sólo se incluye una breve introducción a la probabilidad que comprende la definición clásica, unión e intersección de eventos y las reglas correspondientes a eventos independientes y mutuamente excluyentes. La probabilidad condicional y el Teorema de Bayes son temas opcionales pues no se consideran necesarios para la comprensión de los subsecuentes contenidos de estadística. Algo similar ocurre en Venezuela,  en educación superior, porque en los niveles  previos los temas referidos a probabilidad y estadística, aún estando incluidos en los contenidos programáticos, son escasamente tratados por algunos profesores (Parra, 1997, Beltrán, 1998)

Sostienen estos autores que con la utilización de estrategias apropiadas los estudiantes pueden lograr una comprensión intuitiva de esta temática y visualizar su aplicación a una serie de problemas del mundo real. Las estrategias que proponen se centran en convertir los datos del problema en frecuencias simples, partiendo de una base de 100 y organizándolos en una tabla de doble entrada donde se pueda visualizar con facilidad la restricción del espacio muestral para la determinación de las probabilidades condicionales involucradas.

La idea es partir de un problema clásico sencillo como el de la identificación del origen de un artículo defectuoso planteado por De Groot (1988), cuyo enunciado, modificándole un poco los datos, es el siguiente:

Para la fabricación de un gran lote de artículos se utilizan tres máquinas: M1, M2 y M3. Supóngase que el 60% de los artículos fueron producidos por la máquina M1, el 30% por la máquina M2 y el 10% por la máquina M3. Supóngase además que el 10% de los artículos fabricados por M1 son defectuosos, el 30% de los artículos fabricados por M2 son defectuosos y el 40% de los artículos fabricados por M3 son defectuosos. Por último, supóngase que se selecciona al azar uno de los artículos del lote y resulta ser defectuoso. ¿Cuál es la probabilidad que este artículo haya sido producido por M1?, ¿Cuál máquina es más probable que lo haya fabricado?

Rossman y Short (1995) proponen la construcción de una tabla de doble entrada con la siguiente estructura:

             

 Defectuosos       No Defectuosos

 Total fila

Máquina 1

Máquina 2

Máquina 3

 

 

Total Columna

 

 

 y una serie de preguntas dirigidas a los estudiantes para completar dicha tabla:

1.      De cada 100 artículos producidos, ¿Cuántos fueron fabricados por la máquina M1?, ¿Por M2?, ¿Por M3?.

2.      De los artículos fabricados por la máquina 1 ¿Cuántos se esperaría que fueran defectuosos?. Igual para las máquinas M2 y M3.

3.      ¿Cuántos artículos del total de 100 en la tabla son defectuosos?, ¿Cuántos son no defectuosos?

Las respuestas a las preguntas planteadas en el numeral 1 corresponden a los totales de fila; los del numeral 2, se colocan en la columna “Defectuosos” para cada máquina y permiten de una vez conocer el número de artículos no defectuosos para cada máquina.  Las respuestas a las preguntas del numeral 3 son los totales por columna.

Con los datos del problema enunciado, la tabla queda constituida de la siguiente manera: 

  

 Defectuosos       No Defectuosos

 Total fila

Máquina 1

Máquina 2

 Máquina 3

6                         54

 9                        21

 4                                6

60

30

10

Total Columna

            19                              81

 100

 Señalan los autores que, una vez construida esta tabla, los estudiantes pueden leer en ella, sin ninguna dificultad, la respuesta a la primera  pregunta del problema: del total de artículos defectuosos, ¿Qué proporción ha sido fabricada por la máquina 1?, cuya respuesta es . Igualmente se observa que, para la máquina 2 esta proporción es  y para la máquina 3 es , siendo  M2 la respuesta a la segunda pregunta del problema; es decir,  si el artículo seleccionado es defectuoso hay una mayor probabilidad que haya sido fabricado por la máquina 2.

Siguiendo este proceso, lo que se busca es que los estudiantes, intuitivamente y sin que se mencione el Teorema de Bayes, puedan en un primer momento comprender que lo que están haciendo es determinando la probabilidad a posteriori  de que un artículo, que ya se sabe que fue fabricado con defecto, provenga de una máquina en particular.  Sostienen además los autores que el análisis de un ejemplo como éste contribuye a evitar problemas vinculados con la Falacia de la Tasa Base, pues al calcular dicha probabilidad es fácil  ubicar  la base que corresponde al total de defectuosos.

Luego, a través de preguntas apropiadas el docente induce a los estudiantes a identificar los eventos y las probabilidades involucradas en el Teorema de Bayes, aún sin hacer mención a él, como por ejemplo:

- ¿Cuál es la probabilidad de que el artículo seleccionado haya sido producido por la máquina 1?, ¿Y por M2?, ¿Y por M3?:

Las proporciones entre los totales de fila y el total general (100) representan las probabilidades de los eventos Bi: “El artículo seleccionado ha sido producido por la máquina Mi”, para i = 1, 2, 3; esto es:

- ¿Cuál es la probabilidad que el artículo seleccionado sea defectuoso?:

Esta viene dada por el cociente entre el total de la columna “Defectuosos” y  el total general 100. Esto es, si A denota el evento “El artículo seleccionado es defectuoso”, entonces

- Si el artículo fue producido por la máquina 2, ¿Cuál es la probabilidad que sea defectuoso?

Esto se traduce en una probabilidad condicional: P[A/B2] y esta viene dada por el cociente entre el valor de la casilla Máquina 2 – Defectuoso y el total de fila para la Máquina 2; esto es: .

Con estos valores y aplicando la definición de probabilidad condicional, se calcula la probabilidad que se desea conocer:

Finalmente, podrá el docente proceder a formalizar el Teorema  y hará referencia al Teorema de la Probabilidad Total, aplicable en el cálculo de la probabilidad que aparece en el denominador de la Fórmula de Bayes. 

Las investigaciones de Lonjedo y Huerta (2005) se centran en la naturaleza de las cantidades presentes en los problemas de probabilidad condicional y su influencia en la resolución de tales problemas. Señalan que los datos pueden venir expresados en términos de probabilidades, frecuencias o razones.

Si los datos corresponden a probabilidades, la probabilidad condicional solicitada en el problema puede calcularse utilizando un razonamiento probabilístico y las relaciones entre las probabilidades dadas, empleando la fórmula:  

Cuando los datos están expresados como frecuencias, el problema es de asignación de probabilidades, comparando dos números cardinales,  que representan las frecuencias con que ocurren   respectivamente; la asignación se hace entonces utilizando un razonamiento aritmético y relaciones entre frecuencias mediante la expresión:

Si las cantidades aparecen como  porcentajes o razones, de alguna manera representan datos en términos de probabilidades, pero también pueden convertirse en frecuencias como ya se señaló en la propuesta de Rossman y Short,

En este sentido, Lonjedo y Huerta (2005) sostienen que cuando los datos no están expresados en forma de probabilidades, quien resuelve el problema está en capacidad de interpretarlos de acuerdo al sentido que éstos tengan para la situación estudiada y en función de esto desplegará un proceso de resolución que implique al pensamiento numérico  o al pensamiento  probabilístico.

Cabe acotar en este punto que, ya a un nivel universitario como el que nos ocupa en este trabajo,  y más siendo los sujetos futuros profesores de Matemática, es de esperarse que tengan bien desarrollado el pensamiento numérico; por lo que, después de comprendido el significado de la probabilidad a posteriori y la manera de asignarla (como puede hacerse con el uso de tablas de doble entrada ya mencionado), se debería hacer énfasis en el desarrollo del pensamiento probabilístico, tradicionalmente dejado de lado por el manejo numérico de la probabilidad.

Entre las conclusiones  más importantes obtenidas por Lonjedo y Huerta (2005) destacan que el éxito en la resolución de problemas de probabilidad, de probabilidad condicional y del Teorema de Bayes no depende del uso correcto de las fórmulas correspondientes, porque los estudiantes no siempre las usan aún cuando llegan a la respuesta correcta.  Esto evidencia que no interpretan los datos como probabilidades sino como razones o proporciones, dependiendo su éxito no del razonamiento probabilístico sino del manejo de las operaciones aritméticas.

Diaz y De la Fuente (2006) en estudio exploratorio, con estudiantes de Psicología, sobre las dificultades en la resolución de problemas que involucran el Teorema de Bayes,  como parte de un trabajo más amplio (Díaz, 2007),  compararon el desempeño de  los estudiantes en esta tarea antes y después de la instrucción, destacando los errores que cometen.

La investigación consistió en proponer tres preguntas de selección sobre el Teorema de Bayes con respuestas cerradas que incluían distractores para detectar diversos tipos de errores y cuyos enunciados variaban la naturaleza de los datos. Luego se enseñó la probabilidad  condicional y con ésta, el Teorema de la Probabilidad Total y el Teorema de Bayes, dedicando  tres clases teóricas y dos  prácticas. Se instruyó a los estudiantes sobre el uso de diagramas de árbol y tablas de doble entrada; se les alertó sobre los sesgos en el razonamiento asociados a las falacias de la conjunción, de la tasa base y del eje de los tiempos.  Transcurrido un mes después de la enseñanza se realizó una nueva evaluación abierta en la que se presentaron tres problemas para que cada alumno escogiera uno de ellos y lo resolviera.

Los resultados de esta investigación  señalan que los errores cometidos por los estudiantes, organizados de mayor a menor  frecuencia fueron:

- No identificación o identificación incorrecta de los datos

- Confundir probabilidad simple y condicional

- Error en la partición del espacio muestral

- Construcción incorrecta de diagramas de árbol

- Error en la aplicación de la Fórmula de Bayes

- Fallas en el razonamiento proporcional y en las operaciones con fracciones

- Confusión entre probabilidad condicional y probabilidad conjunta

- Falacia de la tasa base

- Confundir un evento con su complemento

- Confundir una probabilidad condicional con su inversa; esto es, confundir

 P[A/B]  con P[B/A]

- Error en el cálculo de la probabilidad total.

Entre las conclusiones de este estudio, las autoras señalan que: (a) El Teorema de Bayes se presenta como un objeto de gran complejidad, para cuya comprensión se requieren conceptos y propiedades previas que también son difíciles para los estudiantes, como son: probabilidades simples, compuestas y condicionales; partición del espacio muestral; evento y su complemento y, el teorema de la Probabilidad Total; (b) Aún cuando el uso de datos frecuenciales puede facilitar a los estudiantes la resolución de cierto tipo de problemas, el formato probabilístico es más fácil de generalizar y de emplear sobre todo cuando se trata de experimentos que se realizan en varios pasos, y (c) Debe fomentarse la enseñanza del Teorema de Bayes por su utilidad en el proceso de toma de decisiones, presentando a los estudiantes una variedad de aplicaciones en problemas reales, proponiendo situaciones atractivas y el uso del computador.

FUNDAMENTACIÓN TEÓRICA

El Teorema de Bayes

Este teorema lleva el nombre del reverendo Thomas Bayes (1701 – 1761) quien lo formuló. También se conoce como la Regla de Bayes  y formula una técnica para calcular probabilidades condicionales, pero no en el sentido directo en que esto se puede hacer, es decir: determinar la probabilidad de que habiendo ocurrido un evento A, ocurra un suceso B, lo que es igual a  .  El planteamiento que hace Bayes es: sabiendo que A ha ocurrido, se puede calcular la probabilidad de que provenga de alguna de las posibles causas, Bi; o que Bi sea causa de A. 

En el Teorema de Bayes, a partir de un conjunto de probabilidades a priori de ciertos eventos, se calculan las probabilidades a posteriori, que vienen a ser las probabilidades de esos eventos corregidas ante la evidencia de que un determinado suceso ha tenido lugar.

El teorema de Bayes tiene como punto de inicio una partición del espacio muestral en un conjunto de eventos mutuamente excluyentes, B1, B2, ….Bn, y la suposición que la ocurrencia de uno de ellos es una condición necesaria para que ocurra el evento A, al cual llamaremos evento principal.  En este contexto, y sabiendo que A ha ocurrido, interesa determinar la probabilidad de que éste haya sido generado por algún Bj en particular, es decir P[Bj /A].

Por la definición de probabilidad condicional, esto se traduce en:

Así, basta calcular P[A] para tener la Fórmula de Bayes. Como A está condicionado a la ocurrencia de los eventos de la partición, B1, B2, ….Bn, , es posible que A sea generado por B1. o que sea generado por B2, … y así sucesivamente hasta Bn; pero cada una de estas posibilidades corresponde a un evento compuesto de la forma ,  siendo ellos mutuamente excluyentes entre sí, por lo que

y, mediante la definición de probabilidad condicional esta probabilidad se escribe como:

O bien:

   (Teorema de la Probabilidad  Total)

Sustituyendo esta expresión en (1) se tiene la Fórmula de Bayes:

la cual contiene los elementos a considerar en la solución de los problemas que involucren el cálculo de probabilidades a posteriori mediante un razonamiento probabilístico:

- Un conjunto de eventos Bi, i = 1, 2, …,n  que forman una partición del espacio muestral y sus respectivas  probabilidades a priori, P[Bi]

- Un evento principal A y su probabilidad de ocurrencia condicionada a cada una de sus posibles causas: P[A/Bi];   i = 1,2,3….n

- La probabilidad de A calculada a partir del Teorema de la Probabilidad Total

- La probabilidad a posteriori de Bj sabiendo que A ha ocurrido: P[Bj/A].

En la mayoría de los textos de probabilidad (Canavos, 1988; De Groot, 1988; Mood, Graybill and Boes, 1974; Ortega, 1998; Meyer, 1973; Milton y Arnold, 2004) se introduce previamente el Teorema de la Probabilidad Total y luego por aplicación directa de la definición de probabilidad condicional se deduce el Teorema de Bayes.

A pesar de que, como se acaba de mostrar, el Teorema de Bayes se puede obtener a partir de las leyes básicas de la probabilidad ha recibido muchas objeciones. De alguna manera permite incorporar el grado de creencia de las personas a medida que se obtiene más información sobre los sucesos que condicionan a un evento dado; pero en muchos casos, cuando no se tiene información precisa se puede tender a hacer suposiciones no sustentadas para las probabilidades a priori de los eventos Bi que particionan el espacio muestral, pero como lo señalan Wadsworth y Bryan (1979), esto no es un defecto sino más bien una mala aplicación del mismo.  Por su parte, Meyer (1973) sostiene que el Teorema de Bayes “Matemáticamente es perfectamente correcto; sólo la elección impropia de P[Bi] hace el resultado objetable” (pp 40-41) .

Por otro lado, se ha argumentado que en algunas situaciones  no hay multiplicidad de causas posibles, Bi, sino un solo evento B que condiciona a A; pero en este caso, tampoco existe un problema real porque el evento B y su complemento son disjuntos y particionan el espacio muestral, en cuyo caso la fórmula de Bayes es aplicable (Wadsworth y Bryan, 1979, p. 19)

Los enunciados de los problemas que aparecen en los libros de texto dan  pistas para conocer todas las probabilidades simples y condicionales requeridas para calcular la probabilidad inversa deseada, pero en situaciones no escolares, donde no existe esa facilidad, se pueden asignar las probabilidades a priori a partir de consideraciones teóricas o diseñar experimentos a pequeña escala para aproximarlas a través de la frecuencia relativa (Wadworth y Bryan, 1979, p. 33).

Por su parte, Batanero (2004) señala que con el Teorema de Bayes se formaliza el cambio del grado de creencia sobre un suceso a partir de nuevos datos que vayan apareciendo y no es que se tenga que asignar probabilidades en ausencia de información sino que en general sí se tiene conocimiento sobre los sucesos implicados, la cual se puede utilizar para la asignación de probabilidades.

Dejando de lado estas objeciones, se resalta el valor de los aportes del reverendo Bayes a la inferencia estadística, dando origen a lo que se conoce como Inferencia Bayesiana de amplio uso en la investigación científica en diversos campos del conocimiento. 

La Resolución de Problemas en el Aprendizaje y la Enseñanza de la Probabilidad

En este trabajo se entiende la resolución de problemas en el sentido que lo hace Santos (1997): una forma de pensar que induce al estudiante a desarrollar  habilidades y utilizar diferentes estrategias en su aprendizaje de las diversas áreas de la Matemática, entre ellas la Probabilidad. Precisamente, una de las cuestiones que diferencia el estudio de la Probabilidad de otras áreas como el Álgebra y el Cálculo, en el nivel en el cual se desarrolla esta investigación, es que éste se centra en la resolución de problemas como estrategia de aprendizaje y de enseñanza.

Este artículo trata de la resolución de problemas inherentes al Teorema de Bayes, no sólo como una aplicación de dicho teorema después de la instrucción por parte del profesor, sino como mecanismo para la re-creación de los conceptos y para promover la reflexión y el desarrollo del pensamiento probabilístico, en particular el razonamiento bayesiano tan importante en la toma de decisiones en situaciones donde la información previa incide en la probabilidad de ocurrencia de un fenómeno.

Estrategias para la Resolución de Problemas Inherentes al Teorema de Bayes

Como en cualquier problema matemático, en aquellos inherentes a la utilización del Teorema de Bayes  es aplicable el modelo de Polya que implica seguir los siguientes pasos:

1. Comprensión del problema

2. Identificación de datos y condiciones

3. Concepción de un plan para resolverlo

4. Aplicación del plan

5. Verificación de la factibilidad de los resultados obtenidos.

Pero,  considerando lo que señala Schoenfeld (1989) respecto a la aplicación de las heurísticas de Polya en el sentido que éstas deben ser discutidas a un nivel contextualizado para evitar la idea de un proceso mecanizado en la solución de este tipo de problemas que se inscriben en la clasificación de Fredericksen (1984) como problemas estructurados que requieren un  “pensamiento productivo”.

El primer paso, el referido a la comprensión del enunciado del problema, según la experiencia de la autora e investigaciones previas sobre el tema, pareciera ser una de las  mayores dificultades que se les presentan a los estudiantes cuando tienen que resolver problemas de probabilidad, más aún si se trata de probabilidad condicional y dentro de ella, sobre el Teorema de Bayes. Ricciardi y Pérez (2006), al estudiar la problemática de la comprensión en la resolución de problemas de probabilidad en la UPEL-IPM, llegaron a una categoría explicativa que ellos denominaron “Dificultad para transformar el enunciado de los problemas al lenguaje probabilístico”, atribuyendo esa situación al modo textual en que éstos aparecen, y destacan a su vez que cuando se trata de problemas de aplicación del Teorema de Bayes la dificultad es mayor por la cantidad de datos y condiciones que deben identificar en el mismo.

El plan que se sugiere a los estudiantes del curso Probabilidad y Estadística Inferencial para la resolución del tipo de problemas que nos ocupa consiste en:

a. Identificar el evento principal A y enunciarlo formalmente.

b. Identificar los eventos condicionantes Bi  que forman la partición del espacio muestral y enunciarlos formalmente.

c. Determinar, a partir de los datos del enunciado, las probabilidades a priori de los eventos Bi, P[Bi], y la del evento principal A condicionada a la ocurrencia de los Bi: P[A/Bi].

d. Aplicar el Teorema de la Probabilidad Total para calcular la probabilidad de A: P[A]

e. Sustituir valores en la Fórmula de Bayes y realizar los cálculos respectivos.

f. Analizar la factibilidad de que la respuesta obtenida sea correcta con el fin de descartar resultados no válidos, como por ejemplo obtener una probabilidad negativa o mayor que 1, o  valores que puedan ir en contra de lo esperado.

En este plan de resolución, acordado de manera consensuada con estudiantes que han cursado la materia en semestres anteriores, no implica que los pasos a, b y c se hagan en ese estricto orden, pues la identificación de los eventos y sus probabilidades dependen del enunciado del problema y de la forma como los estudiantes lo interpreten.  Por otra parte, su  aplicación  conlleva a la utilización de una serie de estrategias de representación para facilitar la determinación de las probabilidades que son requeridas; entre ellas se encuentran, además de las  tablas de doble entrada, los diagramas de árbol y los diagramas de áreas.

En la construcción del diagrama de árbol, en la primera ramificación se consideran los eventos Bi y se colocan sus probabilidades, P[Bi]. En la segunda ramificación, para cada Bi se considera la probabilidad de que ocurra A: P[A/Bi] o que ocurra su complemento: P[Ac/Bi].  En los puntos finales de las ramificaciones se colocan las probabilidades conjuntas de que ocurran A y Bi: . Al sumar esas probabilidades se tiene  el denominador de la Fórmula de Bayes y el numerador vendrá dado por el punto final de la ramificación correspondiente: . 

El diagrama queda entonces de la siguiente manera:

 En el diagrama de área, en un plano cartesiano se ubican  las  P[Bi] en el eje de las abscisas y las P[A/Bi] en el eje de las ordenadas. El área de los rectángulos determinados por las intersecciones de estos valores  dan las probabilidades conjuntas. P[A∩Bi], como se muestra a continuación para el caso de i = 3.

Heurísticas y Sesgos en el Razonamiento Bayesiano

Como ya se ha mencionado, son múltiples las heurísticas y sesgos presentes en el razonamiento probabilístico, no sólo en los estudiantes que se inician en el tema, sino también en personas con una formación avanzada en el área (Serrano, Batanero, Ortiz y Cañizares, 1998).  En el caso del razonamiento bayesiano destaca la presencia de las falacias de la tasa base, del eje de los tiempos y de la condicional transpuesta.

Falacia de la Tasa base

La tasa base es la frecuencia de un tipo genérico de eventos sin considerar información alguna sobre un caso específico.  Cuando se desea asignar la probabilidad a un suceso, generalmente se dispone de dos tipos de información: Una  genérica sobre la frecuencia de ocurrencia de sucesos de ese tipo, y una específica sobre el caso particular en estudio. Cuando se contrasta la información de segundo tipo, la de primer tipo se llama información sobre la tasa base. Cuando no se dispone de la información genérica, las probabilidades se asignan en función de la información específica; pero el conocimiento de la tasa base modifica las probabilidades de una ocurrencia específica del suceso.  No obstante, ocurre que muchas veces, aún cuando se tienen ambos tipos de información, las probabilidades se asignan sólo con base en la información específica, obviando la información genérica.  Esto es lo que conoce como Falacia de la Tasa Base (Tversky y Kahneman, 1982).

Algunas investigaciones psicológicas reportadas por Koehler (1998) sugieren que, en general, las personas, incluyendo aquellas con formación estadística, ignoran las tasas base al asignar probabilidades. En lo relativo a la aplicación del Teorema de Bayes,  Díaz y De la Fuente (2006) señalan que la Falacia de la Tasa Base se refiere al hecho de ignorar las probabilidades a priori del suceso en problemas que involucran el cálculo de probabilidades inversas.

Falacia del Eje de los Tiempos

En los problemas bayesianos el evento principal A y los eventos condicionantes Bi pueden ocurrir simultáneamente (situación sincrónica), o pueden ocurrir de manera secuencial (situación diacrónica).  En esta última situación las causas o eventos que particionan el espacio muestral se dan previos en el tiempo en relación al evento que ellos condicionan, pero lo que interesa en el razonamiento bayesiano es cómo el conocimiento de que A ya ha ocurrido modifica la probabilidad de que cada una de las posibles causas haya sucedido; es decir, interesa P[Bj/A].  Cuando se tiene la creencia que un suceso determinado no puede condicionar la de otro que ya ha tenido lugar se está en presencia de la Falacia del Eje de los Tiempos, cuya incidencia en la comprensión y aplicación del Teorema de Bayes ha sido estudiada ampliamente por Grass y Totohasima, referidos por Díaz y De la Fuente (2007).

Falacia de la Condicional Transpuesta

Cuando se introduce el concepto de probabilidad condicional, sobre todo en una situación sincrónica representada en una tabla de doble entrada, restringiendo el espacio muestral a la satisfacción de un suceso dado, es posible derivar de inmediato las fórmulas para P[A/B] y P[B/A].  En el enunciado de un problema, para identificar el evento condicionante se emplean expresiones como: “Si…..”, “Dado que ….”, “Si se sabe que ….”; Sin embargo muchos estudiantes tienen dificultad para identificar cuál de las dos probabilidades es la que se pide en la pregunta del problema y la confusión entre ellas es lo que se conoce como la Falacia de la Condicional Transpuesta.

En situaciones diacrónicas, donde interesa la probabilidad de un evento A condicionado en un evento B acontecido con anterioridad hay menos presencia de esta falacia en la identificación correcta de la probabilidad condicional correspondiente.  En el caso del Teorema de Bayes, ésta se da en conjunto con la Falacia del Eje de los Tiempos.

ORIENTACIONES METODOLÓGICAS

Metodológicamente partimos de la idea de que investigar en educación es una búsqueda constante de alternativas que nos alejen de la rutina y nos acerquen a nuevas formas de afrontar los problemas y limitaciones que se hacen evidentes en el ambiente escolar tanto para el docente en su acción pedagógica como para los estudiantes en su comprensión y aprendizaje. La investigación, como base para el aprendizaje, tal como lo plantea Stenhouse (1998), exige que las acciones que se tomen durante el proceso investigativo y  que las implicaciones teóricas de sus resultados también se comprueben en el ámbito escolar; por ello, este autor sugiere que los profesores se pregunten  si las observaciones más o menos difundidas en la literatura científica sirven para su situación específica.  Es decir, que lleven a la práctica experiencias que han sido exitosas en otros ámbitos adaptándolas a sus condiciones particulares.

Este es el principio que hemos seguido en este caso, el cual se centró en el estudio del Teorema de Bayes y sus aplicaciones a la solución de problemas de cálculo de probabilidades inversas.  La investigación se llevó a cabo durante el desarrollo del curso Probabilidad y Estadística Inferencial que se ofreció en la Especialidad de Matemática en la UPEL-IPM durante el lapso académico Octubre 2006–Febrero 2007, pudiendo caracterizarse como un estudio de caso cualitativo descriptivo con una orientación hacia la acción en el aula y con un enfoque interpretativo, siendo el docente a la vez investigador y profesor del curso y los 20 estudiantes (futuros profesores de Matemática) inscritos los sujetos de estudio.

Los instrumentos y las técnicas de recolección de información utilizados fueron:  talleres grupales y una prueba escrita, además de  sesiones de discusión grupal que se realizaron después de la aplicación de estos instrumentos para conocer sobre la actuación de los alumnos y reorientar las acciones en caso de ser necesario.  Tanto para los talleres como para la prueba escrita, la validez queda garantizada pues en la selección de las preguntas se tomó en cuenta los diversos tipos de elementos que pueden estar presentes en los enunciados, la posibilidad de emplear la variedad de estrategias de representación y la factibilidad de detectar errores y heurísticas presentes en el razonamiento  de los estudiantes. Por otra parte, el nivel de dificultad de los problemas fue similar al de aquellos abordados en clase. 

DESCRIPCIÓN DE LA EXPERIENCIA

De acuerdo con el programa del curso Probabilidad y Estadística Inferencial, éste se inició abordando los conceptos básicos de probabilidad y sus aplicaciones, trabajando previamente con situaciones de conteo mediante la resolución de problemas que permitieran englobar los diversos modelos y operaciones combinatorias. Luego de haber sido cubiertos estos conceptos introductorios, se realizó una evaluación a través de un taller grupal que a  su vez sirvió como diagnóstico sobre los conocimientos previos de los alumnos referidos al tema de interés.

Posteriormente, se inició el estudio de la probabilidad condicional planteando un problema cuyos datos, expresados en términos de frecuencias absolutas, estaban organizados en una tabla de doble entrada. A partir del análisis de dicha tabla y siguiendo la técnica de la pregunta, los estudiantes lograron  establecer probabilidades condicionales del tipo P[A/B], mediante la reducción del espacio muestral a los puntos muestrales que satisfacían el evento B; igualmente se visualizaron la probabilidades conjuntas, y la probabilidad del evento B, P[B], para luego, mediante operaciones algebraicas concluir que:

.

Luego de comprendida esta definición, se siguió con la resolución de problemas expresando los datos en diferentes tipos de magnitudes: frecuencias, porcentajes, razones y probabilidades.

A continuación se procedió a introducir el Teorema de Bayes siguiendo las recomendaciones de Rossman y Short (1995); es decir, utilizando el problema clásico de identificación de la procedencia de un artículo defectuoso, se pasó a la elaboración de la tabla de doble entrada y con las preguntas apropiadas se llegó a calcular las probabilidades a  posteriori deseadas, sin haber hecho mención previa al Teorema de Bayes.  Posteriormente, para este mismo problema, los datos se expresaron en forma de probabilidades y se representaron en un diagrama de árbol, lo cual permitió visualizar más claramente la probabilidad a posteriori que se pedía en el enunciado.

Finalmente, se  enunció formalmente y se demostró dicho teorema, destacando que la probabilidad que aparece en el denominador de la Fórmula de Bayes se calcula a través del Teorema de la Probabilidad Total. Concluida la formalización se continuó con  la resolución de problemas de probabilidades a posteriori,  para lo cual se consideró fundamental:

-   Insistir en la comprensión del enunciado con el fin de identificar correctamente los datos y condiciones que llevaran a la  aplicación del modelo de resolución de problemas especificado en la fundamentación teórica.

-   Énfasis en la diversidad de datos y en la forma de traducirlos en términos de las probabilidades requeridas.

-   Esquematización de los datos en la representación que fuera más conveniente: tabla de doble entrada, diagrama de árbol o diagrama de área.

-   Llamada continua de atención sobre la presencia de las falacias de la tasa base, del eje de los tiempos y de la condicional transpuesta, pues éstas en general conllevan a razonamientos erróneos que afectan la comprensión del problema y su resolución, además de ser una manifestación de ciertas desviaciones en el  pensamiento  probabilístico de los estudiantes.

La siguiente acción fue la ejercitación supervisada o mediada por el docente a través de:

-   Elaboración de una guía con 20 problemas donde se incluía la diversidad de  formas de presentación de los datos y donde se podían crear distintas vías de representación. Algunos de estos problemas fueron resueltos en grupos pequeños y otros en forma individual.

-   Asignación de un estudiante preparador quien desarrolló dos jornadas semanales de consulta con los participantes en la investigación.

-   Realización en clase de un taller en grupos pequeños, 2 o 3 estudiantes, previo a la aplicación de la prueba escrita.  Después de la revisión del taller por parte del docente se realizó en clase una sesión de discusión de  los problemas contemplados en el mismo con el fin de aclarar las dudas  y los errores de los estudiantes.

Después de tres semanas de iniciado el tema en estudio, con una dedicación de seis horas académicas semanales distribuidas en tres sesiones de dos horas cada una, se aplicó una prueba escrita individual que contenía  tres problemas de aplicación del Teorema de Bayes, para cuya resolución se pidió a los estudiantes que explicaran el procedimiento seguido por ellos. Una vez corregidos los exámenes se realizó una sesión de discusión extra clase para conocer las limitaciones y dificultades que se les presentaron a los alumnos en la búsqueda de la solución a los problemas propuestos.

ALGUNOS RESULTADOS

Primer Problema

El enunciado de este problema fue el siguiente:

“Una empresa recibe visitantes en sus instalaciones y los hospeda en tres hoteles de la ciudad: Morichal Largo, Stauffer y Luciano Junior en una proporción de 18,5%, 32% y 49,5%, respectivamente, de los cuales se ha tenido información que se les ha dado un mal servicio en un 1%, 2,8% y 4% respectivamente.  Se selecciona un visitante al azar y si éste no se queja del servicio recibido, ¿Cuál es la probabilidad que haya sido hospedado en el  hotel Morichal Largo?

En el Cuadro 2 se muestra la actuación de los alumnos en la resolución de este problema con el uso del modelo seguido en clases.  Como se observa, hubo un aceptable número de respuestas correctas en los primeros pasos del modelo, pero dicho número fue decreciendo a medida que se avanzaba en sus componentes, para llegar a sólo 7 estudiantes que calcularon correctamente el valor de la probabilidad solicitada.

Cuadro 2

Resultados de la Corrección del Primer Problema

Paso del proceso de solución

Correctas

Incorrectas

No respondió

Identificación del evento principal (A)

13

2

5

Identificación eventos de la partición (Bi)

12

2

6

Identificación probabilidad eventos Bi  

( P[Bi] )

11

4

5

Identificación probabilidad de evento A condicionado a Bi ( P[A/Bi] )

10

5

5

Cálculo P[A] (Teorema de la Probabilidad Total)

7

7

6

Identificación probabilidad solicitada

( P[Bi/A] )

7

6

7

Aplicación Fórmula de Bayes

7

4

9

 En la sesión de discusión grupal que siguió a la aplicación de la prueba, los estudiantes manifestaron en su mayoría, incluyendo a muchos de los que no dieron la respuesta correcta, que éste fue el problema más sencillo y que no tuvieron dificultades en reconocer que se trataba de un problema de aplicación del Teorema de Bayes, pues lo asociaron con el de localización de la procedencia de un objeto defectuoso, haciendo la analogía de los hoteles con las máquinas y del mal servicio con los artículos defectuosos. Mencionaron, sin embargo, haber tenido confusión pues en la pregunta la probabilidad  condicional estaba enunciada en términos del complemento.

Varios fueron los errores cometidos por los estudiantes y entre ellos destacamos los más singulares en cuanto al razonamiento seguido en su resolución:

“Sumando el % de los visitantes que han tenido mal servicio tenemos que el 7,8% de los visitantes recibió mal servicio, restamos esto a 100% y obtenemos que el 92,2% de los visitantes recibió buen servicio.  Por esto se puede decir que la P de que el visitante seleccionado haya recibido buen servicio es:

A: El visitante recibió buen servicio;

B: El visitante fue hospedado en el Morichal Largo

Del 92,2% de los visitantes que fueron atendidos, el 17,5% se hospedó en el hotel Morichal Largo, esto lo extraimos (Sic) de restar el % de hospedados y el % de visitantes mal atendidos. 

En primer lugar se observa en este procedimiento que el estudiante ha sumado los  porcentajes correspondientes a las personas que han recibido mal servicio sin tomar en cuenta las tasas bases para cada caso, referidas a la cantidad de personas hospedadas en cada hotel.  De esta manera calcula la probabilidad de haber recibido un buen servicio como complemento a esa suma y sin aplicar el Teorema de la Probabilidad Total.  Es obvio, además, que se trata de un problema de aplicación del Teorema de Bayes y calcula de una manera insospechada una probabilidad que no es la pedida, pues ésta ya aparece explícitamente señalada en el enunciado del problema: “Probabilidad de que el visitante fue hospedado en el hotel Morichal Largo”: para ello resta al porcentaje de hospedados en ese hotel, el porcentaje de estos que recibieron mal servicio y finalmente forma el cociente entre esta diferencia y el porcentaje que según sus cálculos corresponde a la prestación de buen servicio tomando en conjunto los tres hoteles.

El siguiente esquema de resolución, seguido por otro estudiante, ilustra una inconveniente denotación de los eventos, que creó confusiones que impidieron la correcta solución del problema:

“M = {Se hospedan en el Morichal};   P[M] = 0,185

 S = {Se hospedan en el Stauffer};   P[S] = 0,32

 L = {Se hospedan en el Luciano}; P[L] = 0,32

A = {Recibió mal servicio en el Morichal largo};  P[A] = 0,01

Ac = {Recibió buen servicio en M.L.};  P[Ac]= 1 – P[A]= 1 – 0.01 = 0,99

B = {Recibió mal servicio en elS};  P[B] = 0,281

Bc = {Recibió buen servicio en S.}; P[Bc]= 1 – P[B]= 1 – 0.028 = 0,972

C =  {Recibió mal servicio en el L.J.};  P[C] = 0,04

Cc =  {Recibió buen servicio en L.J.};  P[Cc]= 1 – P[C]= 1 – 0.04 = 0,96

T = {Recibió un buen servicio};  P[T] = P[M/Ac]P[Ac] + P[S/Bc].P[Bc] + P[L/Cc].P [Cc].”

La estudiante identifica bien los eventos que forman la partición del espacio muestral y los denota por las iniciales de los nombres de los hoteles, M, S y L, pero luego no identificó el evento principal sino que definió los eventos compuestos que corresponden a recibir un mal servicio y estar hospedados en cada hotel, confundiendo éstos con las situaciones condicionales de recibir un mal  servicio dado que se ha estado hospedado en un determinado hotel.  Finalmente, al aplicar el Teorema de la Probabilidad Total, llama T al evento principal “Recibir un buen servicio”, pero al aplicar mal la fórmula muestra la presencia de la Falacia de la Condicional Transpuesta

En cuanto a las formas de representar los datos, la más usada fue la tabla de doble entrada, de las cuales se muestran dos que contienen errores en su elaboración:

1. El estudiante, sin identificar ninguno de los eventos, presenta un cuadro elaborado de la siguiente manera:

 

M.L

ST

L.J

Total

M.S

1

2,8

4

7,8

B.S

17,5

29,2

45,5

92,2

Total

18,5

32

49,5

100

 y calcula

En este caso, el estudiante trató de seguir las sugerencias de Rossman y Short, tratadas en clase, pero en lugar de llevar los datos a frecuencias simples con base en 100 personas, trabajó directamente con los porcentajes, cometiendo una serie de errores como: confundir probabilidades conjuntas con probabilidades condicionales, obviar las tasas base, calcular en forma incorrecta los porcentajes correspondientes a los eventos complementarios, entre otros. Los cálculos realizados por este estudiante no sólo muestran un bajo razonamiento probabilístico, sino algo más grave para alguien que se supone debe tener un conocimiento matemático avanzado, como es el mal manejo de los porcentajes,  situación que debe llevar a la reflexión en cuanto a la formación de los futuros docentes de Matemática.

2. Otra tabla que llamó la atención fue construida de la siguiente manera:

 

Visitan

Mal servicio

Morichal Largo

0,185

0,01

Stauffer

0,32

0,028

Luciano Junior

0,495

0,04

Total

1

0,078

 Luego  el estudiante define los siguientes eventos:

 A = {Obtener un visitante al azar del Morichal Largo}  

B = {Obtener un mal servicio}     Bc = {Obtener un buen servicio}

 Finalmente, plantea la siguiente expresión   pero no logra continuar resolviendo el problema.

Esta estudiante  simplemente  trató de aplicar la definición de probabilidad condicional sin implicar al Teorema de Bayes, por lo que no se percató de las probabilidades condicionales inmersas en el enunciado; además,  la construcción de la tabla no ayudó a visualizar esos valores, sino que por el contrario la llevó a cometer el mismo error del caso anterior al sumar los porcentajes de recepción de mal servicio. 

 Segundo Problema

El enunciado de este problema fue el siguiente:

“Una compañía de seguros sabe por su propia experiencia que los clientes que tienen fondos suficientes en sus cuentas ponen, por error, fecha adelantada en sus cheques una vez de cada 1000, mientras que los que firman cheques sin fondos siempre ponen fecha adelantada.  El último grupo constituye el 1 por 100 del total. Un cajero recibe de un cliente un cheque  con fecha adelantada ¿Cuál es la probabilidad que ese cliente tenga fondos suficientes?”.

En este segundo problema los niveles de dificultad para los estudiantes fueron mayores que en el primero; consecuentemente sólo tres de ellos lograron llegar  hasta la aplicación de la Fórmula de Bayes y dieron la respuesta correcta, tal como se muestra en el Cuadro 3.

Cuadro 3

Resultados de la Corrección del Segundo Problema

Paso del proceso de solución

Correctas

Incorrectas

No

respondió

Identificación del evento principal (A)

7

5

8

Identificación eventos de la partición (Bi)

6

6

8

Identificación probabilidad eventos Bi

( P[Bi] )

5

2

13

Identificación probabilidad de evento A condicionado a Bi ( P[A/Bi] )

4

6

10

Cálculo P[A] (Teorema de la Probabilidad Total)

4

3

13

Identificación probabilidad solicitada

( P[Bi/A] )

4

4

12

Aplicación Fórmula de Bayes

3

4

13

 Ya desde el primer paso los porcentajes de respuestas correctas fueron menores en comparación con el problema anterior, pues sólo 7 estudiantes identificaron bien el evento principal y 6 lo hicieron con los eventos de la partición. Destaca en la tabla, no sólo que los porcentajes de respuestas correctas fueran bajos, sino que la mayoría de los estudiantes ni siquiera aventuró una posibilidad en cada caso.

La dificultad principal en identificar todos los eventos involucrados, en opinión de los estudiantes, radicó en no poder determinar cuáles de ellos conformaban la partición, pues en cada situación había dos opciones: Cheques con o sin fecha adelantada y cuentas con o sin fondos suficientes.  Se esperaba que los estudiantes identificaran el evento principal A : “El cliente emite un cheque con fecha adelantada” y la partición formada por los eventos B : “El cliente tiene fondos suficientes en su cuenta” y su complemento Bc : “El cliente tiene fondos insuficientes en su cuenta”. En este caso, está latente una de las objeciones al Teorema de Bayes referida a la ausencia de multiplicidad de causas, pero como ya se acotó antes,  el evento B y su complemento forman una partición del espacio muestral. Cuando la partición está formada por más de dos eventos, los estudiantes la identifican con más facilidad y esto los lleva “por descarte”  a reconocer el evento A.

Para los que identificaron correctamente estos eventos, la principal limitación estuvo en la determinación de P[A/Bc] implícita en la expresión “Mientras que los que firman cheques sin fondo siempre ponen fecha adelantada”, correspondiéndole el valor de 1. Además,  los estudiantes manifestaron que no fue fácil para ellos hacer la analogía  con el problema de las máquinas y los defectuosos, como sí pudieron hacer en el primer caso.

Entre los estudiantes que, habiendo identificado bien los eventos, no dieron con la respuesta correcta prevaleció el siguiente esquema de resolución:

A : “Cheque con fecha adelantada”

B1 : “Cheque sin fondo”;  B2 : “Cheque con fondo insuficiente en la cuenta”

Donde se evidencia un error en la asignación de la P[A/B1] al tomarla como complementaria a la P[A/B2].

Tercer Problema

Este problema estuvo expresado en los siguientes términos.

“Se lanza una moneda y si sale cara se mete una bola negra en una urna y si sale sello, se mete una bola blanca en la misma urna.  Se hace esta operación tres veces. A continuación una persona saca dos bolas simultáneamente de la urna y ambas resultan ser negras. ¿Cuál es la probabilidad de que en la urna hubiera dos bolas negras y una blanca?

A pesar de tener un enunciado clásico en términos de los objetos utilizados: bolas y urnas, en opinión de los estudiantes éste fue el problema más difícil de atacar y aquellos que intentaron resolverlo (8) tuvieron inconvenientes desde los primeros pasos de la aplicación del modelo pues no lograron identificar con precisión los eventos involucrados y sus respectivas probabilidades, al no construir el espacio muestral asociado.

Cuadro 4

Resultados de la Corrección del Tercer Problema

Paso del proceso de solución

Correctas

Incorrectas

No respondió

Identificación del evento principal (A)

4

4

12

Identificación eventos de la partición (Bi)

0

6

14

Identificación probabilidad eventos Bi

( P[Bi] )

0

6

14

Identificación probabilidad de evento A condicionado a Bi ( P[A/Bi] )

0

5

15

Cálculo P[A] (Teorema de la Probabilidad Total)

0

3

17

Identificación probabilidad solicitada

( P[Bi/A] )

0

2

18

Aplicación Fórmula de Bayes

0

1

19

Sólo un estudiante tomó en cuenta  las posibles conformaciones de la urna antes de la extracción de las dos bolas y define dos eventos A y B:

 “S = {(N,N,N), (N,N,B), (N,B,B), (B,B,B)}

Si hacemos tres lanzamientos de una moneda y metemos una bola según el lado que se obtenga, sólo tendremos en cuenta las posibilidades sin importar el orden en que se hayan obtenido, entonces sólo podrán haber en la caja tres bolas negras; tres bolas blancas; dos bolas negras y una bola blanca o dos bolas blancas y una bola negra.

A: “Seleccionar dos bolas simultáneamente y que ambas sean negras”

B: “Que hayan dos bolas negras y una blanca en la urna”

No obstante, el estudiante no particiona este espacio en los eventos correspondientes a las posibles configuraciones de la urna:

B1: “En la urna había tres  bolas negras”

B2: “En la urna había dos  bolas negras y una bola blanca”

B3: “En la urna había una  bolas negra y dos bolas blancas”

B4: “En la urna había tres  bolas blancas”

Y por lo tanto, no logra calcular la probabilidad solicitada; no obstante, fue traducida correctamente  al lenguaje de la probabilidad condicional, P[B/A], pero con ella se pierde la intención de aplicar los teorema de Bayes y de la Probabilidad Total al no considerar el resto de los eventos de la partición.

Otro procedimiento que resalta los inconvenientes que se presentan cuando no se identifican los eventos de manera correcta fue el siguiente:

A: “Obtener dos bolas negras y una blanca en la urna”

B : “Obtener una bola negra”;  C: “Obtener una bola blanca”

B’ : “Obtener 2 bolas negras”

.

En este caso no se evidencia un razonamiento de tipo  bayesiano, hay una confusión total en cuanto a los eventos que son relevantes para la aplicación del Teorema de Bayes; además se observan errores que se derivan de los conocimientos previos, por ejemplo el considerar B’ como el complemento de B y a pesar de esto  asignarle probabilidades de ½ y ¼ , tomar A como la intersección de B’ y C y  considerar estos dos últimos eventos como independientes   Consultado el estudiante al respecto, explicó que “si B es el evento de obtener una bola  negra y el experimento se repite tres veces, su complemento es obtener las otras dos bolas negras”.

A MANERA DE CONCLUSIÓN

Todas las muestras presentadas  sobre las realizaciones de los estudiantes en la prueba escrita y lo señalado por ellos en la discusión grupal dan cuenta del alto nivel de dificultad que las situaciones de determinación de probabilidades inversas representan para ellos, a pesar de tener una buena base de formación matemática

Estas dificultades se originan en la comprensión misma del enunciado de los problemas, lo que evidencia no sólo limitaciones de lecto-escritura de los estudiantes sino también en su razonamiento probabilístico que le impide interpretar la información en términos de probabilidades y cómo el conocimiento de algunas de ellas inciden en la probabilidad de un suceso, especialmente si éstas ya han ocurrido o bien ocurren de manera simultánea; de allí la dificultad para destacar  las probabilidades condicionales  implícitas en el texto, fundamentales en la aplicación de la fórmula de Bayes.

Aún cuando se implementó una serie de acciones y se dedicó mucho más tiempo del programado oficialmente para el estudio y ejercitación del tema, no se lograron los resultados esperados, coincidiendo con los resultados obtenidos por Díaz y De la Fuente (2006).  Esto supone no un fracaso, sino por el contrario un incentivo para seguir explorando alternativas inéditas o aquellas que se hayan mostrado promisorias en otros ámbitos.  Esto es en esencia el papel de la investigación en función de una docencia dinámica, comprensiva y transformadora.

Lo  observado en este estudio de corto alcance, pues se realizó con un curso y durante sólo un lapso académico, concuerda en parte con resultados obtenidos en investigaciones de más amplia cobertura, lo que da pie para sugerir, como lo han hecho aquéllas, que en nuestro ámbito se le comience a dar, en el contexto escolar,  la importancia que merece la formación de los individuos para actuar en situaciones de incertidumbre, en general, y muy en particular en aquellas donde el conocimiento de la ocurrencia de ciertos eventos condicionan las probabilidades de sucesos sobre los cuales habrá de tomarse decisiones, que es en esencia, el planteamiento del razonamiento bayesiano. Igualmente debe resaltarse la necesidad de hacer de la resolución de problemas una forma de reconstrucción del conocimiento matemático en los futuros docentes de esta disciplina a través de las diferentes asignaturas que conforman el pensum, pues no se puede esperar que ellos desarrollen plenamente en el curso de Probabilidad y Estadística las habilidades implícitas en la resolución de problemas  si no las ponen en práctica en el resto de los cursos.  En este sentido los resultados hablan por sí solos.

Ante las evidencias de este estudio se dejan algunos elementos para la reflexión, como por ejemplo: ¿Cuáles son las concepciones y creencias de los estudiantes respecto a la probabilidad y cómo éstas afectan su aprendizaje? ¿Será pertinente el inicio del estudio de la probabilidad  a posteriori desde niveles anteriores de una manera intuitiva para evitar el choque que se le presenta al estudiante cuando debe abordarla  formalmente en el curso de Probabilidad de Estadística? ¿Cuáles estrategias  y recursos de enseñanza pueden llevar a mejores resultados que los obtenidos en este trabajo? ¿Qué papel juega la forma de enseñar la Matemática en la universidad, donde no se evidencian la utilización de la resolución de problemas como estrategia de enseñanza-aprendizaje y la aplicabilidad de la Matemática a situaciones cotidianas, en la actitud de los estudiantes hacia la probabilidad?. Cada una de estas interrogantes invita a continuar la indagación en este tema de gran relevancia en los tiempos actuales.

REFERENCIAS

1. Batanero, C. (2004). “Ideas Estocásticas fundamentales. ¿Qué contenido se debe enseñar en la clase de probabilidad”. Ensino e Aprendizagen de Probabilidades e Estadística. Actas  I Encontro Probabilidades e Estadística na Escola. Centro de Investigação e Psicología. Universidade do Minho. Portugal.        [ Links ]

2. Beltrán, P. (1998). Propuesta metodológica para la enseñanza de la probabilidad en Educación Media Diversificada. Trabajo de Grado de Maestría. Maturín: UPEL-IPM.         [ Links ]

3. Canavos, G. (1988). Probabilidad y estadística: Aplicaciones y Métodos. México: McGraw Hill,         [ Links ]

4. De Groot, M. (1988). Probabilidad y Estadística. México: Addison-Wessley Iberoamericana.         [ Links ]

5. Díaz, C. (2007). Viabilidad en la enseñanza de la enseñanza de la inferencia bayesiana en el análisis de datos en Psicología. Tesis Doctoral, Universidad de Granada.  Disponible en  www.stat.auckland.ac.nz/~iase/publications/dissertations/07.Diaz.Dissertation.pdf . [Consulta: 2007, Oct. 15]        [ Links ]

6. Díaz, C. y De la Fuente, I. (2006). Dificultades en la resolución de problemas que involucran el Teorema de Bayes: Un estudio exploratorio en estudiantes de psicología. Educación Matemática, 18(2), 75-94.        [ Links ]

7. Díaz, C. y De la Fuente, I. (2007). Validación de un cuestionario de razonamiento probabilístico condicional. Revista Electrónica de Metodología Aplicada12 (1), 1-15.        [ Links ]

8. Fredericksen, N. (1984). Implications in cognitive theory for instruction in problem solving. Review of Educational Research, 54, 363-407.        [ Links ]

9. Koehler, J. (1998). The base rates fallacy reconsireded: Descriptive normatine and methodological challenges. Behavior and Brain Sciences, 19, 1-54.        [ Links ]

10. Lonjedo, M. A. y Huerta, M. P. (2005). La naturaleza de las cantidades presentes en el problema de probabilidad condicional. Su influencia en el proceso de resolución de problemas. http://www.uco.es/~ma1mamaa/Simposio_Cordoba/15-Lonjedo,Huerta.pdf         [ Links ]

11. Meyer, P. (1973). Probabilidad y Aplicaciones Estadísticas. México: Fondo educativo Interamericano.         [ Links ]

12. Milton, S. y Arnold, J. (2004). Probabilidad y Estadística con Aplicaciones para Ingeniería y Ciencias del Comportamiento. México: McGraw Hill.        [ Links ]

13. Mood, A., Graybill, F. y Boes, D. (1974). Introduction to the Theory of Statistics. U.S.A.: McGraw Hill.         [ Links ]

14. Ortega, J. (1998). Elementos de Probabilidad. Caracas, Sociedad Fondo Editorial CENAMEC.         [ Links ]

15. Parra, E. (1997). Desarrollo de estrategias metodológicas que permitan ayudar al docente en el logro de los objetivos de Probabilidad y Estadística a nivel de segunda etapa de Educación Básica. Trabajo de Grado de Maestría no publicado. Maturín, UPEL-IPM.         [ Links ]

16. Ricciardi, I. y Pérez, J. (2006). Problemática de comprensión para la resolución de problemas en la asignatura Probabilidad y Estadística en el VII semestre de la especialidad de Matemática en la UPEL-IPM. Maturín, UPEL-IPM.        [ Links ]

17. Rossman, A. y Short, T. (1995). “Conditional Probability and Education Reform: Are they compatible?, Journal of Statistics Education, 3(2). Disponible en  http://www.amstat.org/publications/jse/v3n2/rossman.html        [ Links ]

18. Santos, L. (1997). Principios y Métodos de la Resolución de Problemas en el Aprendizaje de la Matemática.  México: Grupo Editorial Iberoamerica.         [ Links ]

19. Serrano, L., Batanero, C., Ortiz, J. y Cañizares, J. (1998). Heurísticas y Sesgos en el Razonamiento Probabilístico de los estudiantes de Secundaria. Educación Matemática, 10(1), 7-25.        [ Links ]

20. Schoenfeld, A. (1989). Exploring of students’ mathematical believes and behavior. Journal for Research in Mathematics Education, 20, 338-350.        [ Links ]

21. Stenhouse, L. (1998). La Investigación como Base de la Enseñanza. Madrid: Ediciones Morata.         [ Links ]

22. Wadsworth, G. y Bryan, J. (1979). Aplicaciones de la Teoría de probabilidad y Variables Aleatorias. Madrid: Alhambra.        [ Links ]

23. Tversky, A. y Kahneman, D. (1982). Evidential impact of base rates. In D. Kahneman & A. Tversky (Eds), Judgment under uncertainty: Heuristics and biases (pp 153-160). New York: Cambridge University Press.        [ Links ]