Artículos sobre ciencia y tecnología de Mauricio-José Schwarz publicados originalmente en El Correo y otros diarios del Grupo Vocento
Mostrando entradas con la etiqueta estadística. Mostrar todas las entradas
Mostrando entradas con la etiqueta estadística. Mostrar todas las entradas

octubre 22, 2012

Pareto y la maldición de la revista

Dos curiosidades relacionadas con la estadística que, si no se tienen en cuenta, pueden llevarnos a conclusiones erróneas sobre nuestro mundo.

Sports Illustrated hizo referencia en 2001 a la
supuesta maldición de sus portadas.
Sabemos que la economía no es una ciencia, al menos no todavía, pues no puede predecir acontecimientos con un alto grado de certeza con base en leyes y observaciones diversas como lo hacen, por ejemplo, los astrónomos, cuando prevén el ciclo de 11 años de nuestro sol.

Pero la economía tiene algunos logros apasionantes por su peculiaridad, por ejemplo, el que se conoce popularmente como “Ley de Pareto”, aunque, curiosamente, no fue enunciada por Pareto.

Vilfredo Pareto fue un ingeniero, sociólogo, economista y matemático de fines del siglo XIX y principios del siglo XX, que buscó convertir la economía en ciencia mediante la observación, la medición y el análisis estadístico de los datos, pese a entender que la economía tiene una fuerte componente subjetiva debido a las emociones, creencias y demás peculiaridades de los seres humanos.

Pareto estableció el llamado “óptimo de Pareto” como medida de la eficiencia de una economía, por ejemplo la distribución de bienes en una sociedad, que ocurre cuando no se puede mejorar la situación de nadie sin dañar la de otros. Dicho de otro modo, cuando todos los participantes quedan al menos en la misma posición y al menos un participante queda en una situación claramente mejor.

En su intento por entender la riqueza, Pareto estudió la concentración de la riqueza en distintas sociedades y llegó a la conclusión de que en todos los países, los ingresos se concentraban más en las minorías y se iban distribuyendo a lo largo de la sociedad de forma decreciente. Esta ley se expresa coloquialmente como el llamado “principio de Pareto del 20-80”, es decir, más o menos el 20 por ciento de la población de cualquier país tiende a poseer el 80% de la riqueza.

Este principio fue ampliado por el economista Joseph Juran, que se dio cuenta de que el principio era aplicable a otros aspectos de la vida social y económica. Es decir, aunque la proporción puede ser distinta, una pequeña parte de todo esfuerzo para conseguir algo tiende a ser esencial y una gran parte es menos relevante. Juran fue quien lo llamó, “principio de Pareto”.

Aunque no se sabe cuál es la causa de este fenómeno, el principio de Pareto como aproximación general ha demostrado su validez empíricamente una y otra vez. Así, se ha descubierto que más o menos el 20% de los clientes de un negocio son responsables del 80% de sus ventas, o que el 80% de la contaminación está provocado por el 20% de los vehículos.

Una expresión del principio de Pareto fue la causante de la revolución del control de calidad (especialidad de Juran) que han vivido las empresas a partir de la década de los 70, permitiendo a las empresas concentrarse en los defectos o problemas que más ventas les costaban.

La regresión a la media

Entre los deportistas de Estados Unidos existe el mito de “la maldición de Sports Illustrated”, según la cual, cuando un deportista destaca tanto que llega a la portada de esta prestigiosa revista, automáticamente tiende a bajar su rendimiento.

Lo más curioso es que este mito se hace realidad en muchas ocasiones. Tantas que la propia revista hizo referencia a esta “maldición” en 2002, cuando puso un gato negro en la portada afirmando que ningún deportista quería posar para ella.

¿Es verdad que hay una maldición?

En realidad no. Lo que ocurre es que muchos deportistas llegan a la portada de esta revista debido a una serie de logros singulares y fuera de lo común en sus carreras, algo que los estadísticos conocen como un “valor atípico”. Ha superado, pues, su propia media, determinada en algún valor de su deporte: goles anotados, posición en la tabla de tenistas, asistencias en baloncesto o cualquiera otra variable. De pronto, durante una época determinada, el rendimiento sube alejándose de la media, el deportista llama la atención y su trabajo es más notorio, por lo cual la revista Sports Illustrated decide ponerlo en su portada.

Pero, por decirlo de algún modo, todo lo que sube tiene que bajar. O, puesto en lenguaje de los estadísticos, mientras más se aparte una variable aleatoria de su media, mayor será la probabilidad de que esa desviación disminuya en el futuro. O, en otras palabras, un acontecimiento extremo muy probablemente estará seguido de un acontecimiento menos extremo. Esto, para el jugador que durante unos cuantos partidos anotó más goles de los que solía anotar de media, significa que lo más probable es que regrese a su media en los siguientes partidos. O, como dirían los cronistas deportivos, tuvo una racha y se le terminó.

Los estadísticos le llaman a este fenómeno “regresión a la media”, un término bastante claro y que le debemos a Sir Francis Galton, quien lo descubrió estudiando la estatura media de hijos cuyos padres eran extremadamente altos o extremadamente bajos. Lo que descubrió este investigador fue que los hijos de padres muy altos tendían, claro, a ser altos... pero menos que sus padres, mientras que los hijos de padres muy bajitos tendían a ser de también de corta estatura, pero más altos que sus padres (todo esto en términos de poblaciones y grandes números, por supuesto que en casos individuales puede haber, y de hecho hay, excepciones).

La regresión a la media también nos explica fenómenos como el de la concesión de lotería que puede en un momento dar tres o cuatro premios gordos y luego no volver a dar ninguno durante muchos años, como suele ser normal. La regresión a la media también explica, asombrosamente, el alivio que nos pueden proporcionar algunos tratamientos pertenecientes a la pseudomedicina. Cuando hace crisis una enfermedad, afortunadamente, no tendemos a seguir cada vez peores hasta morir, sino que los síntomas (desde estornudos y moqueos hasta dolores de espalda) tienden, salvo excepciones, a volver a su situación anterior. Nuestro cuerpo regresa a su situación de salud media, el curandero se anota el éxito y pagamos la factura sin darnos cuenta de que ahí ha habido tanta relación causa-efecto entre los rituales del curandero y nuestra mejoría como la que hay entre aparecer en Sports Illustrated y caer hasta nuestro nivel habitual como golfistas. O como cualquier cosa que hagamos que nos haya salido bien por puro azar en un par de ocasiones.

No funciona cuando eres muy bueno

Hay deportistas excepcionales cuya media de rendimiento es muy alta. Son “los mejores”. A ellos, así, no les afecta la maldición de Sports Illustrated ni otras supersticiones, pues llegan a la portada por su media de rendimiento y no excepcionalmente. Así, el legendario Michael Jordan apareció 49 veces en la portada sin sufrir ninguna disminución de rendimiento. Lo mismo pasó con Rafael Nadal o Pau Gasol.

agosto 06, 2011

Cómo nos engañan con números

Sahara Hotel and Casino 2
La bolita de la ruleta no 'recuerda' en qué número cayó la vez anterior.
(Foto CC de By Antoine Taveneaux, vía Wikimedia Commons) 
A diario enfrentamos afirmaciones sobre números que pretenden normar nuestro criterio o acciones, pero ¿sabemos lo que realmente significan?

Con cierta frecuencia, en los telediarios se expresa preocupación, porque alguna variable (las rentas de los municipios, el porcentaje de turistas, la población de vencejos) está “por debajo de la media” en algún lugar de España o del mundo. Como si estar “debajo de la media” fuera algo infrecuente e inherentemente malo.

Pero la “media” no es sino el promedio de varios datos, y precisamente por ello siempre existirán valores por debajo y por encima de la media. No es posible que todos los elementos de un grupo estén “por encima de la media”.

Hay muchos otros ejemplos de cómo nos engañan, o nos engañamos, con los números y que revelan que, según el neologismo del matemático John Allen Paulos, somos “anuméricos”, neologismo creado por analogía con “analfabeta”. Si “analfabeta” es quien no sabe usar y entender las letras, “anumérico” será quien “no sabe manejar cómodamente los conceptos fundamentales de número y azar”, como lo define John Allen Paulos en su libro “El hombre anumérico”. Según Allen Paulos, no es necesario ser matemático para comprender algunos conceptos esenciales que nos protegerían de los engaños que suelen desprenderse del manejo que los medios, los políticos, los publicistas, los pseudocientíficos y nosotros mismos hacemos de los números.

Uno de los engaños más extendidos, que incluye una gran cantidad de autoengaño, es la idea de que podemos afectar o conocer las probabilidades de los juegos de azar.

La ruina del apostador

Refiriéndonos a la lotería, todos hemos escuchado hablar de “números feos” o de que “ya toca que caiga” tal o cual número porque hace muchos sorteos que no ha resultado premiado un número que termine con él. “Números feos”, por cierto, son aquéllos que nos llamarían la atención si fueran premiados por ser demasiado bajos (digamos, el 00010) o repetitivos (como el 45554 o el 77777).

La idea que tenemos es que hay una especie de distribución “equitativa” o normal de los números que favorece que cada determinadas semanas salgan premiados números que terminen en todas las cifras del 0 al 9.

Esta idea ha llevado a la aparición de multitud de “sistemas” que pretenden predecir los resultados futuros a partir de los anteriores, sistemas que han llevado a la ruina a otros tantos apostadores.

Lo aleatorio no es ordenado, precisamente se define porque no existe modo de determinar con antelación el resultado de un proceso aleatorio. Todos sabemos que la probabilidad de que al lanzar una moneda caiga cara o cruz es de 1:2 o del 50% (descontando la rarísima eventualidad de que la moneda quede de canto). Sabiendo eso, si tiramos una moneda normal 9 veces y en todas cae cara, tenemos la sensación de que es “más probable” de que en la décima tirada por fin caiga cruz.

Pero la moneda (o las bolitas de la lotería en sus respectivos bombos, o las cartas del mazo, o los dados o cualquier otro elemento participante en un juego de azar) no tiene memoria. Es decir que, independientemente de nuestro sentido común, la décima tirada también tiene la misma probabilidad de que caiga cara o cruz. Por supuesto, si creemos que podemos vencer a las probabilidades, más fácil será que apostemos mayores cantidades al número que creemos que “tiene que salir”.

Salvo casos muy específicos donde el resultado no es del todo aleatorio, ningún sistema sirve para predecir los resultados de los juegos de azar. Sin embargo, la creencia popular en que hay cierto orden oculto detrás de lo aleatorio es lo que ha permitido la creación de emporios de las apuestas como Mónaco o Las Vegas.

El riesgo

Con frecuencia nos enteramos de que tal o cual factor (desde el consumo de tomates hasta el color de nuestro cabello) aumenta el riesgo de sufrir alguna enfermedad, generalmente cáncer, lo cual suele provocarnos inquietud y preocupación. Pero esos porcentajes son relativos a un riesgo que, generalmente, los medios omiten informarnos. Un 50% de aumento en el riesgo de un cáncer, por decir algo, suena a motivo de grave preocupación, quizá de alarma social. Pero ese porcentaje no significa lo mismo en cada caso.

Por ejemplo, el riesgo que tienen las mujeres de padecer un cáncer de laringe es del 0,14%, lo que significa que 14 de cada 10.000 mujeres sufrirán esta afección, mientras que el riesgo de cáncer mamario es del 12,15%, lo que se traduce en 1.215 de cada 10.000 mujeres afectadas. La diferencia entre el riesgo de uno u otro cáncer para una mujer determinada es verdaderamente enorme, y justifica que haya una preocupación por una detección temprana de la enfermedad.

Ahora pensemos que el informativo anuncia de un aumento del 50% en el riesgo de estas dos enfermedades. En la realidad, el riesgo de cáncer de laringe aumentaría a 0,21% mientras que el mismo aumento en el cáncer de mama representaría un 18,22%, una cifra socialmente atroz y muchísimo más preocupante.

Algo similar ocurre cuando aumenta la incidencia de una enfermedad en una zona determinada. Cuando en una escuela, por ejemplo, hay más casos de leucemia de los esperados, es razonable buscar una causa. Pero también debemos saber que puede no haber ninguna causa, sino que estemos frente a un fenómeno conocido como “clustering” o agrupamiento. Para ilustrarlo, podemos tomar un puñado de arroz y dejarlo caer al suelo. La distribución de los granos de arroz no será uniforme ni ordenada, sino verdaderamente aleatoria. Habrá granos separados paro también habrá agrupamientos o “clústeres” de granos, a veces muy grandes, aquí y allá, al igual que espacios vacíos. Lo que parece una “anormalidad” puede ser lo más normal por probabilidades.

Como nota al margen, los medios de comunicación suelen confundir el peligro con el riesgo, cuando se trata de dos cosas totalmente distintas. El peligro es absoluto y el riesgo es relativo. La mordedura de una víbora mamba negra es peligrosísima siempre, pero nuestro riesgo de ser mordidos por una es muy distinto si estamos en la plaza mayor de Salamanca o en el descampado en Kenya.

Entender el significado de los números, de la probabilidad, el azar y la estadística, de los números enormemente grandes y tremendamente pequeños puede ser un arma fundamental para protegernos de la desinformación y de usar en nuestro beneficio las bases de las tan odiadas –para muchos- matemáticas.

Entender los hechos

“En un mundo cada vez más complejo, lleno de coincidencias sin sentido, lo que hace falta en muchas situaciones no son más hechos verídicos –ya hay demasiados– sino un dominio mejoer de los hechos conocidos, y para ello un curso sobre probabilidad es de un valor incalculable” John Allen Paulos, “El hombre anumérico”, Tusquets.