Cómo leer gráficos como un científico de datos

Vivimos en la era de los datos. Noticias, reportes, estudios científicos, informes de empresas: todo viene acompañado de gráficos. Pero la mayoría de las personas los miran sin realmente leerlos. Ven subir y bajar líneas, barras más grandes y más pequeñas, pero no capturan el mensaje completo. Aprender a interpretar gráficos es una de las habilidades más prácticas que puedes desarrollar, y no requiere ser matemático.

Gráficos de barras: comparaciones que importan

Los gráficos de barras son quizás los más comunes y los más malinterpretados. Cuando ves barras verticales u horizontales representando valores, lo primero que debes preguntarte es: ¿cuál es la escala? ¿Desde dónde empiezan las barras? Si una barra muestra "100" y otra "101", pueden parecer casi iguales o dramáticamente diferentes dependiendo de si el eje Y empieza en 0 o en 95.

Este detalle no es menor. Muchos gráficos engañososManipulan la escala para exaggerar diferencias. Un político puede mostrar un gráfico donde sus aprobación sube de 40% a 41% y la barra parece tres veces más grande usando una escala que empieza en 39. La diferencia real es de 1 punto porcentual, un cambio marginal. Pero visualmente parece un salto dramático.

También presta atención a qué representan las barras exactamente. Si comparas el presupuesto de tres departamentos en una empresa, ¿son valores absolutos o per cápita? ¿dolares totales o porcentaje del presupuesto? Sin estas claves, la comparación puede ser completamente meaningless. Un departamento con 10 empleados y 10 millones de presupuesto es muy diferente de uno con 100 empleados y los mismos 10 millones.

Gráficos de líneas: tendencias y tiempo

Los gráficos de líneas son ideales para mostrar cómo algo cambia con el tiempo. La pendiente de la línea indica la velocidad del cambio. Una línea que sube suavemente indica crecimiento steady; una línea que sube en escalones indica cambios intermitentes. Pero aquí también hay trampas.

La escala del tiempo importa tanto como la escala de valores. Si un gráfico muestra "ventas mensuales durante los últimos 5 años", cada punto podría representar el promedio del mes o el total acumulado. Si las ventas de diciembre siempre son más altas por la temporada, un gráfico con promedios mensuales esconderá ese patrón estacional mientras uno con totales acumulados lo exagerará.

Las líneas de tendencia son útiles, pero no mágico. Si dibujas una línea recta a través de puntos que claramente no están en línea recta, estás imponiendo un modelo que no corresponde a la realidad. Un fenómeno que crece primero lentamente, luego rápidamente y luego se estabiliza no es lineal, aunque una línea recta pueda pasar cerca de los puntos. En esos casos, una curva representa mejor la realidad.

Gráficos de tartas y círculos: el arte de las proporciones

Los gráficos circulares o de tartas son populares pero frecuentemente misused. Su propósito es mostrar cómo un todo se divide en partes. El problema es que el cerebro humano es muy malo estimando proporciones a partir de ángulos circulares. Es mucho más fácil comparar longitudes horizontales que áreas circulares.

Cuando veas un gráfico de tartas, pregunta siempre: ¿cuánto suman todas las partes? Deberían ser 100%. Si hay partes que no llegan a 100%, significa que hay categorías no mostradas. Si supera 100%, hay un error. Esta verificación básica evita muchos equívocos.

Intenta evitar gráficos de tartas con más de 5 o 6 categorías. Cuando hay demasiados sectores pequeños, la visualización se vuelve illegible. En esos casos, es mejor agrupar las categorías menores en un "otros" o usar un gráfico de barras en su lugar. Un buen científico de datos sabe que el mejor gráfico es el que comunica claramente, no el que parece más sofisticado.

También cuidado con los gráficos 3D. Aunque lucen más impressive, distorsionan las proporciones. La parte del círculo que aparece más cercana al espectador parece más grande solo por la perspectiva, sin relación con su valor real. Es una técnica common en publicidad y presentaciones empresariales para exaggerar logros o minimizar problemas.

Mapas de calor y visualizaciones avanzadas

Los mapas de calor (heatmaps) usan color para representar valores. Donde más intenso el color, mayor el valor. Son especialmente útiles para datos geográficos o matriciales. Una tabla con 50 estados y 12 meses es impossible de interpretar como números; como mapa de calor, los patrones se vuelven inmediatamente visibles.

Al leer un mapa de calor, pregunta cuál es la paleta de colores. ¿Es secuencial (de claro a oscuro en un solo color) o divergente (de un color a otro pasando por blanco)? Las paletas divergentes son mejores cuando hay un valor medio importante (como cero) y quieres ver tanto valores altos como bajos. Las paletas secuenciales funcionan mejor para datos que solo varían de bajo a alto sin punto medio especial.

El error más común con mapas de calor es asumir que los colores tienen las mismas transiciones en todo el rango. Si 0 es blanco, 50 es amarillo y 100 es rojo, la diferencia visual entre 0 y 10 es mayor que entre 10 y 20? No necessariamente. El cerebro humano no percibe los colores de forma linear. Los científicos de datos professionals usan paletas diseñadas para que transiciones numéricas iguais correspondan a transiciones visuales iguais.

En última instancia, leer gráficos bien es cuestionar lo que ves. ¿Quién hizo este gráfico y con qué propósito? ¿Qué datos faltan? ¿Las escalas son razonables? ¿El tipo de gráfico chosen es el más apropiado para estos datos? Estas preguntas no te hacenskeptic: te hacen un lector inteligente. En un mundo inundado de información visual, esa es la habilidad más valiosa de todas.

Etiquetas:MatemáticasAprendizajeEstadística