La figura de forma violín: una forma de visualizar la distribución de datos

En el análisis de datos, a veces la mediana y la media no son suficientes para comprender un conjunto de datos. ¿La mayoría de los valores están agrupados alrededor de la mediana? ¿O están agrupados alrededor del mínimo y el máximo sin nada en el medio? Cuando tienes preguntas como estas, los gráficos de distribución pueden ser de gran ayuda.

El gráfico de caja es una herramienta común para visualizar distribuciones básicas. Es conveniente para comparar estadísticas resumidas (como el rango y los cuartiles), pero no permite ver las variaciones en los datos. Para distribuciones multimodales (aquellas con múltiples picos), esto puede ser especialmente limitante.

Pero no te preocupes, aquí es donde entra en juego la figura de forma violín.

Índice de Temáticas

¿Qué es una figura de forma violín?

Una figura de forma violín es una combinación de un gráfico de caja y un gráfico de densidad de kernel, que muestra los picos en los datos. Se utiliza para visualizar la distribución de datos numéricos. A diferencia de un gráfico de caja que solo puede mostrar estadísticas resumidas, las figuras de forma violín representan estadísticas resumidas y la densidad de cada variable.

Cómo leer una figura de forma violín

Las figuras de forma violín tienen muchas de las mismas estadísticas resumidas que los gráficos de caja:

  • El punto blanco representa la mediana.
  • La barra gris gruesa en el centro representa el rango intercuartil.
  • La línea gris delgada representa el resto de la distribución, excepto los puntos que se consideran valores atípicos utilizando un método que es una función del rango intercuartil.

En cada lado de la línea gris hay una estimación de densidad de kernel para mostrar la forma de distribución de los datos. Las secciones más anchas de la figura de forma violín representan una mayor probabilidad de que los miembros de la población adopten el valor dado; las secciones más delgadas representan una probabilidad menor.

Suficiente teoría. Veamos algunos ejemplos. Utilizaremos Seaborn, una biblioteca de Python diseñada específicamente para crear visualizaciones estadísticas.

Ejemplos de figuras de forma violín

Figura de forma violín básica

En este ejemplo, utilizaremos un conjunto de datos que contiene registros de 71 pollitos de seis semanas de edad y observaciones sobre su tipo de alimento, sexo y peso.

La figura de forma violín muestra la relación entre el tipo de alimento y el peso de los pollitos. Los elementos del gráfico de caja muestran que el peso mediano de los pollitos alimentados con horsebean es menor que para otros tipos de alimento. La forma de la distribución (extremadamente delgada en cada extremo y ancha en el medio) indica que los pesos de los pollitos alimentados con sunflower se concentran en gran medida alrededor de la mediana.

Figura de forma violín horizontal con observaciones

Al igual que los gráficos de barras horizontales, las figuras de forma violín horizontales son ideales para tratar con muchas categorías. Intercambiar los ejes permite que las etiquetas de las categorías tengan más espacio.

Puedes eliminar los elementos tradicionales del gráfico de caja y representar cada observación como un punto. Los puntos son útiles cuando tu conjunto de datos incluye observaciones de una población completa (en lugar de una muestra selecta). Cuando tienes toda la población a tu disposición, no necesitas hacer inferencias para una población no observada; puedes evaluar lo que tienes frente a ti.

Reducir la banda de kernel genera gráficos más irregulares, lo que puede ayudar a identificar grupos minoritarios, como la cola de los pollitos alimentados con casein.

Figura de forma violín agrupada

Las figuras de forma violín también pueden ilustrar una variable categórica de segundo orden. Puedes crear grupos dentro de cada categoría. Por ejemplo, puedes hacer un gráfico que distinga entre pollitos machos y hembras dentro de cada grupo de tipo de alimento.

El gráfico de forma violín agrupado muestra que los pollitos hembras tienden a pesar menos que los machos en cada categoría de tipo de alimento. Además, puedes sacar conclusiones sobre cómo varía la diferencia de peso según el sexo en las diferentes categorías: la diferencia de peso mediana es más pronunciada para los pollitos alimentados con linseed que para los alimentados con soybean.

Figura de forma violín agrupada con violines divididos

En lugar de dibujar gráficos separados para cada grupo dentro de una categoría, puedes crear violines divididos y reemplazar el gráfico de caja con líneas discontinuas que representan los cuartiles para cada grupo.

Los violines divididos te ayudarán a comparar las distribuciones de cada grupo. Por ejemplo, podrías notar que los pollitos hembras alimentados con sunflower tienen una distribución de cola larga por debajo del primer cuartil, mientras que los machos tienen una distribución de cola larga por encima del tercer cuartil.

Lectura adicional sobre figuras de forma violín

Si eres nuevo en el análisis de datos, te recomendamos nuestros tutoriales gratuitos de SQL y Python para comenzar.

Artículos recomendados:

  • cómo usar seaborn para crear visualizaciones estadísticas
  • introducción a los gráficos de densidad de kernel
  • cómo interpretar un gráfico de caja

Espero que este artículo te haya brindado una comprensión básica de la figura de forma violín y cómo utilizarla para visualizar la distribución de datos. ¡Prueba a crear tus propias figuras de forma violín y qué historias pueden contar tus datos!

Si quieres conocer otros artículos parecidos a La figura de forma violín: una forma de visualizar la distribución de datos puedes visitar la categoría Violín.

Vanessa-Mae

Soy Vanessa Mae, una apasionada del violín reconocida a nivel mundial por mi dedicación a la música. Nací en Singapur y crecí en el Reino Unido, donde descubrí mi amor por este instrumento. Mi carrera musical ha sido una emocionante aventura, marcada por la fusión de la música clásica con influencias modernas. A lo largo de los años, he lanzado álbumes aclamados por la crítica y he tenido la oportunidad de explorar diversos géneros musicales. Además, tuve el honor de representar a Tailandia en los Juegos Olímpicos de Invierno de 2014 en Sochi, compitiendo en esquí alpino. A través de mi blog personal, comparto mi pasión por el violín y mi experiencia en el mundo de la música, con la esperanza de inspirar a otros a explorar este maravilloso arte.

Subir