








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este taller práctico explora el análisis de datos de vinos utilizando el lenguaje de programación r. Se realiza un análisis exploratorio de datos, incluyendo la descripción de variables cuantitativas y cualitativas, así como la visualización de relaciones bidimensionales entre variables como la calidad del vino y su aroma, cuerpo, sabor y claridad. Se analizan las diferencias en la calidad del vino según la región de origen. El taller proporciona una introducción al uso de herramientas computacionales para el análisis de datos en el contexto de la enología.
Tipo: Ejercicios
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
David Alejandro Rodríguez, Juan Felipe Erazo, Gabriel Esteban Lara, Jhojan Sebastián Jojoa, Rubén Darío Maya, Stefania Muriel y Yuliana Alejandra Guerrero 2025-03-
Primero cargamos la base de datos dentro del chunk. Luego, dentro del mismo se cambiaron los nombres de las variables segun el orden requerido. Se ocultaron los códigos con la función echo=FALSE, warning=FALSE e inlcude=FALSE. Mediante el uso de la función kable se realizó una tabla de frecuencias con el fin de describir de mejor manera la variable región e identificar la distribución de datos en las regiones. clarida d arom a cuerp o sabo r aroma c calida d regio n 1 3.3 2.8 3.1 4.1 9.8 1 1 4.4 4.9 3.5 3.9 12.6 1 1 3.9 5.3 4.8 4.7 11.9 1 1 3.9 2.6 3.1 3.6 11.1 1 1 5.6 5.1 5.5 5.1 13.3 1 1 4.6 4.7 5.0 4.1 12.8 1 Posteriormente, se utilizó la función kable(head) para poder visualizar sólamente en encabezado de los datos con los cambios solicitados.
Para realizar este punto se utilizó la función kable , donde, inicialmente se analizó de forma unidimensional cada una de las variables. Posteriormente, mediante el uso de las funciones del paquete ggplot2 , se realizó el análisis bidimensional de la variable calidad con el resto de variables del estudio.
Resumen de la Base de Datos Vinos (Variables Cuantitativas) claridad aroma cuerpo sabor aromac calidad Min. :0. 0 Min. :3. 0 Min. :2. 0 Min. :2. 0 Min. :2. 0 Min. : 7. 1st Qu.:0. 1st Qu.:4. 1st Qu.:4. 1st Qu.:4. 1st Qu.:3. 1st Qu.:11. Median :1. 0000 Median :4. 650 Median :4. 750 Median :4. 800 Median :4. 100 Median :
Mean :0. 37 Mean :4. 47 Mean :4. 84 Mean :4. 68 Mean :4. 55 Mean :12. 44 3rd Qu.:1. 3rd Qu.:5. 3rd Qu.:5. 3rd Qu.:5. 3rd Qu.:4. 3rd Qu.:13. Max. :1. 0 Max. :7. 0 Max. :6. 0 Max. :7. 0 Max. :6. 0 Max. :16. 0 Se realizó un resumen estadístico de la base de datos. En relación con la claridad de los vinos, se observa que la mayoría de los valores son cercanos a
Tabla de Frecuencias para la Variable Región (Variable Cualitativa) Regió n Frecuenci a 1 17 2 9 3 12
El gráfico muestra la relación entre el aroma del vino y su calidad, con un área sombreada en verde y una línea de tendencia. Se observa una dirección ascendente, donde la calidad tiende a aumentar a medida que el aroma mejora. Sin embargo, en niveles bajos de aroma (entre 3 y 5), la calidad presenta fluctuaciones con picos y caídas abruptas, lo que indica una mayor variabilidad. A partir de un aroma de 5 en adelante, la calidad se estabiliza y sigue una tendencia ascendente más clara. Esto sugiere que los vinos con mejor aroma suelen recibir una mejor valoración en calidad, aunque en los niveles más bajos podrían estar influyendo otros factores.
El gráfico muestra la relación entre el cuerpo del vino y su calidad, evidenciando una tendencia positiva. A medida que el cuerpo del vino aumenta, la calidad también tiende a incrementarse, lo que sugiere que esta característica influye de manera significativa en la percepción de la calidad del vino. La línea azul también sugiere esta relación mostrando una orientación ascendente, indicando que, en términos generales, los vinos con mayor cuerpo tienden a tener mayor calidad. Además, se observa cierta dispersión en los datos, con valores que se desvían de la tendencia principal, esto podria estar relacionado con la poca cantidad de datos o con otras variables no contempladas en el estudio.
El gráfico muestra la relación entre el aroma del y la calidad de los vinos, evidenciando un patrón no lineal. Se observa que, a medida que el aromac aumenta, la calidad del vino no varía significativamente. pero más allá de ese punto, el efecto podría no ser notorio. Sin embargo, la dispersión de los datos indica que la relación no es completamente concluyente por lo cual, no se puede establecer una influencia clara entre ambas variables.
La gráfica anterior, sugiere que los vinos de la Región 3 tienen la mejor calidad, con una mediana cercana a 15 y una media similar, mientras que la Región 2 presenta los valores más bajos, con una media y mediana cercanas a
El análisis muestra una relación positiva entre el sabor, la calidad del vino y el aroma, lo que se evidencia por la tendencia ascendente de la curva de ajuste, además la distribución del aroma se representa a través de los colores azul rosado y rojo en orden creciente. Sin embargo, existe una alta dispersión en los datos, indicando que otros factores también pueden influir en la calidad. El color de los puntos revela que los vinos con mayor aroma (tonos rojos) tienden a tener una mejor calidad, mientras que aquellos con menor aroma (tonos azules) se concentran en la parte inferior del gráfico. Se concluye que, existe una asociación positiva entre la calidad, el sabor y el aroma de los vinos. No obstante, la dispersión de los datos indica que la calidad no depende únicamente de estas variables.
A continuación, se presentan de manera general las conclusiones de los puntos previamente desarrollados:
La claridad del vino no tiene una relación directa con su calidad, aunque la mayoría de los vinos son claros, la calidad varía ampliamente, lo que indica que otros factores pueden influir más en el producto final. No obstante, aroma y la calidad del vino están directamente relacionados; a medida que el aroma aumenta, la calidad del vino tiende a mejorar. De manera similar, se observa una relación positiva entre el cuerpo del vino y su calidad: a mayores puntuaciones en cuerpo, mayor es la calidad percibida. Asimismo, los datos indican que existe una relación positiva entre el sabor y la calidad del vino; a medida que la puntuación del sabor mejora, la calidad también tiende a aumentar. En contraste, no se observa una relación clara entre el aromac y la calidad debido a la dispersión de los datos. En cuanto a la región, la calidad del vino varía significativamente entre diferentes zonas.; la Región 3 produce vinos de mayor calidad en comparación con las Regiones 1 y 2, lo que podría deberse a factores como el clima, el tipo de suelo o prácticas específicas de vinificación en cada región. El análisis muestra que la influencia de la claridad del vino en su calidad no es uniforme y varía según la región. Mientras que en algunas zonas la calidad se mantiene estable o mejora con mayor claridad, en otras se observa una disminución en ciertos niveles intermedios. Esto sugiere que la relación entre claridad y calidad puede estar condicionada por factores externos no contemplados en el estudio, lo que resalta la importancia del contexto específico en la producción y valoración del vino. En cuanto a la relación entre la calidad del vino con su sabor y aroma, se observa una tendencia positiva: los vinos con mayor aroma tienden a tener mejor calidad. Sin embargo, la alta dispersión en los datos indica que la calidad del vino no depende exclusivamente de estas variables. Con base en estos hallazgos, se concluye que la calidad del vino es un atributo complejo influenciado por múltiples factores. Sin embargo, otros aspectos no considerados en este estudio podrían tener un impacto significativo, lo que sugiere que la evaluación de la calidad del vino requiere un enfoque integral que contemple diversas características y variables. Además, la dispersión general de los datos, posiblemente debido al reducido tamaño de la muestra, es un elemento clave a considerar en futuras investigaciones sobre la calidad del vino.
“Calidad”) + theme_minimal() + theme( plot.title = element_text(hjust = 0.5, face = “bold”, size = 14), axis.title = element_text(face = “bold”, size = 12) ) #Calidad vs Aroma ggplot(Vinos, aes(x = aroma, y = calidad)) + geom_area(fill = “#7FFF00”, alpha = 0.6) + geom_line(color = “#458B00”, size = 1.2) + labs(title = “Tendencia de Calidad según Aroma”, x = “Aroma”, y = “Calidad”) + theme_minimal() #Calidad vs Cuerpo ggplot(vinos, aes(x = cuerpo, y = calidad)) + geom_line(color = “cyan3”, alpha = 0.6) + geom_smooth(method = “lm”, se = FALSE, color = “blue”) + labs(title = “Relacion entre Cuerpo y Calidad del Vino”, x = “Cuerpo”, y = “Calidad”) +geom_point(color=“darkblue”)+ theme_minimal() #Calidad vs Sabor ggplot(vinos, aes(x = sabor, y = calidad, color = calidad)) + geom_point(alpha = 0.7, size = 3) + scale_color_gradient(low = “orange”, high = “red”) + labs(title = “Relacion entre Calidad y Sabor”, x = “Sabor”, y = “Calidad”) + theme_minimal()
g_boxplot <- ggplot(Vinos, aes(x = factor(region), y = calidad)) + geom_boxplot(fill = “#00BFFF”, color = “#1E90FF”, alpha = 0.9, outlier.color = “#7B68EE”, outlier.size = 3) + # Azul celeste con bordes azul fuerte y outliers en morado stat_summary(fun = mean, geom = “point”, shape = 18, size = 5, color = “#00FFFF”) + # Media en cyan brillante labs(title = “Distribución de la Calidad por Región”, x = “Región”, y = “Calidad”) + theme_minimal() + theme( plot.title = element_text(hjust = 0.5, face = “bold”, size = 16, color = “#4682B4”), # Título en azul acero axis.title = element_text(face = “bold”, size = 14, color = “#5F9EA0”), # Etiquetas de ejes en azul verdoso axis.text = element_text(size =
12, color = “#1E90FF”), # Texto de ejes en azul fuerte panel.background = element_rect(fill = “#F0F8FF”, color = NA) # Fondo azul muy claro ) g_boxplot
#Grafico de Perfiles Medios: Claridad vs Calidad vs Región ggplot(Vinos, aes(x = claridad, y = calidad, group = as.factor(region), color = as.factor(region))) + stat_summary(fun = mean, geom = “line”, size = 1) + stat_summary(fun = mean, geom = “point”, size = 3) + scale_color_manual(values = c(“#E63946”, “#457B9D”, “#2A9D8F”)) + labs(title = “Gráfico de Perfiles Medio de Calidad por Claridad y Región”, x = “Claridad”, y = “Calidad Media”, color = “Región”) + theme_minimal() + theme( legend.title = element_text(color = “blue”, face = “bold”), axis.title.x = element_text(size = 12, face = “bold”, color = “black”), axis.title.y = element_text(size = 12, face = “bold”, color = “black”) )
#Calidad vs Aroma vs Sabor ggplot(vinos, aes(x = sabor, y = calidad, color = aroma)) + geom_point(size = 3, shape = 17) + # Cambia la forma de los puntos (ejemplo: triángulo) geom_smooth(method = “loess”, fill = “gray”, linetype = “dashed”, alpha = 0.3)
“hotpink”, “red”)) + labs(title = “Relación entre Sabor, Aroma y Calidad del Vino”, x = “Sabor”, y = “Calidad”, color = “Aroma”) + theme_minimal(base_size = 15) + theme( plot.title = element_text(size = 20, face = “bold”), axis.title = element_text(size = 14, face = “italic”) )