









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
diseño de experimentos ultilizando
Tipo: Ejercicios
1 / 15
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
El análisis de varianza (ANOVA) es una técnica estadística utilizada para comparar las medias de tres o más grupos independientes. En un diseño completamente al azar (DCA), los sujetos de estudio se asignan aleatoriamente a diferentes grupos de tratamiento. Este diseño es común en estudios experimentales donde se busca evaluar el efecto de diferentes tratamientos o condiciones. Objetivo del Estudio: El objetivo de este estudio es investigar el efecto de diferentes tratamientos en el rendimiento de crecimiento de plantas utilizando un diseño completamente al azar. Algún ejemplo de DCA se muestra a continuación: Diseño del Experimento: Se asignaron aleatoriamente 30 plantas a tres grupos de tratamiento diferentes: Control (A), Tratamiento 1 (B), y Tratamiento 2 (C). Las plantas fueron cultivadas en condiciones idénticas, con la única diferencia siendo el tratamiento al que fueron sometidas. Variables: Variable Independiente: Grupo de Tratamiento (Control, Tratamiento 1, Tratamiento 2) Variable Dependiente: Rendimiento de Crecimiento de las Plantas Procedimiento: Asignación aleatoria de plantas a los tres grupos de tratamiento. Aplicación de los tratamientos correspondientes a cada grupo de plantas según el diseño experimental. Registro del rendimiento de crecimiento de cada planta al final del período de estudio. Datos Recolectados: Los datos recolectados incluyen el rendimiento de crecimiento de cada planta, medido en una escala específica al final del estudio, como se muestra en la tabla anterior. Análisis Estadístico: Se realizó un análisis de varianza (ANOVA) para determinar si hay diferencias significativas en el rendimiento de crecimiento entre los grupos de tratamiento. Se estableció un nivel de significancia de α = 0.05. Resultados del ANOVA: El análisis de varianza reveló una diferencia estadísticamente significativa en el rendimiento de crecimiento entre los grupos de tratamiento (F(2, 12) = 19.21, p < 0.05). Por lo tanto, rechazamos la hipótesis nula y concluimos que al menos dos grupos de tratamiento tienen efectos diferentes en el rendimiento de crecimiento de las plantas.
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
El diagrama de caja, también conocido como diagrama de caja y bigotes o boxplot en inglés, es una herramienta visual utilizada en estadística descriptiva para representar la distribución de un conjunto de datos y resumir su dispersión y tendencia central. En el contexto de un Diseño Completamente al Azar (DCA), el diagrama de caja es especialmente útil para visualizar y comparar la distribución de los datos entre diferentes grupos de tratamiento. Significado: El diagrama de caja muestra la distribución de los datos mediante una caja que representa el rango intercuartílico (IQR), que abarca desde el primer cuartil (Q1) hasta el tercer cuartil (Q3), y dos "bigotes" (líneas que se extienden desde la caja) que se extienden hasta los valores mínimos y máximos de los datos que no son considerados atípicos. Además, dentro de la caja se encuentra una línea que representa la mediana de los datos. Función: Visualización de la Distribución de los Datos: El diagrama de caja proporciona una representación visual de cómo están distribuidos los datos dentro de cada grupo de tratamiento en un DCA. Esto permite identificar de manera rápida y clara si hay diferencias en la dispersión de los datos entre los grupos. Comparación entre Grupos de Tratamiento: Al colocar varios diagramas de caja lado a lado, es posible comparar visualmente la distribución de los datos entre los diferentes grupos de tratamiento. Esto facilita la identificación de posibles diferencias en la dispersión y la tendencia central entre los grupos. Detección de Valores Atípicos: Los valores atípicos, que son datos que se encuentran significativamente alejados de la mayoría de los datos en un conjunto, pueden ser identificados fácilmente en un diagrama de caja. Estos valores pueden ser de importancia en la interpretación de los resultados y en la toma de decisiones en un estudio experimental. Resumen de la Distribución de los Datos: El diagrama de caja resume de manera concisa la dispersión y la tendencia central de los datos, proporcionando información sobre la variabilidad y la mediana de cada grupo de tratamiento en un DCA. En resumen, el diagrama de caja es una herramienta valiosa en un Diseño Completamente al Azar, ya que permite una visualización clara y concisa de la distribución de los datos y facilita la comparación entre diferentes grupos de tratamiento, así como la detección de valores atípicos. Esto ayuda a los investigadores a entender mejor los patrones de los datos y a tomar decisiones fundamentadas basadas en la evidencia proporcionada por los resultados del estudio.
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
En el análisis estadístico, las comparaciones de medias son fundamentales para determinar si existen diferencias significativas entre los grupos de tratamiento en un estudio experimental. Dos métodos comunes para realizar estas comparaciones son el LSD (Least Significant Difference, en inglés) y el método de Tukey, también conocido como prueba HSD (Honestly Significant Difference). Método LSD: El método de LSD es una prueba post hoc utilizada para comparar todas las combinaciones posibles de medias de tratamiento en un diseño experimental. Se calcula la diferencia mínima significativa entre las medias de los grupos de tratamiento, teniendo en cuenta el nivel de significancia establecido para el estudio. Si la diferencia entre las medias de dos grupos es mayor que el valor calculado de LSD, se considera que hay una diferencia significativa entre esos grupos. Método de Tukey: El método de Tukey es una prueba post hoc ampliamente utilizada que controla el error experimentar al comparar todas las combinaciones posibles de medias de tratamiento. En lugar de calcular una diferencia mínima significativa como en el método LSD, el método de Tukey compara las diferencias entre las medias con un valor crítico que tiene en cuenta el tamaño de la muestra y el número de comparaciones realizadas. Si la diferencia entre las medias de dos grupos es mayor que el valor crítico determinado por el método de Tukey, se considera que hay una diferencia significativa entre esos grupos. Comparación entre los Métodos: Ambos métodos, LSD y Tukey, son útiles para realizar comparaciones entre las medias de los grupos de tratamiento en un diseño experimental. Sin embargo, el método de Tukey es preferido en muchos casos debido a su capacidad para controlar el error experimentar y su mayor poder estadístico en comparación con el método LSD. El método de Tukey es especialmente útil cuando se realizan múltiples comparaciones, ya que ofrece una protección más sólida contra la probabilidad de cometer errores de tipo I. En resumen, tanto el método LSD como el método de Tukey son herramientas importantes en el análisis de datos experimentales, pero el método de Tukey es generalmente preferido debido a su capacidad para controlar el error experimentar y su mayor poder estadístico. Es importante seleccionar el método más adecuado según las características específicas del estudio y el nivel de significancia deseado.
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
1. Explique en que consiste y cuando se debe aplicar el diseño completamente al azar con un solo criterio de clasificación. Un diseño completamente al azar consiste en hacer las corridas experimentales en orden aleatorio y con material también seleccionado aleatoriamente, esto con la finalidad de aumentar la probabilidad de que el supuesto de independencia de los errores se cumpla, y generalmente se aplica en la comparación de los tratamientos en cuanto a sus medias poblacionales, para poder determinar una conclusión respecto a las mismas. 2. Supongamos que se desea probar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T de Student y al final tomar una decisión. Explique por qué esto aumenta el error tipo I. En este caso con cinco medias se tendrán diez posibles pares de medias, y si la probabilidad de aceptar la H0 para cada prueba individual es de 1-α = 0.95, entonces la probabilidad de aceptar las diez H0 es de (0.9510)10 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1-α)10 = 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador. 3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento? Es la suma de cuadrados divididos entre sus respectivos grados de libertad, y es una estimación de la magnitud de su correspondiente fuente de variabilidad. Estos valores esperados de los cuadrados medios están dados por: Dónde: Suma de cuadrados del error Total, de observaciones. Tratamientos o niveles del factor de interés.
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?
5. A continuación, se muestra parte del ANOVA para comparar cinco tratamientos con cuatro replicas cada uno. a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación. b) Explique de manera esquemática como calcularía el valor p o la significancia, observada para ver si hay diferencias entre parámetros. El valor de la significancia observada o valor-p es el área bajo la curva de la distribución, se calcula con la tabla de porcentaje de puntos de distribución de F, ocupando F4,15 = 3. 0.015 – 3. X – 3. 0.02 – 2. X = 0.0189 * 2= 0. Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrados Medios Fo Valor P Tratamientos 800 3 266.67 8.00 0. Error 400 12 33. Total 1200 15
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
7. Se desea investigar la influencia de la temperatura en el rendimiento de un proceso químico, en particular interesa investigar un rango de temperatura entre 60 y 120°C. Se tienen recursos para realizar 20 corridas experimentales. a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen cinco repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental usado? Argumente su respuesta, y de ser necesario proponga alternativas. Considero que el proceso es el adecuado, porque se dejaron fuera del estudio de intervalos que pueden tener significancia del proceso, desde 70 a 120 aunque no hay un espacio estudiado. Propongo hacer el intervalo de estudio empezando por el 60, luego 75, 90,
b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo experimental fue: primero las cinco del nivel bajo de temperatura, luego las cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su respuesta. No es lo correcto, los experimentos experimentales deben ser aleatorios para que el resultado no influya en el inmediato siguiente. c) Para hacer el análisis estadístico se comparan, mediante una prueba T de Student, de dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones. ¿Es adecuado tal análisis?, argumente, y en su caso proponga alternativas. No es el adecuado ya que aumenta el error tipo I: Rechazar la 𝐻 0 siendo esta la verdadera en cada par de medias.
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
de varianza, y explique la forma típica en que estos supuestos se verifican. Normalidad: Consiste en verificar que los residuos sigan una distribución normal con media cero y se verifica graficando los residuos en una escala X-Y de tal manera que si los residuos siguen una distribución normal al graficarlos tienden a quedar alineados en una línea recta. Varianza Constante: Comprobar que los residuos de cada tratamiento tienen la misma varianza, es verificado graficando los predichos contra los residuos y si los puntos en esta grafica se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente) entonces es señal de que se cumple el supuesto de que los tratamientos tienen igual varianza. Independencia: Probar que los residuos son independientes entre si, se verifica si se grafica el orden en que se colecto un dato contra el residuo correspondiente, de esta manera si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente definido, esto es evidencia de que existe una correlación entre los errores y, por lo tanto, el supuesto de independencia no se cumple.
Son los métodos que nos permiten hacer comparaciones entre todos los posibles pares de medias, y depende del número de tratamientos que identificamos cuales son los resultados, y se aplican cuando 𝐻 0 es rechazada (ya sea que todas las medias son iguales)
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación. a) Formule la hipótesis adecuada y el modelo estadístico. Hipótesis nula 𝐻 0 = 𝜇 1 = 𝜇 2 𝐻 0 = 𝜇 1 = 𝜇 3 𝐻 0 = 𝜇 2 = 𝜇 3 Hipótesis Alternativa 𝐻𝐴 = 𝜇 1 ≠ 𝜇 2 𝐻𝐴 = 𝜇 1 ≠ 𝜇 3 𝐻𝐴 = 𝜇 2 ≠ 𝜇 3 b) ¿Existe diferencia significativa entre la efectividad promedio de los productos en spray? La media de cada uno de los productos fueron los siguientes: 𝑀𝑎𝑟𝑐𝑎 1 = 69 𝑀𝑎𝑟𝑐𝑎 2 = 59. 16 𝑀𝑎𝑟𝑐𝑎 3 = 62. 83 A simple vista se puede deducir con esto, que la maraca 1 es la que presenta mayor efectividad, mientras que el producto 2 y 3 no tienen mucha diferencia, sin embargo, es prudente analizar la varianza de estos datos más a fondo.
UNIDAD 3. REALIZACIÓN DEL ANALISIS INGENIERÍA INDUSTRIAL
Considerablemente el spray de la marca 1, dado que la tabla ANOVA indica que existe diferencia entre las medias de los datos, sin embargo, el método LSD puede ser de utilidad para comprobar la 𝐻𝐴 que indica que al menos una de las medias es diferente con respecto al método utilizado.
de cada una de las marcas.
interprételos. Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrados Medios Fo Valor P Tratamientos 281.33 3 93.78 1.39 0. Error 810.636 12 67. Total 1091.966 15 1 69
667
667
Marca 1 Marca 2 Marca 3