















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este documento incluye aproximadamente 10 ejercicio de estadística inferencial resueltos
Tipo: Ejercicios
1 / 23
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
El análisis de regresión tiene como objetivo modelar de forma matemática el
comportamiento de una o mas variables independientes (factores).
El modelo de mayor orden son dos variables independientes que no se comportan de
manera lineal, podemos hacer que se comporten de manera lineal. Vamos a asumir que
los errores tienen una distribución normal de media cero y las variables explicativas son
independientes entre si. Es necesario evaluar la verdadera contribución de los parámetros
a lla explicación de la respuesta (Claudia López)
Introducción
En este trabajo se abordará el tema de regresión, que es el proceso de predicción de un
valor continuo en la que hay dos tipos de variables: una variable dependiente y una o más
independientes.( Rodrigo Arzate)
La matriz de datos Y es el conjunto de todas las observaciones en cuanto a la variable
dependiente se observaron en el experimento, de aquí que va de y1 hasta y12 con respecto a
la totalidad de observaciones n = 12.
La matriz de datos X representa en realidad los valores de las variables independientes ya sean
en cuadrados, cubos, productos cruzados u otras funciones de las variables de predicción. Se
observa que la primera columna de la matriz X es una columna de unos, por tanto, estamos
insertando un valor de x, específicamente x0, como coeficiente de b0. Donde x0 siempre es igual
a 1.
La siguiente matriz representa los estimadores del modelo, para cada parámetro de la matriz ß
hay una columna en la matriz X.
La última matriz representa el error aleatorio e inherente a todo modelo de regresión.
c) Proporcione la expresión matricial para los estimadores de mínimos cuadrados.
encontrar b para la que:
SSE - (y-Xb) (y - X0)
se minimiza. Este proceso de minimización implica resolver para b en la ecuación:
a/ab (SSEI)=
El resultado se reduce a la solución de b en: (X'X) B = X'Y
Podemos escribir la solución para el coeficiente de regresión como
De esta forma se puede obtener la ecuación de predicción o la ecuación de regresión al resolver un
conjunto de k + 1 ecuaciones con un número igual de incógnitas, Esto implica la inversión de la
matriz XX de k + 1 por k + 1.
d) Especifique la hipótesis de significancia del modelo y lo que significa aceptar o rechazar esta
hipótesis.
regresión es significativa:
Ho: B1=B2= B3=B4=
HA: Bj≠ 0
Para al menos un j= 1, 2, 3,
o Aceptar Ho indica que ningún término en el modelo tiene una contribución
significativa al explicar la variable de respuesta, Y.
o Rechazar Ho implica que por lo menos un término en el modelo contribuye de
manera significativa a explicar Y.
e) De la expresión del estadístico de prueba, F0: para la hipótesis anterior, así como una
explicación racional de por qué funciona como estadístico de prueba, es decir, vea cuando este
estadístico tiene valores grandes o pequeños, y lo que eso significa en términos de calidad de
ajuste.
Dado que un estadístico es una medida cuantitativa, derivada de un conjunto de datos de
una muestra, con el objetivo de estimar o contrastar características de una población o
modelo estadístico, en este caso nos permite aceptar o rechazar la hipótesis, cuando el valor
de F0 es mayor que el valor F(a, 4, 7) implica que debemos descartar la hipótesis nula y
aceptar la alternativa que nos habla de una significación del modelo, además si Fo es
notablemente grande refiere a una mayor significancia dado que se aleja del criterio de
rechazo establecido.
f) Formule las hipótesis sobre los parámetros individuales del modelo y comente que significa
aceptar o rechazar cada una de estas.
Ha: Bj=
Ho: Bj≠ 0 J= 1, 2, 3, 4
Aceptar la hipótesis nula, para cualquier estimador, indica que el mismo no contribuye
esencialmente a predecir Y en general, en caso contrario, rechazar hipótesis nula y por consiguiente
aceptar la hipótesis alternativa, indica que el parámetro Bj es significativo.
g) Proporcione la expresión para el estadístico de prueba para el caso anterior y comente porque
estos estadísticos funcionan como criterio de aceptación o rechazo.
La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de estadísticos
descriptivos previos: el número de observaciones, la media y la desviación típica en cada grupo. A
Los supuestos de normalidad, varianza e independencia se cumplen.
Prueba de hipótesis
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 2 127.250 63.6250 30.19 0.
pH 1 91.125 91.1250 43.25 0.
Temperatura 1 36.125 36.1250 17.14 0.
Error 7 14.750 2.
Falta de ajuste 2 10.750 5.3750 6.72 0.
Error puro 5 4.000 0.
Total 9 142.
Regresión = 𝐻 0
1
2
𝐴
1
2
R= la hipótesis nula se rechaza por lo tanto el modelo es significativo
pH = 𝐻 0
1
𝐴
1
R.= la hipótesis nula se rechaza por lo tanto el pH es significativo
Temperatura = 𝐻
0
2
𝐴
2
R.= la hipótesis nula se rechaza por lo tanto la temperatura es significativa
Coeficientes de determinación
S R-cuad.
R-cuad.
(ajustado)
R-cuad.
(pred)
1.45160 89.61% 86.64% 76.21%
El modelo es adecuado porque 𝑅
2
2
𝑎𝑗𝑢𝑠. Son mayores a 0.7 o 70%
e) ¿Cree que valdría la pena pensar en añadir otro término al modelo para mejorar el
ajuste? Argumente.
R.= No nos conviene agregar otro termino, porque el modelo es bueno.
1
1
2
2
12
1
2
a) ¿Cuáles son las variables independientes y cuál la dependiente? Argumente.
R.= la variable dependiente es el espesor y las variables independientes son el pH, la
temperatura y 𝑥 1
2
b) Ajuste un modelo del tipo 𝑦 = 𝛽
0
1
1
2
2
12
1
2
del modelo ajustado.
Espesor = - 3.88 + 11.25 pH - 0.438 Temperatura + 0.469 X1X
c) A partir del modelo ajustado, ¿cuál es el espesor estimado cuando se utiliza un pH
=2 y una temperatura de 10 grados?
d) ¿El modelo es adecuado? Argumente con base en graficas de residuos, o pruebas
de hipótesis y coeficientes de determinación.
R.= Los supuestos de normalidad, varianza e independencia se cumplen.
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
Es un buen modelo, pero el mejor modelo es el que tiene menos variables, así que me
quedaría con el otro modelo o buscar uno nuevo.
a) Ajuste el siguiente modelo Y = b 0
1
b 2
2
de mínimos cuadrados para estos coeficientes de regresión.
Término Coef
Constante 0.
b) A partir del modelo ajustado, estime la respuesta media cuando x1 = 8 y x2 = 7; ¿este
valor es diferente al observado en las mismas condiciones? De ser así, ¿por qué ocurre
esto?
Si hay diferencia por que 5 es el valor observado, el valor matemático tiene un error
c) Haga la estimación por intervalo para la respuesta media en el punto anterior.
ic de 95%
d ) Construya un intervalo de predicción para una observación futura teniendo x1 = 8 y x
IC de 95%
e) Explique las diferencias entre los dos intervalos anteriores.
El intervalo de predicción mide la probabilidad que caiga en uno de esos números
f ) ¿Las estimaciones anteriores son adecuadas? Argumente con base en la calidad de
ajuste del modelo.
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
Si por que son mayores al 70%
a) Ajuste el modelo 𝒀 = 𝜷𝟎 + 𝜷𝟏𝑿𝟏 + 𝑩𝟐𝑿𝟐
Ecuación de regresión
y = 7.30 - 0.183 x1 + 1.26 x
b) ¿El modelo explica la variación observada en el sabor? Argumente con base en la
significancia del modelo, los residuales y el coeficiente de determinación.
Con base en la Significancia el modelo no explica la variación observada, de acuerdo a la
prueba de hipótesis:
El valor de P = 0.867 no es menor que ∝ (0.05), por lo que la hipótesis nula se acepta y me
dice que el modelo no es significativo.
d) Compare el error estándar de estimación (√CM E
) y los coeficientes de determinación (R
y R2aj) para ambos modelos.
Modelo 1 Modelo 2
Error 0.50081 0.
R2 R-cuad. 5.5492% R-cuad. 93.18%
R2aj R-cuad.(ajustado) 0.0000% R-cuad.(ajustado) 84.08%
El modelo 2 tiene un menor error y una mayor calidad del ajuste
e) ¿Cuál modelo prefiere para explicar el sabor?
El segundo Modelo
Ecuación de regresión
y = 5.40 + 4.77 x1 - 70.4 x2 - 0.495 x12 + 119.4 x
bajo peso molecular (Y1); de lograrse esto, se obtendrá un polímero que funcione como
dispersante en la industria de la cerámica.
De acuerdo con los conocimientos técnicos que se tienen, se considera que los factores
críticos son X1: per sulfato de sodio (NaPS), X2: ácido hipofosforoso (H3PO2) y X3:
isopropanol (IPA). Para encontrar las condiciones óptimas se realizó un experimento y se
obtuvieron los siguientes datos (los valores de los factores están codificados). Además de
Y1 se midió la viscosidad (Y2).
Ecuación de regresión
Y1 = 8683.5 - 252 X1 - 1094 X2 - 21 X
Con base en la Significancia el modelo explica la variación observada, de acuerdo a
la prueba de hipótesis:
El valor de P = 0.000 es menor que ∝ (0.05), por lo que la hipótesis nula se
RECHAZA y eso dice que el modelo es significativo.
Normalidad ✔
Varianza Constante ✔
Independencia ✔
E
Modelo 1 Modelo 2
Error 131348 87568
R2 R-cuad.87.47% R-cuad.96.20%
R2aj R-cuad.(ajustado)84.05% R-cuad.(ajustado)89.37%
El modelo 2 tiene un menor error y una mayor calidad del ajuste referente a los
Ecuación de regresión
Y1 = 8684 - 1094 X
bajo peso molecular (Y1); de lograrse esto, se obtendrá un polímero que funcione como
dispersante en la industria de la cerámica.
De acuerdo con los conocimientos técnicos que se tienen, se considera que los factores
críticos son X1: per sulfato de sodio (NaPS), X2: ácido hipofosforoso (H3PO2) y X3:
isopropanol (IPA). Para encontrar las condiciones óptimas se realizó un experimento y se
obtuvieron los siguientes datos (los valores de los factores están codificados). Además de
Y1 se midió la viscosidad (Y2).
24. Realice el ejercicio anterior pero ahora para la variable y2. Destaque similitudes y
diferencias
a) Ajuste el modelo Y = b 0
1
b 2
2
x 3
para la variable Y2.
y2 = 1351 - 212 x1 - 1057 x2 - 535 x
b) ¿El modelo explica la variación observada en Y2? Argumente, con base en la
significancia del modelo, los residuales y los coeficientes de determinación. Con
base a la información no se muestra una variación observada El valor de P = 0.039 no es
menor que ∝ (0.05), por lo que la hipótesis nula se acepta y me dice que el modelo no es
significativo.
x2^2 1 1290017 1290017 1.91 0.
x3^2 1 596197 596197 0.88 0.
x1*x2 1 57600 57600 0.09 0.
x1*x3 1 6162 6162 0.01 0.
x2*x3 1 4961756 4961756 7.33 0.
Error 5 3384639 676928
Falta de ajuste 3 3372422 1124141 184.03 0.
Error puro 2 12217 6108
Total 14 22389990
De acuerdo a la calidad del ajuste se observa en los valores de P de cada variable que
solo la variable X2 tiene significancia en el modelo
Después de realizar el análisis de ambas y se puede apreciar las siguientes similitudes y
diferencias
SIMILITUDES: ambas se rechazan y comparten la varianza x2 como la mas significante
generando así graficas similares
DIFERENCIAS: los ajustes son cantidades menores en y2 a y1 así como el histograma
de residuos y1 tiene una mayor cantidad de estos a comparación de y
25. Se tiene un proceso de extrusión para producir harina instantánea de amaranto. Una
de las variables que interesa minimizar es el índice de solubilidad en agua (ISA) y los
factores que se controlan son: temperatura (X1), porcentaje de humedad (X2) y velocidad
de tornillo (X3). Con las variables independientes codificadas, los datos obtenidos
mediante un diseño de experimentos Box-Behnken se muestran a continuación:
Ecuación de regresión
ISA = 13.857 - 1.021 x1 - 0.130 x2 - 0.931 x
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 3 15.4166 5.13888 2.79 0.
x1 1 8.3436 8.34361 4.52 0.
x2 1 0.1352 0.13520 0.07 0.
x3 1 6.9378 6.93781 3.76 0.
Error 11 20.2945 1.
Falta de ajuste 9 2 0.2817 2.25352 352.11 0.
Error puro 2 0.0128 0.
Total 14 35.
Resumen del modelo
R-cuad. R-cuad.