Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Resolucion de problemas de regresión lineal, Ejercicios de Estadística Inferencial

Este documento incluye aproximadamente 10 ejercicio de estadística inferencial resueltos

Tipo: Ejercicios

2022/2023

Subido el 24/03/2023

juan-reyes-81
juan-reyes-81 🇲🇽

1 documento

1 / 23

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
INSTITUTO TECNOLOGICO SUPERIOR DE URUAPAN
INGENIERIA INDUSTRIAL
ESTADISTICA INFERENCIAL II
UNIDAD 1 REGRECIÓN LINEAL MULTIPLE
SUBTEMA “REGRESIÓN LINEAL MULTIPLE”
EQUIPO 3
LÓPEZ LÓPEZ CLAUDIA ITZEL
FISCAL RODRIGUES FRANCISCO JAVIER
GARCIA TORRES JESUS FERNANDO
ARZATE CASTILLO ANGEL RODRIGO
REYES RUIZ JUAN
3B
FRANCISCO JESUS AREVALO
27/02/2023
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17

Vista previa parcial del texto

¡Descarga Resolucion de problemas de regresión lineal y más Ejercicios en PDF de Estadística Inferencial solo en Docsity!

INSTITUTO TECNOLOGICO SUPERIOR DE URUAPAN

INGENIERIA INDUSTRIAL

ESTADISTICA INFERENCIAL II

UNIDAD 1 REGRECIÓN LINEAL MULTIPLE

SUBTEMA “REGRESIÓN LINEAL MULTIPLE”

EQUIPO 3

LÓPEZ LÓPEZ CLAUDIA ITZEL

FISCAL RODRIGUES FRANCISCO JAVIER

GARCIA TORRES JESUS FERNANDO

ARZATE CASTILLO ANGEL RODRIGO

REYES RUIZ JUAN

3B

FRANCISCO JESUS AREVALO

INTRODUCCIÒN

El análisis de regresión tiene como objetivo modelar de forma matemática el

comportamiento de una o mas variables independientes (factores).

El modelo de mayor orden son dos variables independientes que no se comportan de

manera lineal, podemos hacer que se comporten de manera lineal. Vamos a asumir que

los errores tienen una distribución normal de media cero y las variables explicativas son

independientes entre si. Es necesario evaluar la verdadera contribución de los parámetros

a lla explicación de la respuesta (Claudia López)

Introducción

En este trabajo se abordará el tema de regresión, que es el proceso de predicción de un

valor continuo en la que hay dos tipos de variables: una variable dependiente y una o más

independientes.( Rodrigo Arzate)

La matriz de datos Y es el conjunto de todas las observaciones en cuanto a la variable

dependiente se observaron en el experimento, de aquí que va de y1 hasta y12 con respecto a

la totalidad de observaciones n = 12.

La matriz de datos X representa en realidad los valores de las variables independientes ya sean

en cuadrados, cubos, productos cruzados u otras funciones de las variables de predicción. Se

observa que la primera columna de la matriz X es una columna de unos, por tanto, estamos

insertando un valor de x, específicamente x0, como coeficiente de b0. Donde x0 siempre es igual

a 1.

La siguiente matriz representa los estimadores del modelo, para cada parámetro de la matriz ß

hay una columna en la matriz X.

La última matriz representa el error aleatorio e inherente a todo modelo de regresión.

c) Proporcione la expresión matricial para los estimadores de mínimos cuadrados.

  • Entonces la solución de mínimos cuadrados para la estimación de Ba B1.P2 B a.ß a, implica

encontrar b para la que:

SSE - (y-Xb) (y - X0)

se minimiza. Este proceso de minimización implica resolver para b en la ecuación:

a/ab (SSEI)=

El resultado se reduce a la solución de b en: (X'X) B = X'Y

Podemos escribir la solución para el coeficiente de regresión como

B= (XX)

  • 1

XY

De esta forma se puede obtener la ecuación de predicción o la ecuación de regresión al resolver un

conjunto de k + 1 ecuaciones con un número igual de incógnitas, Esto implica la inversión de la

matriz XX de k + 1 por k + 1.

d) Especifique la hipótesis de significancia del modelo y lo que significa aceptar o rechazar esta

hipótesis.

  • La hipótesis más importante sobre un modelo de regresión múltiple consiste en ver Si la

regresión es significativa:

Ho: B1=B2= B3=B4=

HA: Bj≠ 0

Para al menos un j= 1, 2, 3,

o Aceptar Ho indica que ningún término en el modelo tiene una contribución

significativa al explicar la variable de respuesta, Y.

o Rechazar Ho implica que por lo menos un término en el modelo contribuye de

manera significativa a explicar Y.

e) De la expresión del estadístico de prueba, F0: para la hipótesis anterior, así como una

explicación racional de por qué funciona como estadístico de prueba, es decir, vea cuando este

estadístico tiene valores grandes o pequeños, y lo que eso significa en términos de calidad de

ajuste.

F0 =CMR/CME

  • La hipótesis nula anterior se rechaza si: F0>F (a, 4, 7)

Dado que un estadístico es una medida cuantitativa, derivada de un conjunto de datos de

una muestra, con el objetivo de estimar o contrastar características de una población o

modelo estadístico, en este caso nos permite aceptar o rechazar la hipótesis, cuando el valor

de F0 es mayor que el valor F(a, 4, 7) implica que debemos descartar la hipótesis nula y

aceptar la alternativa que nos habla de una significación del modelo, además si Fo es

notablemente grande refiere a una mayor significancia dado que se aleja del criterio de

rechazo establecido.

f) Formule las hipótesis sobre los parámetros individuales del modelo y comente que significa

aceptar o rechazar cada una de estas.

Ha: Bj=

Ho: Bj≠ 0 J= 1, 2, 3, 4

Aceptar la hipótesis nula, para cualquier estimador, indica que el mismo no contribuye

esencialmente a predecir Y en general, en caso contrario, rechazar hipótesis nula y por consiguiente

aceptar la hipótesis alternativa, indica que el parámetro Bj es significativo.

g) Proporcione la expresión para el estadístico de prueba para el caso anterior y comente porque

estos estadísticos funcionan como criterio de aceptación o rechazo.

  • La hipótesis nula anterior se rechaza si: t0>t(a/2,7)

La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de estadísticos

descriptivos previos: el número de observaciones, la media y la desviación típica en cada grupo. A

Los supuestos de normalidad, varianza e independencia se cumplen.

Prueba de hipótesis

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 2 127.250 63.6250 30.19 0.

pH 1 91.125 91.1250 43.25 0.

Temperatura 1 36.125 36.1250 17.14 0.

Error 7 14.750 2.

Falta de ajuste 2 10.750 5.3750 6.72 0.

Error puro 5 4.000 0.

Total 9 142.

Regresión = 𝐻 0

1

2

𝐴

1

2

R= la hipótesis nula se rechaza por lo tanto el modelo es significativo

pH = 𝐻 0

1

𝐴

1

R.= la hipótesis nula se rechaza por lo tanto el pH es significativo

Temperatura = 𝐻

0

2

𝐴

2

R.= la hipótesis nula se rechaza por lo tanto la temperatura es significativa

Coeficientes de determinación

Resumen del modelo

S R-cuad.

R-cuad.

(ajustado)

R-cuad.

(pred)

1.45160 89.61% 86.64% 76.21%

El modelo es adecuado porque 𝑅

2

2

𝑎𝑗𝑢𝑠. Son mayores a 0.7 o 70%

e) ¿Cree que valdría la pena pensar en añadir otro término al modelo para mejorar el

ajuste? Argumente.

R.= No nos conviene agregar otro termino, porque el modelo es bueno.

  1. Repita el problema anterior, pero ahora ajustando el modelo 𝑦 = 𝛽 0

1

1

2

2

12

1

2

a) ¿Cuáles son las variables independientes y cuál la dependiente? Argumente.

R.= la variable dependiente es el espesor y las variables independientes son el pH, la

temperatura y 𝑥 1

2

b) Ajuste un modelo del tipo 𝑦 = 𝛽

0

1

1

2

2

12

1

2

  • 𝜀. y anote la ecuación

del modelo ajustado.

Ecuación de regresión

Espesor = - 3.88 + 11.25 pH - 0.438 Temperatura + 0.469 X1X

c) A partir del modelo ajustado, ¿cuál es el espesor estimado cuando se utiliza un pH

=2 y una temperatura de 10 grados?

R.= 𝑦 = − 3. 88 + 11. 25

d) ¿El modelo es adecuado? Argumente con base en graficas de residuos, o pruebas

de hipótesis y coeficientes de determinación.

R.= Los supuestos de normalidad, varianza e independencia se cumplen.

R-cuad. R-cuad.

S R-cuad. (ajustado) (pred)

Es un buen modelo, pero el mejor modelo es el que tiene menos variables, así que me

quedaría con el otro modelo o buscar uno nuevo.

  1. Considere los datos que aparecen en la siguiente tabla:

a) Ajuste el siguiente modelo Y = b 0

  • b 1

X

1

b 2

X

2

  • E , es decir, encuentre los estimadores

de mínimos cuadrados para estos coeficientes de regresión.

Término Coef

Constante 0.

X1 0.

X2 0.

b) A partir del modelo ajustado, estime la respuesta media cuando x1 = 8 y x2 = 7; ¿este

valor es diferente al observado en las mismas condiciones? De ser así, ¿por qué ocurre

esto?

Si hay diferencia por que 5 es el valor observado, el valor matemático tiene un error

c) Haga la estimación por intervalo para la respuesta media en el punto anterior.

ic de 95%

d ) Construya un intervalo de predicción para una observación futura teniendo x1 = 8 y x

IC de 95%

e) Explique las diferencias entre los dos intervalos anteriores.

El intervalo de predicción mide la probabilidad que caiga en uno de esos números

f ) ¿Las estimaciones anteriores son adecuadas? Argumente con base en la calidad de

ajuste del modelo.

R-cuad. R-cuad.

S R-cuad. (ajustado) (pred)

Si por que son mayores al 70%

22. Se realizó un experimento para estudiar el sabor del queso panela en función de la

cantidad del cuajo y la sal. La variable de respuesta observada es el sabor promedio

reportado por un grupo de cinco panelistas que probaron todos los quesos y los

calificaron con una escala hedónica. Los datos obtenidos se muestran a continuación:

Sal Cuajo Sabor

a) Ajuste el modelo 𝒀 = 𝜷𝟎 + 𝜷𝟏𝑿𝟏 + 𝑩𝟐𝑿𝟐

Ecuación de regresión

y = 7.30 - 0.183 x1 + 1.26 x

b) ¿El modelo explica la variación observada en el sabor? Argumente con base en la

significancia del modelo, los residuales y el coeficiente de determinación.

Con base en la Significancia el modelo no explica la variación observada, de acuerdo a la

prueba de hipótesis:

El valor de P = 0.867 no es menor que ∝ (0.05), por lo que la hipótesis nula se acepta y me

dice que el modelo no es significativo.

d) Compare el error estándar de estimación (√CM E

) y los coeficientes de determinación (R

y R2aj) para ambos modelos.

Modelo 1 Modelo 2

Error 0.50081 0.

R2 R-cuad. 5.5492% R-cuad. 93.18%

R2aj R-cuad.(ajustado) 0.0000% R-cuad.(ajustado) 84.08%

El modelo 2 tiene un menor error y una mayor calidad del ajuste

e) ¿Cuál modelo prefiere para explicar el sabor?

El segundo Modelo

Ecuación de regresión

y = 5.40 + 4.77 x1 - 70.4 x2 - 0.495 x12 + 119.4 x

  1. En el área de desarrollo de una empresa se pretende obtener un nuevo polímero de

bajo peso molecular (Y1); de lograrse esto, se obtendrá un polímero que funcione como

dispersante en la industria de la cerámica.

De acuerdo con los conocimientos técnicos que se tienen, se considera que los factores

críticos son X1: per sulfato de sodio (NaPS), X2: ácido hipofosforoso (H3PO2) y X3:

isopropanol (IPA). Para encontrar las condiciones óptimas se realizó un experimento y se

obtuvieron los siguientes datos (los valores de los factores están codificados). Además de

Y1 se midió la viscosidad (Y2).

X1 X2 X3 Y1 Y

  • 1 - 1 0 9895 2325
  • 1 1 0 7882 690
  • 1 0 - 1 8939 1188
  • 1 0 1 9152 1275

a) Ajuste el modelo para la variable Y1.

Ecuación de regresión

Y1 = 8683.5 - 252 X1 - 1094 X2 - 21 X

b) ¿El modelo explica la variación observada en Y1? Argumente, con base en

la significancia del modelo, los residuales y los coeficientes de

determinación.

Con base en la Significancia el modelo explica la variación observada, de acuerdo a

la prueba de hipótesis:

El valor de P = 0.000 es menor que ∝ (0.05), por lo que la hipótesis nula se

RECHAZA y eso dice que el modelo es significativo.

RESIDUALES

Normalidad ✔

Varianza Constante ✔

Independencia ✔

d) Compare el error estándar de estimación (CM

E

) y los coeficientes de

determinación (R2 y R2aj) para ambos modelos.

Modelo 1 Modelo 2

Error 131348 87568

R2 R-cuad.87.47% R-cuad.96.20%

R2aj R-cuad.(ajustado)84.05% R-cuad.(ajustado)89.37%

El modelo 2 tiene un menor error y una mayor calidad del ajuste referente a los

coeficientes de determinación.

e) Con base en lo anterior, proponga un modelo que considere que sólo tiene

términos significativos. Ajústelo y haga un análisis completo sobre éste.

Ecuación de regresión

Y1 = 8684 - 1094 X

El termino X2 era el único que tenía una alta significancia en el modelo anterior y solo con

este término se obtiene un buen modelo.

  1. En el área de desarrollo de una empresa se pretende obtener un nuevo polímero de

bajo peso molecular (Y1); de lograrse esto, se obtendrá un polímero que funcione como

dispersante en la industria de la cerámica.

De acuerdo con los conocimientos técnicos que se tienen, se considera que los factores

críticos son X1: per sulfato de sodio (NaPS), X2: ácido hipofosforoso (H3PO2) y X3:

isopropanol (IPA). Para encontrar las condiciones óptimas se realizó un experimento y se

obtuvieron los siguientes datos (los valores de los factores están codificados). Además de

Y1 se midió la viscosidad (Y2).

X1 X2 X3 Y1 Y

  • 1 - 1 0 9895 2325
  • 1 1 0 7882 690
  • 1 0 - 1 8939 1188
  • 1 0 1 9152 1275

24. Realice el ejercicio anterior pero ahora para la variable y2. Destaque similitudes y

diferencias

a) Ajuste el modelo Y = b 0

  • b 1

X

1

b 2

X

2

  • b 3

x 3

para la variable Y2.

y2 = 1351 - 212 x1 - 1057 x2 - 535 x

b) ¿El modelo explica la variación observada en Y2? Argumente, con base en la

significancia del modelo, los residuales y los coeficientes de determinación. Con

base a la información no se muestra una variación observada El valor de P = 0.039 no es

menor que ∝ (0.05), por lo que la hipótesis nula se acepta y me dice que el modelo no es

significativo.

x2^2 1 1290017 1290017 1.91 0.

x3^2 1 596197 596197 0.88 0.

x1*x2 1 57600 57600 0.09 0.

x1*x3 1 6162 6162 0.01 0.

x2*x3 1 4961756 4961756 7.33 0.

Error 5 3384639 676928

Falta de ajuste 3 3372422 1124141 184.03 0.

Error puro 2 12217 6108

Total 14 22389990

De acuerdo a la calidad del ajuste se observa en los valores de P de cada variable que

solo la variable X2 tiene significancia en el modelo

Después de realizar el análisis de ambas y se puede apreciar las siguientes similitudes y

diferencias

SIMILITUDES: ambas se rechazan y comparten la varianza x2 como la mas significante

generando así graficas similares

DIFERENCIAS: los ajustes son cantidades menores en y2 a y1 así como el histograma

de residuos y1 tiene una mayor cantidad de estos a comparación de y

25. Se tiene un proceso de extrusión para producir harina instantánea de amaranto. Una

de las variables que interesa minimizar es el índice de solubilidad en agua (ISA) y los

factores que se controlan son: temperatura (X1), porcentaje de humedad (X2) y velocidad

de tornillo (X3). Con las variables independientes codificadas, los datos obtenidos

mediante un diseño de experimentos Box-Behnken se muestran a continuación:

X1 X2 X3 ISA

Ecuación de regresión

ISA = 13.857 - 1.021 x1 - 0.130 x2 - 0.931 x

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 3 15.4166 5.13888 2.79 0.

x1 1 8.3436 8.34361 4.52 0.

x2 1 0.1352 0.13520 0.07 0.

x3 1 6.9378 6.93781 3.76 0.

Error 11 20.2945 1.

Falta de ajuste 9 2 0.2817 2.25352 352.11 0.

Error puro 2 0.0128 0.

Total 14 35.

Resumen del modelo

R-cuad. R-cuad.