Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Problemas Resueltos de Regresión Simple: Aplicaciones y Análisis de Datos, Ejercicios de Estadística

Una colección de problemas resueltos relacionados con la regresión simple, una técnica estadística fundamental para analizar la relación entre dos variables. Los problemas cubren diversos aspectos de la regresión simple, incluyendo la interpretación de coeficientes, la predicción de valores, la evaluación de la significancia del modelo y el análisis de residuos. Los ejemplos prácticos ilustran cómo aplicar la regresión simple en diferentes contextos, como la predicción del consumo de energía en viviendas, la eficiencia de sistemas de energía solar y la relación entre el peso de las naranjas y el volumen de jugo extraído.

Tipo: Ejercicios

2023/2024

Subido el 03/12/2024

kevin-huamani-valencia
kevin-huamani-valencia 🇵🇪

2 documentos

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
EDP
Regresión Simple
PROBLEMAS RESUELTOS
UNIVERSIDAD DE PIURA
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Problemas Resueltos de Regresión Simple: Aplicaciones y Análisis de Datos y más Ejercicios en PDF de Estadística solo en Docsity!

EDP

Regresión Simple

PROBLEMAS RESUELTOS

UNIVERSIDAD DE PIURA

Tema 9 : Regresión simple

1. La presión arterial incluye dos mediciones: la presión sistólica, también conocida como presión alta, y la presión

diastólica, también conocida como presión baja. Ambas guardan relación. Se han medido ambas presiones a un conjunto

de 50 personas. Se muestra la nube de puntos junto a su recta de regresión, y el resultado de la regresión que

porporciona el minitab.

Responde de forma justificada a las siguientes cuestiones. Asumiremos que se cumplen las hipótesis básicas.

a) Interpreta los coeficientes de la regresión

b) ¿Qué presión alta se predice para alguien que tiene 80 de presión baja?

c) ¿Qué presión alta se predice para alguien que tiene 110 de presión baja?

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

a) Interpreta los coeficientes de la regresión

  • 𝛽

̂

0

: Sería la presión alta que se predice para alguien que tiene 0 de presión baja, lo cual es imposible.

Puede verse que no está en el rango de datos, por lo que este coeficiente no tiene interpretación.

práctica.

  • 𝛽

̂

1

: Cuando la presión baja aumenta en una unidad el valor esperado de la presión alta aumenta en

0.9588 unidades.

b) ¿Qué presión alta se predice para alguien que tiene 80 de presión baja?

  1. 77 + 0. 9588 × 80 = 129. 47

c) ¿Qué presión alta se predice para alguien que tiene 110 de presión baja?

Esta predicción no se puede realizar con esta regresión, pues el valor de X se sale del rango observado

d) ¿Cuál es la probabilidad de que una persona que tenga 80 de presión baja tenga más de 120 de presión

alta?

Para 𝑋 = 80 el valor de Y será 𝑌 ∼ 𝑁( 129. 47 ; 9. 02

2

)

Tema 9 : Regresión simple

3. Los granos de cereales deben estar secos antes de ser

envasados. Unos técnicos de laboratorio recogen datos

sobre la humedad de los granos después de un

tratamiento en el horno. Se realiza con Minitab una

regresión que predice el porcentaje de humedad (en escala

0 - 1) en función del tiempo de secado en el horno,

obteniéndose los siguientes resultados:

a) ¿Es el tiempo de secado significativo? Justifica.

b) Escribe la ecuación de la regresión.

c) Interpreta los coeficientes de la ecuación de regresión.

d) Interpreta el coeficiente R-cuad

e) ¿Qué puede concluirse de las gráficas de residuos? Justifica.

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

a) Sí lo es, pues el p-valor del contraste de significatividad individual es 0.000, por lo que se rechaza que 𝛽

1

b) 𝑌

= 0. 147 − 0. 000911 𝑋 , con Y=porcentaje de humedad, y X= tiempo

c) El término constante (0.147: 14.7%) sería la humedad prevista cuando los cereales pasan 0 unidades de tiempo en el

horno de secado. Es decir, sería la humedad media de los cereales antes de entrar al horno. Es posible que esta

interpretación no sea fiable si no se han observado datos de humedad en esas circunstancias, pues el enunciado dice

que los datos utilizados son “después de un tratamiento en el horno “.

El término constante dice que por cada unidad de tiempo adicional que estén los cereales en el horno, el contenido

medio de humedad disminuye en 0.0009 (0.09%)

d) El tiempo de permanencia en el horno explica el 45.18% del contenido de humedad de los cereales a la salida del

horno

e) El gráfico de residuos frente a valores previstos muestra un patrón de curvatura, aunque no es muy fuerte. Por tanto,

la linealidad no parece muy buena.

El histograma y el gráfico de probabilidad muestran que los residuos no son muy normales, aunque el alejamiento

de la normalidad tampoco es muy acusado.

Problemas de Estadística y Probabilidad

4. En una ciudad, se ha tomado una muestra de viviendas para construir un modelo que prediga el consumo mensual de

energía (kWh) de la vivienda en función del número de habitantes de la vivienda. El minitab ofrece estos resultados

a) ¿El número de habitantes en una vivienda es significativo para predecir la energía consumida en un mes? Responda,

en un máximo de dos líneas.

b) ¿Qué se puede comentar sobre el modelo a partir de la gráfica A?

c) ¿Qué se puede comentar sobre el modelo a partir de la gráfica B? Responda en un máximo de dos líneas. Debe

justificar sus afirmaciones.

d) Asumiendo que se cumplen las hipótesis básicas del modelo, ¿cuál es la probabilidad de que en una casa con 5

habitantes haya un consumo mayor que 150 KWh en un mes?

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

a) Sí, pues el p-valor de la prueba de significatividad es 0 (< 5%), por lo que se rechaza la hipótesis nula, es decir, se

rechaza que 𝛽 1

b) Se puede afirmar que los residuos se ajustan a una distribución normal, pues los puntos se alinean lo suficiente a la

gráfica de probabilidad normal.

c) Debido a que se evidencia una estructura en los puntos, se puede asumir que no hay linealidad en el modelo.

d) Si se cumplen las hipótesis básicas, entonces, cuando 𝑋 = 5 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠 :

2

Problemas de Estadística y Probabilidad

6. Se ha construido un modelo que permite predecir el volumen (ml) de jugo obtenido

al exprimir una naranja a partir de su peso (g). Asumiendo que se cumplen las

hipótesis de linealidad del modelo y normalidad del error, responda:

a) La variable peso tiene asociado un p- valor igual a 0. Indique cuáles son las

hipótesis asociadas al contraste a partir del cual ha sido calculado dicho p-

valor.

b) Interprete el coeficiente 𝛽

1

de la ecuación de la recta de regresión.

c) Interprete el valor del coeficiente de determinación.

d) ¿Cuál es la probabilidad de obtener más de 100 ml de jugo de una naranja

de 98 gramos?

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

a) El contaste de ese pvalor es 𝐻

0

1

1

1

b) Por cada gramo adicional que pese una naranja (0.25 p), el volumen de jugo extraído de ella aumentará en 0.

ml, en promedio.

c) El modelo explica el 47.98% de la variabilidad del volumen de jugo extraído

d) La probabilidad es:

2

)

Entonces:

Tema 9 : Regresión simple

7. Una empresa agrícola exporta uvas del tipo Crimson en empaques de 500 gramos. La empresa quiere valorar si las uvas

empacadas pierden peso con el paso del tiempo, por deshidratación. Con ese fin, se han almacenado 9 8 empaques en

una cámara frigorífica similar a la utilizada en el traslado real. Cada

empaque se ha pesado en el momento de ser introducido en la cámara

(Peso_0) y se ha vuelto a pesar a los 40 días (Peso_40). Para ver cómo se

relaciona el peso al inicio del experimento (Peso_0) y a los 40 días

(Peso_40) se realiza una regresión simple con Minitab, obteniéndose los

resultados que se adjuntan:

a) ¿Qué se puede concluir del gráfico de la izquierda?

b) ¿Es posible afirmar que entre ambas variables hay una relación lineal muy fuerte? Justifique.

c) Interprete los coeficientes de la regresión

d) ¿A qué contraste corresponde el pvalor del coeficiente de Peso_0?

e) Para un empaque que al inicio del experimento pesase 530 gramos, y a los 40 días pesase 510 gramos, ¿Cuál sería

el valor de su residuo?

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

a) Este gráfico es sobre la normalidad de los residuos. Los puntos no siguen la línea recta del gráfico de probabilidad

normal, por lo que se concluye que estos residuos no se distribuyen como una normal

b) El gráfico de la derecha, de residuos vs valores previstos, no muestra ninguna estructura no lineal, por lo que se puede

concluir que no hay relación no-lineal.

Además, el pvalor de la variable Peso_0 es muy bajo, por lo que la relación es significativa. Hay relación lineal

significativa, no es algo ‘casual’ de estos datos, sino algo que puede extrapolarse a la población.

Sin embargo, esa relación lineal no es muy fuerte, pues explica sólo el 48% (R2=48,29%) de la variabilidad del peso

en la semana 40.

c) 𝛽

0

: Este coeficiente mostraría el peso previsto en la semana 40 cuando en la semana 0 el peso es 0, lo que no tiene

sentido. Este coeficiente no tiene, por tanto, interpretación práctica.

1

: Cuando el peso del empaque en la semana 0 aumenta en un gramo, 40 semanas después, se prevé que aumente

en 0.95 gramos, y no el gramo que se añadió al inicio. Por tanto, en esas 40 semanas el peso disminuye, por término

medio, un 5% aproximadamente.

d) Al contraste de significatividad de la relación entre X e Y, es decir, al contraste 𝐻

0

1

1

1

Si Peso_0=530, el peso previsto a las 40 semanas es

= 16. 1565 + 0. 952866 × 530 = 521. 1755

Residuo 𝑒 = 𝑌 − 𝑌

Tema 9 : Regresión simple

9. Interpreta, de forma justificada, estas dos figuras que resultan de estimar una regresión simple.

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

Figura 1:

Los residuos no son normales.

  • El gráfico de probabilidad no muestra los puntos alineados, ni dentro de las bandas de confianza.
  • El pvalor del contraste de normalidad es, además muy bajo. Rechazamos la hipótesis de normalidad.

Figura 2:

  • La curvatura refleja que la relación entre peso y longitud es no lineal.
  • La dispersión es bastante homogénea. Los residuos son bastante homocedásticos, salvo una pequeña zona en

valores altos de valor ajustado.

Problemas de Estadística y Probabilidad

10. Interpreta, de forma justificada, estas dos figuras que resultan de estimar una regresión simple.

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

Figura 1:

Los residuos no son normales.

  • El gráfico de probabilidad no muestra los puntos alineados, ni dentro de las bandas de confianza.
  • El pvalor del contraste de normalidad es, además, muy bajo. Rechazamos la hipótesis de normalidad.

Figura 2:

  • La curvatura refleja que la relación entre peso y longitud es no lineal.
  • La dispersión es bastante homogénea. Los residuos son muy homocedásticos, salvo una pequeña zona en valores

altos de valor ajustado.

Problemas de Estadística y Probabilidad

12. El gerente de un establecimiento comercial ha elaborado un modelo de regresión para predecir las ventas semanales de

cierta marca de gaseosa en función de la temperatura. Con esta predicción de ventas podrá planificar mucho mejor su

inventario en función de las predicciones meteorológicas. La información que se tiene de un conjunto de 150 semanas es

la temperatura media semanal (ºC) y las ventas semanales, en litros. La siguiente figura muestra los resultados aportados

por el minitab.

Responde a las siguientes cuestiones:

a) Escribe la ecuación de la recta de

b) Interpreta los coeficientes de la regresión

c) Cuántas ventas se esperan conseguir una semana con temperatura media de 25 ºC. Justifica.

d) ¿Cuál es la correlación entre ambas variables? Justifica

e) ¿Qué se puede concluir de la Figura 1

f) ¿Qué se puede concluir de la Figura 2?

g) ¿Cuál es la probabilidad de que en una semana con temperatura media de 25 ºC se vendan más de 1100 litros de esa

bebida?

SOLUCIÓN….………………………………………………………………………………………………….............…………………….................……………………….……….

a) Ventas = 130. 4 + 34. 26 Temperatura

b) Coeficientes de la regresión

0

: sería las ventas que se predicen para una semana con temperatura 0ºC, valor que no está entre los datos

utilizados en la estimación (ver gráfica). Por tanto, no tiene interpretación práctica válida. La regresión no es

adecuada para predecir fuera del rango de los datos.

1

: Cuando la temperatura semanal media aumenta en un grado, las ventas aumentan, en promedio, 34.26 litros

c) Las ventas esperadas o previstas son 𝑉

= 130. 4 + 34. 26 × 25 = 986. 9 litros

Se puede realizar este cálculo, ya que la temperatura de 25º C está dentro del rango de los datos.

d) El coeficiente de correlación lo podemos obtener a partir del coeficiente de determinación que es 𝑅

2

2

2

2

En este caso, como la relación es positiva, le corresponde el signo +. Entonces

Tema 9 : Regresión simple

e) Esa figura representa los residuos frente a los valores previstos.

  • No se observa ninguna curvatura, por lo que asumimos que la relación entre temperatura y ventas es lineal,

al menos en el rango de valores observados. La hipótesis de linealidad en que se basa nuestra regresión es

correcta.

  • Como la dispersión de los puntos es bastante homogénea, puede asumirse que hay homocedasticidad, que

es otra de las hipótesis en las que se basa el modelo de regresión.

f) Esta figura es el gráfico de probabilidad normal de los residuos, junto con un contraste de normalidad.

Podemos asumir normalidad de los residuos, que es otra de las hipótesis básicas en las que se basa el modelo

de regresión, pues:

  • Los puntos aparecen muy alineados alrededor de la recta que representa la normal.
  • Además, el pvalor del contraste de normalidad es muy elevado

g) Si 𝑋 = 25 , entonces, 𝐸

= 130. 4 + 34. 26 × 25 = 986. 5_. Además, se tiene que_ 𝑆

𝑅

2

Dado que, según la figura 2, los errores son normales, se tiene que, para 𝑋 = 25

2

Es poco probable que se alcancen esas ventas con esa temperatura