



Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
atividades de revisão muito boa para introdução
Tipologia: Exercícios
1 / 7
Esta página não é visível na pré-visualização
Não perca as partes importantes!
“Introdução à Econometria”, Jefrey M. Wooldridge ANÁLISE DE REGRESSÃO MÚLTIPLA Obs.: os exercícios que indicam ‘arquivos’ para serem resolvidos são do livro do Wooldridge. Os arquivos necessários estão na pasta “Banco de dados Wooldridge”, na área “Programação em R”.
1. Um modelo simples para explicar as taxas de homicídio nas cidades ( taxahom ) em termos de probabilidade de condenação ( prcond ) e da duração media da sentença ( sentmed ) é taxhom = β 0 + β 1 prcond + β 2 sentmed + u. Que fatores estão contidos em u? Você entende ser provável que a hipótese E(u|x 1 ,x 2 )=0 se mantenha? 2. Suponha que você postula um modelo que explica a nota do exame final em termos da frequência às aulas. Assim, a variável dependente é a nota do exame final, e a principal variável explicativa é o número de aulas frequentadas. A fim de controlar as aptidões dos estudantes e pelos esforços fora da sala de aula, você inclui entre as variáveis explicativas a nota acumulada durante todo o curso, a nota do teste de avaliação de conhecimentos para ingresso em curso superior e as medidas do desempenho do estudante no ensino médio. Alguém diz: “ Você não pode esperar aprender nada com esse exercício, pois todas essas variáveis são, provavelmente, altamente colineares”. Qual seria sua resposta? 3. Os dados do arquivo WAGE2.RAW, sobre os homens que trabalham, foram utilizados para estimar a seguinte equação:
n=722, R²=0, em que educ é anos de escolaridade formal , irms é o número de irmãos , educm é anos de escolaridade formal da mãe e educp é anos de escolaridade formal do pai. a) irms tem o efeito esperado? Explique. Mantendo o educm e educp fixos, em quanto deveria irms aumentar para reduzir os anos previstos da educação formal em um ano? (Uma resposta incompleta é aceitável aqui.) b) Discuta a interpretação do coeficiente de educm. c) Suponha que o Homem A não tenha irmãos e que sua mãe e seu pai tenham, cada um, 12 anos de educação formal. Suponha também que o Homem B não tenha irmãos, e sua mãe e seu pai tenham, cada um, 16 anos de educação formal. Qual é a diferença prevista em anos de educação formal entre B e A?
4. Usando os dados do arquivo GPA2.RAW sobre 4.137 estudantes de curso superior dos Estados Unidos, estimou-se a seguinte equação por MQO:
n=4.137, R²=0,273, Em que supGPA é mensurada em uma escala de 4 pontos, emperc é o percentual da turma de formados do ensino médio (definido de modo que, por exemplo, emperc =5 significa que os 5% melhores da sala) e SAT é uma nota média ponderada de matemática e habilidade verbal do estudante para ingresso em curso superior. a) Por que faz sentido que o coeficiente de emperc seja negativo? b) Qual é o valor previsto de supGPA quando emperc =0 e SAT=1.050? c) Suponha que dois alunos do ensino médio, A e B, estejam no mesmo percentual no ensino médio, mas a nota SAT do estudante A foi 140 pontos maior (cerca de um desvio padrão da amostra). Qual é a diferença prevista em supGPA para esses dois estudantes? A diferença é grande? d) Mantendo emperc fixo, que diferença na nota SAT levaria a uma diferença prevista de supGPA de 0,5? Comente sua resposta.
5. O modelo seguinte é uma versão simplificada do modelo de regressão múltipla usado por Biddle e Hamermesh (1990) para estudar a escolha entre o tempo gasto dormindo e trabalhando e para observar outros fatores que afetam o sono: dormir = β 0 + β 1 trabtot + β 2 educ + β 3 idade + u; em que dormir e trabtot (trabalho total) são mensurados em minutos por semana e educ e idade são mensurados em anos. a) Se os adultos escolhem entre dormir e trabalhar, qual é o sinal de β 1? b) Que sinais você espera que β 2 e β 3 terão? c) Usando os dados do arquivo SLEEP75.RAW, a equação estimada é
n=706, R²=0,113. Se alguém trabalha cinco horas a mais por semana, qual é queda, em minutos, no valor esperado de dormir? Esse valor representa uma escolha grande? d) Discuta o sinal e a magnitude do coeficiente de educ. e) Você diria que trabtot, educ e idade explicam muito da variação de dormir? Quais outros fatores poderiam afetar o tempo gasto dormindo? É provável que eles sejam correlacionados com trabtot?
parciais na y, você antecipa que
b) Se x 1 for quase não correlacionado com x 2 e x 3 , mas e x 2 e x 3 forem altamente correlacionados, as
c) Se x 1 for altamente correlacionada com x 2 e x 3 na amostra e x 2 e x 3 tiverem pequenos efeitos parciais na y, você anteciparia que ep(
d) Se x 1 for quase não correlacionado com x 2 e x 3 , x 2 e x 3 tiver grandes efeitos parciais em y, e x 2 e x 3 forem altamente correlacionados, você anteciparia que ep(
Explique. 11. A equação seguinte descreve o preço mediano das residências de uma comunidade em termos de quantidade de poluição ( oxn , de óxido nitroso) e do número médio de cômodos nas residências da comunidade ( comods ): log(preço)= β 0 + β 1 log(oxn) + β 2 comods + u. a) Quais são os prováveis sinais de β 1 e β 2? Qual é a interpretação de β 1? Explique. b) Por que oxn [ou, mais precisamente, log(oxn) ] e comods deveriam ser negativamente correlacionados? Se esse é o caso, a regressão simples de log(preço) sobre log(oxn) produz um estimador viesado para cima ou para baixo de β 1? 12. A seguinte equação representa os efeitos das receitas totais de impostos sobre o crescimento subsequente do emprego para a população de municípios dos EUA. cresc= β 0 + β 1 parcp + β 2 parcr + β 3 rparcv + outros fatores ; em que cresc é a variação percentual do emprego de 1980 a 1990, enquanto o total das receitas de impostos tem a seguinte distribuição: i) parcp é a parcela dos impostos sobre a propriedade, ii) parcr é a parcela sobre renda, iii) parcv é a parcela sobre verndas. Todas essas variáveis estão mensuradas em 1980. A parcela omitida, parct inclui taxas e impostos variados. Por definição, as quatro parcelas somam um. Outros fatores incluiriam despesas com educação, infraestrutura, e assim por diante (todos mensurados em 1980). a) Por que devemos omitir uma das variáveis de parcela de impostos da equação? b) Dê uma interpretação cuidadosa de β 1.
13. Sejam as taxas de aprovação de empréstimos de uma comunidade determinadas por taxaprov= β 0 + β 1 porcmin + β 2 rendmed + β 3 riquemed + β 4 dividamed + u ; em que porcmin é a porcentagem de menoridade na comunidade, rendmed é a renda média, riquemed é a riqueza média, dividamed é alguma medida de dividas médias. Como você formularia a hipótese nula de que não há diferença nas taxas de empréstimos entre os bairros em razão da composição racial e étnica quando a renda média, a riqueza média e a dívida média foram controladas? Como você formularia a hipótese alternativa de que há discriminação contra as minorias nas taxas de aprovação de empréstimos?
valor=0,086 para testar H 0 : β 1 =0 contra H 1 : β 1 ≠ 0. Qual é o p-valor para testar H 0 : β 1 =0 contra H 1 : β 1 > 0?
15. Considere a possibilidade de relacionar o desempenho individual em um teste padronizado, pontuação , a uma variedade de outras variáveis. Fatores relativos à escola incluem o tamanho médio da classe, os gastos por estudante, o salário médio dos professores e o total de matriculas escolares. Outras variáveis especificas em relação aos estudantes são a renda familiar, a educação da mãe, a educação do pai e o número de irmãos. O modelo é : pontuação = β 0 + β 1 tclasse + β 2 gasto + β 3 totalsalp + β 4 matricl + β 5 rendfam + β 6 educm + β 7 educp + β 8 irmaos + u. Formule a hipótese nula que as variáveis especificas aos estudantes não tem efeito sobre o desempenho no teste padronizado, uma vez que os fatores relativos à escola sejam controlados. Quais os valores de k e q nesse exemplo? Escreva a versão restrita do modelo. 16. Os dados do arquivo ATTEND.RAW foram usados para estimar as duas equações
n=680, R²=0,183, e
n=680, R²=0,291, em que, como sempre, os erros-padrão estão entre parênteses; o erro-padrão de ACT está faltando na segunda equação. Qual é a estatística t do coeficiente de ACT?
17. Quais os seguintes itens podem fazer com que as estatísticas t de MQO não sejam válidas (isto é, que elas não tenham distribuição t sob H 0 )? a) Heteroscedasticidade. b) Um coeficiente de correlação de 0,95 entre duas variáveis independentes que estão no modelo. c) Omitir uma variável explicativa importante. 18. Suponha que o modelo nota = β 0 + β 1 faltas + β 2 psGPA + u satisfaça as quatro primeiras hipóteses de Gauss-Markov, em que nota é a nota de um exame final, faltas é o número de faltas e psGPA é uma nota média acumulada até o penúltimo
correlacionadas com a frequência, mas isso é necessário para que possamos fazer uma análise ceteris paribus.
do p-valor bilateral, ou 0,043.
Portanto, o valor absoluto da estatística t estará em torno de 10,16. A estatística t de tac será
entendido como negativo (ou pelo menos não-positivo), uma regressão simples provavelmente superestimará a importância de faltar às aulas.
por 2.
Agora, como Δx 2 é a alteração na proporção, 100.Δx 2 é a alteração em pontos percentuais. Em particular, se Δx 2 =0,001, então 100.Δx 2 =1, que corresponde a uma alteração de um ponto percentual. Mas, então, β 2 será a alteração porcentual em y quando 100. Δx 2 =1.
variável dependente, [SQT/(n-1)] é fixo. Quando usamos conjuntos diferentes de variáveis
quanto possível.