




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Um script r que realiza análises estatísticas de elasmoscopia, incluindo a cálculo de bandas de confiança para a sensibilidade e especificidade usando métodos wald, score e bootstrap. O script também inclui gráficos para visualização dos resultados.
Tipologia: Exercícios
1 / 140
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Miguel Basto Pereira
UMinho | 2013 Outubro de 2013
Estimação da Sensibilidade,da Especificidade e da curva ROC
iii
Ao meu orientador, Professor Doutor Luís Filipe Meira Machado, pelo conhecimento partilhado, pela aprendizagem e sobretudo pela inteira disponibilidade demonstrada ao longo de todo o processo de planeamento e desenvolvimento da dissertação. Ao Professor Doutor Jaime Correia de Sousa, por ter possibilitado a conciliação do meu trabalho de investigação na Escola de Medicina da Universidade do Minho com o Mestrado em Estatística. Agradeço igualmente à minha atual casa profissional, a Faculdade de Psicologia e de Ciências da Educação da Universidade do Porto e à Doutora Mariana Martins, por terem também possibilitado a conciliação entre as minhas tarefas laborais e as minhas tarefas académicas. O mais especial agradecimento aos meus pais e também à minha irmã, por todo o apoio prestado aos mais diversos níveis e sem os quais esta experiência enriquecedora nunca teria sido possível. Aos colegas de Mestrado em Estatística, pelo companheirismo e pela ajuda prestada ao longo de dois anos de percurso. Em especial, um agradecimento aos colegas: Fernando Gomes, Cristiana Vieira, Celine Queirós, Daniela Catalão, Helena Piairo e Cristina Campelos. A quem me incentivou a entrar nesta aventura, tão diferente mas ao mesmo tempo tão complementar da minha profissão e da minha formação de base.
Obrigado a todos.
v
Resumo:Resumo:Resumo:Resumo: A tomada de decisões é um processo complexo que surge frequentemente ligado ao problema da classificação de indivíduos em grupos a partir de um marcador ordinal ou contínuo associado. Neste contexto os testes diagnósticos assumem especial relevância. A escolha das provas de diagnóstico e do ponto de corte é geralmente realizada através da
Na Medicina estas ferramentas assumem um papel central, ao estimar, comparar e calibrar o impacto de diferentes soluções, permitindo que a solução mais eficaz seja disponibilizada. Este trabalho pretendeu estudar e desenvolver estas ferramentas estatísticas e está estruturado, além da Introdução e Conclusão, em 5 secções que visam responder aos objetivos propostos. O segundo Capítulo é composto pela revisão bibliográfica e histórica sobre o tema, à medida que são apresentados os conceitos e fórmulas base sobre as curvas ROC. No Capítulo 3 é efetuada a caracterização e a análise descritiva de uma base de dados de cardiologia que será posteriormente utilizada para testar exemplificar as funções desenvolvidas. No Capítulo 4 programamos e aplicamos um conjunto de funções que têm por objetivo estimar e representar a sensibilidade, especificidade e a curva ROC, bem como as respetivas bandas de
O desempenho destes métodos é avaliado por meio de estudos de simulação. Realizou-se um estudo de simulação que será descrito no Capítulo 5. Pretendeu-se avaliar o nível de cobertura dos diferentes métodos e estudar qual é o melhor método sob diferentes condições.
avaliar o custo/retorno unitário esperado num rastreio populacional, a função foi exemplificada recorrendo à base de dados de cardiologia, de modo a aprofundar as suas funcionalidades. Nesta dissertação foram revistos e programados métodos de estimação da sensibilidade, especificidade e curvas ROC, e a relação destas com o custo e com o retorno esperado. Pretendeu-se disponibilizar informação e ferramentas estatísticas de apoio ao diagnóstico.
PalavrasPalavrasPalavrasPalavras----Chave:Chave:Chave: Curvas ROC; Sensibilidade; Especificidade; Custo e Retorno EsperadoChave:
vi
viii
xi
xii
xiv
xv
Figura 1. Árvore de decisão com o universo de eventos possíveis na análise ROC. ..................... 4 Figura 2. Distribuição estatística da variável contínua para cada um dos níveis da variável categórica (Grupo Doentes versus Grupo se a Doença). ............................................................. 7 Figura 3. Variação da sensibilidade e especificidade em função dos pontos de corte. ............... 10 Figura 4. Duas Curvas ROC, calculadas em R, cada uma associada a um teste de avaliação diferente. ................................................................................................................................ 11 Figura 5. Curva ROC, calculada com recurso ao R. No eixo dos “XX” encontra-se a taxa dos falsos positivos e no eixo dos “YY” o nível de especificidade. ................................................... 12 Figura 6. Representação gráfica da caixa de bigodes entre a variável Status e a variável Leukocyte Elastase Data para o sexo masculino e feminino. .................................................... 17 Figura 7. Curva ROC, no eixo dos “XX” os falsos positivos (1-Especificidade) e no eixo dos “YY” o valor da sensibilidade. ............................................................................................................ 22 Figura 8. Os gráficos 3D apresentam a relação entre 1-Especificidade, a Sensibilidade e a Precisão (Azul) / Índice de Youden (Amarelo). ......................................................................... 25 Figura 9. Curva ROC e bandas de confiança para a sensibilidade e especificidade/falsos positivos a 95%. ...................................................................................................................... 32 Figura 10. Representação gráfica das bandas de confiança para a sensibilidade através dos 3 métodos (score, bootstrap (nboot=500) e Wald). ..................................................................... 35 Figura 11. Representação gráfica das bandas de confiança para a especificidade através dos 3 métodos (Score, Bootstrap (nboot=500) e Wald). .................................................................... 38 Figura 12. Representação gráfica da curva ROC e das bandas de confiança ROC para o método
Figura 13. Níveis médios de cobertura por método e tamanho de amostra. ............................. 50 Figura 14. Níveis médios de cobertura por método e ponto de corte. ....................................... 51 Figura 15. Níveis médios de cobertura por tamanho de amostra e ponto de corte.................... 52 Figura 16. Níveis médios de cobertura por método e proporção. ............................................. 53
xvii
Tabela 1. Tabela de Contingência 2x2. ...................................................................................... 6 Tabela 2. Análise descritiva da base de dados Leukocyte Elastase Data ................................... 16 Tabela 3. Lista reduzida dos pares sensibilidade/especificidade da curva ROC. ....................... 21
Tabela 5. Ponto de corte selecionado, respetiva Especificidade, Sensibilidade e limites de confiança (superior e inferior) para cada um dos métodos. ...................................................... 31 Tabela 6. Sensibilidade, limites de confiança para a sensibilidade em cada ponto de corte ...... 34 Tabela 7. Lista reduzida com valores da especificidade e limites de confiança, superior e inferior para a especificidade nos três métodos e pontos de corte associados. Calculou-se a amplitude. .............................................................................................................................................. 37 Tabela 8. Lista reduzida com valores da sensibilidade e especificidade e respetivos limites de confiança para os 3 métodos. ................................................................................................. 40 Tabela 9. Resultado do estudo de simulação para uma proporção de 0,2 e um nível de confiança de 0.95. ................................................................................................................................. 45 Tabela 10. Resultado do estudo de simulação para uma proporção de 0,4 e um nível de confiança de 0.95. ................................................................................................................. 46 Tabela 11. Resultado do estudo de simulação para uma proporção de 0,6 e um nível de confiança de 0.95. ................................................................................................................. 47 Tabela 12. Resultado do estudo de simulação para uma proporção de 0,8 e um nível de confiança de 0.95. ................................................................................................................. 48 Tabela 13. Tabela reduzida com o custo e retorno unitário esperado para cada ponto de corte.
xviii