Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Aplicação de Modelos de Regressão Logística na Aprovação de Cartões de Crédito, Provas de Eletricidade Básica

Este documento aborda a aplicação de modelos de regressão logística na aprovação de cartões de crédito por bancos. Ele discute como os bancos podem utilizar algoritmos de classificação para prever a inadimplência do cliente e aprovar ou não a concessão do cartão. O documento detalha a análise descritiva dos dados e o treinamento de um modelo de regressão logística múltipla, que revelou insights sobre a relação entre a probabilidade de inadimplência, os gastos com o cartão e a estabilidade de emprego.

Tipologia: Provas

2020

Compartilhado em 08/08/2024

clos3-1
clos3-1 🇧🇷

3 documentos

1 / 9

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
PERGUNTA 1
1. O ser humano tem enorme facilidade em agrupar, por similaridade, e
classificar coisas, todos os tipos de coisas. Por conta disso, problemas
de classificação são muito frequentes no mundo, mais frequentes que
problemas de regressão. Fornecemos alguns exemplos de aplicação de
métodos de classificação no mundo dos negócios. Dentre esses
exemplos, encontramos:
1. a Netflix usa classificadores para recomendar filmes. Para a
Netflix, o valor desse tipo de aplicação é que, quanto mais filmes
assistirmos, maior será a sua receita;
2. o Facebook usa classificadores para recomendar novas amizades
para a nossa rede de relacionamento. Para o Facebook, o valor
desse tipo de aplicação é que, quanto maior nossa rede de
relacionamento, maior será a sua receita;
3. um banco de varejo usa classificadores para detectar se uma
operação com cartão de débito ou crédito é ou não uma operação
fraudulenta. Para o banco, o valor dessa aplicação é que, quanto
antes operações fraudulentas forem detectadas, mais
rapidamente o banco pode agir para impedir perdas para seus
clientes e para ele próprio;
4. uma concessionária de distribuição de energia elétrica usa
classificadores para identificar casos potenciais de roubo de
energia da rede, os famosos “gatos”. Para as concessionárias de
distribuição de energia elétrica, o valor dessa aplicação é evitar
prejuízo com o furto de energia da rede, além do relevante
aspecto de prevenção de acidentes decorrentes de instalações
clandestinas.
Está correto o que se afirma em:
I, II, III e IV.
I e III, apenas.
III e IV, apenas.
I e II, apenas.
II e IV, apenas.
1 pontos
PERGUNTA 2
1. Entre as técnicas das quais lançou mão para a visualização dos dados
da amostra, uma jovem cientista de dados usou gráficos de dispersão.
pf3
pf4
pf5
pf8
pf9

Pré-visualização parcial do texto

Baixe Aplicação de Modelos de Regressão Logística na Aprovação de Cartões de Crédito e outras Provas em PDF para Eletricidade Básica, somente na Docsity!

PERGUNTA 1

  1. O ser humano tem enorme facilidade em agrupar, por similaridade, e classificar coisas, todos os tipos de coisas. Por conta disso, problemas de classificação são muito frequentes no mundo, mais frequentes que problemas de regressão. Fornecemos alguns exemplos de aplicação de métodos de classificação no mundo dos negócios. Dentre esses exemplos, encontramos: 1. a Netflix usa classificadores para recomendar filmes. Para a Netflix, o valor desse tipo de aplicação é que, quanto mais filmes assistirmos, maior será a sua receita; 2. o Facebook usa classificadores para recomendar novas amizades para a nossa rede de relacionamento. Para o Facebook, o valor desse tipo de aplicação é que, quanto maior nossa rede de relacionamento, maior será a sua receita; 3. um banco de varejo usa classificadores para detectar se uma operação com cartão de débito ou crédito é ou não uma operação fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes operações fraudulentas forem detectadas, mais rapidamente o banco pode agir para impedir perdas para seus clientes e para ele próprio; 4. uma concessionária de distribuição de energia elétrica usa classificadores para identificar casos potenciais de roubo de energia da rede, os famosos “gatos”. Para as concessionárias de distribuição de energia elétrica, o valor dessa aplicação é evitar prejuízo com o furto de energia da rede, além do relevante aspecto de prevenção de acidentes decorrentes de instalações clandestinas. Está correto o que se afirma em: I, II, III e IV. I e III, apenas. III e IV, apenas. I e II, apenas. II e IV, apenas. 1 pontos

PERGUNTA 2

  1. Entre as técnicas das quais lançou mão para a visualização dos dados da amostra, uma jovem cientista de dados usou gráficos de dispersão.

Como cientista de dados, ela sabia exatamente em que situações empregar gráficos de dispersão. E você, será que você também já sabe? Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).

  1. ( ) Gráficos de dispersão, em inglês chamados de scatter plots, só podem ser usados para a visualização de uma única variável, a qual deve ser obrigatoriamente uma variável qualitativa.
  2. ( ) Gráficos de dispersão são usados para a visualização da relação entre duas variáveis quantitativas, em que os dados das duas variáveis são plotados aos pares. Permite, dessa forma, a verificação visual, pelo estatístico ou pelo cientista de dados, se há uma tendência de uma variável aumentar quando a outra aumenta, diminuir quando a outra diminui, ou se não há uma relação aparente entre as duas.
  3. ( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o valor do imóvel e a sua área. Esse tipo de gráfico é chamado, em inglês, de scatter plot.
  4. ( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o valor do imóvel e o seu andar. Esse tipo de gráfico é chamado, em inglês, de scatter plot. Assinale a alternativa que apresenta a sequência correta. V, V, F, F. F, F, V, V. F, V, V, V. F, V, F, V. V, V, F, V. 1 pontos

PERGUNTA 3

  1. Vimos que há dois principais tipos de aprendizagem supervisionada: problema de regressão e problema de classificação. São os tipos de variáveis resposta dos dados em análise que distinguem esses dois tipos entre si. Relativamente a esses dois tipos, analise as afirmativas a seguir.

V, V, F, F.

F, F, F, F.

V, V, V, V.

F, V, F, V.

F, F, V, V.

1 pontos

PERGUNTA 5

  1. O modelo de regressão logística simples desenvolvido por uma jovem cientista de dados para a predição da probabilidade de inadimplência com o cartão de crédito foi: Tomando como base esse modelo, que foi ajustado aos dados da amostra cedida pelo gerente, podemos estimar o valor esperado para a probabilidade de inadimplência com cartão de crédito das pessoas. Por exemplo, vamos considerar duas pessoas, uma com um gasto de médio mensal com o cartão de R$ 500,00, e a outra com um gasto médio mensal de R$ 1.000,00. Usando o modelo ajustado anterior, obtemos, respectivamente (assinale a alternativa correta): 7% e 37%. 17% e 27%. 7% e 27%. 27% e 7%. 37% e 17%. 1 pontos

PERGUNTA 6

  1. A amostra relativa aos dados de inadimplência com cartões tinha 200 observações de 4 variáveis: a renda mensal da pessoa (R$), seu gasto médio com cartão de crédito (R$), se a pessoa tinha um emprego estável (Sim ou Não) e se a pessoa havia, ao longo do período pesquisado, ficado inadimplente com o pagamento de faturas do cartão ao menos uma vez (Sim ou Não). Reflita sobre esse caso, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
  1. ( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis quantitativas.
  2. ( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis qualitativas.
  3. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, dois são relativos a uma variável quantitativa e dois são relativos a variáveis qualitativas.
  4. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, um é relativo a uma variável quantitativa e os outros são relativos a variáveis qualitativas. Assinale a alternativa que apresenta a sequência correta. F, V, V, V. V, V, F, F. V, V, F, V. F, V, F, V. F, F, V, F. 1 pontos

PERGUNTA 7

  1. Continuando com o mesmo caso da questão anterior, relativa à aprovação, pelos bancos, de crédito na forma de cartão de crédito, como se fazia, no passado, a aprovação da concessão de cartões de crédito pelos bancos? E, hoje em dia, como os bancos fazem essa aprovação? Reflita sobre essas perguntas e suas respostas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 1. ( ) No passado, os bancos faziam, e ainda fazem, ao menos em parte, a aprovação da concessão de cartões de crédito através da definição de regras que devem ser atendidas por cada cliente, tais como idade, emprego estável, renda fixa, dívidas pequenas, nome limpo e casa própria. 2. ( ) Hoje em dia, dentre outras alternativas, uma que é frequentemente usada pelos bancos são algoritmos de aprendizagem supervisionada que classificam se o cliente é um potencial bom ou mau pagador.
  1. ( ) Para criar sumários estatísticos das variáveis quantitativas, a renda mensal da pessoa e seus gastos com o cartão, a cientista de dados usou as funções min(), mean() e max() do software estatístico R para calcular os valores mínimo, médio e máximo dos dados observados para essas variáveis.
  2. ( ) Para criar sumários estatísticos das variáveis qualitativas, se a pessoa tinha ou não um emprego estável e se tinha ou não ficado inadimplente com o pagamento das faturas do cartão ao longo do período amostrado, a cientista de dados usou a função table() do software estatístico R para calcular a frequência com que os níveis de cada uma dessas variáveis se manifestaram na amostra estudada. Assinale a alternativa que apresenta a sequência correta. V, F, F, V. F, F, V, V. F, V, V, F. V, V, V, V. V, V, F, F. 1 pontos

PERGUNTA 9

  1. Vimos que uma jovem cientista de dados realizou o treino (ajuste) de um modelo de regressão logística múltipla aos dados da amostra. Os resultados que encontrou foram muito ricos, sugerindo uma série de explicações, aprendidas pelo algoritmo com base nos dados fornecidos. Veja que dizemos “explicações sugeridas”, pois qualquer resultado de um algoritmo deve ser confrontado com especialistas da área em estudo. Contudo, vamos rever o que o modelo de regressão múltipla treinado pela jovem cientista de dados sugere. Para isso, analise as afirmativas a seguir. 1. A probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito. Isto, que nos parece óbvio, foi o que os dados “contaram” para o algoritmo de regressão logística múltipla. 2. A probabilidade da inadimplência cresce com o aumento da renda média mensal das pessoas. Isto não é tão óbvio e provavelmente não teríamos coragem de generalizar para outras situações, mas foi o que os dados da amostra do gerente do banco “contaram” para o algoritmo de regressão logística múltipla.
  1. Para duas pessoas com a mesma renda mensal e o mesmo gasto mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável. Novamente, isto foi o que os dados amostrados “contaram” para o algoritmo de regressão logística múltipla.
  2. O modelo de regressão logística múltipla, ajustado aos dados da amostra, consegue predizer os efeitos da renda mensal da pessoa, do seu gasto médio mensal com cartão de crédito e se ela tem ou não um emprego estável, na probabilidade de a pessoa ficar inadimplente com o cartão de crédito. Um algoritmo desse tipo pode ajudar no processo decisório de um banco quanto à aprovação de cartão de crédito, ao lado de outros critérios e ferramentas analíticas disponíveis para o banco. Está correto o que se afirma em: III e IV, apenas. I e II, apenas. II e III, apenas. I, II, III e IV. II, III e IV, apenas. 1 pontos

PERGUNTA 10

  1. A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou outras de lado. Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados. 1. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito. 2. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.