Questões de Concurso para Ciência de Dados

Limpar pesquisa

Configurar questões
Tamanho do Texto
Modo escuro

Questão: 181 de 240

461576

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Distribuições de probabilidade: Normal e Binomial

A figura seguinte mostra o histograma como uma estimativa da função de densidade de uma distribuição X, juntamente com o diagrama boxplot correspondente a esse conjunto de dados.





Considerando a figura e as informações apresentadas no quadro, julgue o item que se segue.
O percentual das observações tais que [0,6 ≤ x ≤ 19,4] é igual ou inferior a 70%.

Questão: 182 de 240

461513

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Análise da variância

Em um processo em que se utiliza a ciência de dados, o número de variáveis necessárias para a realização da investigação de um fenômeno é direta e simplesmente igual ao número de variáveis utilizadas para mensurar as respectivas características desejadas; entretanto, é diferente o procedimento para determinar o número de variáveis explicativas, cujos dados estejam em escalas qualitativas.


Considerando esse aspecto dos modelos de regressão, julgue o item a seguir.
Para evitar um erro de ponderação arbitrária, deve-se recorrer ao artifício de uso de variáveis dummy, o que permitirá a estratificação da amostra da maneira que for definido um determinado critério, evento ou atributo, para então serem inseridas no modelo em análise; isso permitirá o estudo da relação entre o comportamento de determinada variável explicativa qualitativa e o fenômeno em questão, representado pela variável dependente.

Questão: 183 de 240

461514

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Inteligência Artificial / Aprendizado de Máquina

As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de características operacionais do receptor (ROC).


Acerca das características específicas dessas métricas, julgue o próximo item.
A matriz de confusão a seguir apresenta três rótulos de classe; os elementos diagonais representam o número de pontos para os quais o rótulo previsto é igual ao rotulo verdadeiro, enquanto qualquer coisa fora da diagonal teve um rótulo atribuído erroneamente pelo classificador. Quanto menores forem os valores diagonais da matriz de confusão, melhor o modelo adotado.

Questão: 184 de 240

461515

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Inteligência Artificial / Aprendizado de Máquina

As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de características operacionais do receptor (ROC).


Acerca das características específicas dessas métricas, julgue o próximo item.
As curvas ROC a seguir mostram a taxa de especificidade (verdadeiros positivos) versus a taxa de sensibilidade (falsos positivos) do modelo adotado; a linha tracejada é a linha de base da métrica de avaliação e define uma adivinhação aleatória.

Questão: 185 de 240

461516

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Inteligência Artificial / Aprendizado de Máquina




Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem de máquina adotado, com o erro de predição.
A região do gráfico entre as duas curvas, indicada pela letra B, mostra a região de erro de generalização para o modelo de aprendizado de máquina.