Questões de Concurso para Ciência de Dados

Limpar pesquisa

Configurar questões
Tamanho do Texto
Modo escuro

Questão: 141 de 240

461550

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística



Considerando a figura precedente, que mostra desenhos esquemáticos das distribuições das quantidades de cargas perdidas nos anos de 2020 e 2021, segundo o tipo de carga transportada por uma mineradora, julgue o item que se segue.
No desenho esquemático referente à distribuição da quantidade de carga do tipo C perdida em 2020, os dois pontos exteriores representam as observações destoantes das demais, que podem ou não podem ser considerados outliers.

Questão Anulada

Questão: 142 de 240

461551

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Distribuição Qui-quadrado



Considerando a figura precedente, que mostra desenhos esquemáticos das distribuições das quantidades de cargas perdidas nos anos de 2020 e 2021, segundo o tipo de carga transportada por uma mineradora, julgue o item que se segue.
Suponha que os valores das quantidades de carga perdida sejam submetidos a uma normalização numérica com base no critério do Z-score da forma



em que Xa,t denota a quantidade de carga do tipo t perdida no ano a, μa,t, representa a quantidade média de carga do tipo t perdida no ano a, e σa,t, refere-se ao desvio padrão da distribuição da quantidade de carga do tipo t perdida no ano a. Como resultado dessa normalização, a média da soma



será igual à média da soma

Questão: 143 de 240

461552

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Banco de Dados / Conceitos básicos

Com respeito a métodos para imputação de dados, julgue o seguinte item.
O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos resultados da imputação.

Questão: 144 de 240

461553

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Banco de Dados / Conceitos básicos

Com respeito a métodos para imputação de dados, julgue o seguinte item.
Um dos passos para tratar com dados faltantes é avaliar o tipo de dado perdido; assim, por exemplo, o método MICE (multivariate imputation by chained equations) não seria aplicável para dados perdidos do tipo MAR (missing at random).

Questão: 145 de 240

461554

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Variáveis Aleatórias

A tabela abaixo apresenta parte de um conjunto de dados
referentes a uma variável categórica chamada opinião que
possui quatro categorias de resposta: muito satisfeito,
satisfeito, insatisfeito e muito insatisfeito.





Com base nessas informações, julgue o próximo item.
Para lidar numericamente com os dados categóricos, uma codificação binária proporciona uma conversão de cada categoria de resposta para uma sequência de dígitos binários, em que cada dígito binário representa uma variável numérica que assume valores 0 ou 1. Na situação em tela, uma possível codificação binária é exemplificada na tabela abaixo.