Questões de Concurso para Ciência de Dados

Limpar pesquisa

Configurar questões
Tamanho do Texto
Modo escuro

Questão: 21 de 240

6319ee7da62aba544c3aa137

copy

Banca: CESPE / Cebraspe

Órgão: Petróleo Brasileiro S.A

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Desenvolvimento de Sistemas > Linguagens de programação > Linguagens Interpretadas > Python

Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma série de ferramentas utilizadas no ajuste de modelos e no préprocessamento de dados, para a seleção e avaliação de modelos.


Tendo como referência essas informações, julgue o item a seguir.
No código a seguir, DecisionTreeClassifier é um classificador que recebe como entrada dois arrays: um array X, de valores inteiros, contendo os rótulos de classe para as amostras de treinamento; e um array Y, esparso ou denso, contendo as amostras de treinamento.

Imagem questão

Questão: 22 de 240

6319ee7da62aba544c3aa13d

copy

Banca: CESPE / Cebraspe

Órgão: Petróleo Brasileiro S.A

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada > Conhecimentos de Estatística Avançada

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere que, em uma análise de agrupamentos por meio de mistura de gaussianas, três distribuições normais com médias μ1, μ2 e μ3 se referem, respectivamente, aos clusters 1, 2 e 3. Nessa situação, pelo modelo de mistura de gaussianas, o cluster 1 é constituído pelas observações mais próximas da média μ1.

Questão: 23 de 240

6319ee7da62aba544c3aa13e

copy

Banca: CESPE / Cebraspe

Órgão: Petróleo Brasileiro S.A

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Matemática > Matemática básica > Análise de Tabelas e Gráficos

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10.

Imagem questão

Questão: 24 de 240

6319ee7da62aba544c3aa143

copy

Banca: CESPE / Cebraspe

Órgão: Petróleo Brasileiro S.A

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Aprendizado de máquina > Redes Neurais

Julgue o próximo item, relativo a redes neurais artificiais (RNA).
O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.

Questão: 25 de 240

6319ee7da62aba544c3aa154

copy

Banca: CESPE / Cebraspe

Órgão: Petróleo Brasileiro S.A

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada > Distribuição Qui-quadrado

Imagem questão


Considerando a figura precedente, que mostra desenhos esquemáticos das distribuições das quantidades de cargas perdidas nos anos de 2020 e 2021, segundo o tipo de carga transportada por uma mineradora, julgue o item que se segue.
Na distribuição da quantidade de carga do tipo A perdida em 2020, observa-se que o primeiro quartil foi superior a 100 kg, enquanto o terceiro quartil foi inferior a 50 kg.