Questões de Concurso para Ciência de Dados

Limpar pesquisa

Configurar questões
Tamanho do Texto
Modo escuro

Questão: 126 de 240

Anulada

461527

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação

Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma série de ferramentas utilizadas no ajuste de modelos e no préprocessamento de dados, para a seleção e avaliação de modelos.


Tendo como referência essas informações, julgue o item a seguir.
SVC, NuSCV e LinearSVC são classes do scikit-learn capazes de realizar classificação binária e multiclasse em um conjunto de dados.

Questão Anulada

Questão: 127 de 240

461528

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Banco de Dados / Sistemas de suporte à decisão / Business Intelligence

Os hiperparâmetros de um modelo são todos os parâmetros que podem ser definidos antes do inicio do treinamento, diferentemente dos parâmetros do modelo, que são aprendidos durante o treino do modelo. A busca por hiperparâmetros de determinado algoritmo de aprendizado de máquina que retorne o melhor desempenho medido em um conjunto de validação deu origem ao conceito de otimização de hiperparâmetros.


Acerca dos conceitos de otimização de hiperparâmetros de modelos de aprendizado de máquinas, julgue o item que se segue.
A otimização bayesiana se utiliza do conceito de probabilidade para encontrar o valor de entrada de uma função que possa retornar o menor valor de saída possível.
Nesse método, o número de iterações de pesquisa pode ser reduzido a partir da escolha dos valores de entrada, levando em consideração os resultados anteriores, o que caracteriza um processo iterativo.

Questão: 128 de 240

461529

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Análise da variância

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Se a matriz de variância-covariância referente a três variáveis for





e se o menor autovalor dessa matriz for igual a 1,84, então as duas primeiras componentes principais explicam 81,6% da variação total referente a essas variáveis.

Questão: 129 de 240

461530

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Inferência Estatística

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere que, em uma análise de agrupamentos por meio de mistura de gaussianas, três distribuições normais com médias μ1, μ2 e μ3 se referem, respectivamente, aos clusters 1, 2 e 3.
Nessa situação, pelo modelo de mistura de gaussianas, o cluster 1 é constituído pelas observações mais próximas da média μ1.

Questão: 130 de 240

461531

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Estatística > Estatística avançada / Inferência Estatística

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10.