Questões de Concurso para Ciência de Dados

Limpar pesquisa

Configurar questões
Tamanho do Texto
Modo escuro

Questão: 121 de 240

461522

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Banco de Dados / Estrutura de Dados

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.


De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.
Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample (inputs).

Questão: 122 de 240

461523

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Banco de Dados / Estrutura de Dados

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.


De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.
A entropia de uma árvore de decisão aborda o aspecto da quantidade de informações que está associada às respostas que podem ser obtidas às perguntas formuladas, representando o grau de incerteza associado aos dados.

Questão: 123 de 240

461524

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Inteligência Artificial / Aprendizado de Máquina

As máquinas de vetores de suporte (SVMs) são originalmente utilizadas para a classificação de dados em duas classes, ou seja, na geração de dicotomias. Nas SVMs com margens rígidas, conjuntos de treinamento linearmente separáveis podem ser classificados. Acerca das características das SVMs com margens rígidas, julgue o item a seguir.
Um conjunto linearmente separável é composto por exemplos que podem ser separados por pelo menos um hiperplano. As SVMs lineares buscam o hiperplano ótimo segundo a teoria do aprendizado estatístico, definido como aquele em que a margem de separação entre as classes presentes nos dados é minimizada.

Questão: 124 de 240

461525

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Banco de Dados / Estrutura de Dados

Os modelos ditos fracos, também chamados modelos de base, muitas vezes são combinados com o objetivo de se construir um modelo mais forte, no qual a variância e o viés atinjam equilíbrio satisfatório. Esse procedimento, denominado ensembles, é muito utilizado em ciência de dados e aprendizado de máquinas.
Quanto às formas de ensembles, julgue o próximo item.
O ensemble denominado bagging tem como foco principal a redução do viés e não da variância, treinando-se os modelos em sequência, tal que os erros dos primeiros modelos treinados são utilizados para o ajuste nos pesos matemáticos dos próximos modelos.

Questão: 125 de 240

461526

copy

Banca: CESPE / Cebraspe

Órgão: Petrobras

Cargo(s): Ciência de Dados

Ano: 2022

Matéria/Assunto: Tecnologia da Informação > Desenvolvimento de Sistemas / Linguagens de programação / Linguagens Interpretadas / Python

Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma série de ferramentas utilizadas no ajuste de modelos e no préprocessamento de dados, para a seleção e avaliação de modelos.


Tendo como referência essas informações, julgue o item a seguir.
No código a seguir, DecisionTreeClassifier é um classificador que recebe como entrada dois arrays: um array X, de valores inteiros, contendo os rótulos de classe para as amostras de treinamento; e um array Y, esparso ou denso, contendo as amostras de treinamento.