Questões da prova:
FGV - 2025 - TCE-PI - Auditor de Controle Externo
limpar filtros
100 Questões de concurso encontradas
Página 7 de 20
Questões por página:
Questões por página:
Concurso:
TCE-PI
Disciplina:
Engenharia de Software
Com relação ao ajuste de dados e a aplicação de modelos preditivos de aprendizado de máquina, analise os itens a seguir.
I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.
Está correto o que se afirma em
I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.
Está correto o que se afirma em
Concurso:
TCE-PI
Disciplina:
Engenharia de Software
A popularização da Internet permitiu que grande parcela da população pudesse expressar suas opiniões na forma de fóruns, blogs, avaliações de produtos, entre outros. Assim, deixou de ser necessário que empresas conduzam enquetes ou pesquisas para que possam saber a opinião dos consumidores sobre seus produtos ou de concorrentes. O volume de textos opinativos disponíveis é tal, que a tarefa de ler, sumarizar e organizar de forma útil essas informações é desafiadora. O campo da análise de sentimento, no processamento de linguagem natural, trata justamente dessa necessidade, da automatização da descoberta e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.
I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.
II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.
III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.
Está correto o que se afirma em
Considerando este tema, avalie as afirmativas a seguir.
I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.
II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.
III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.
Está correto o que se afirma em
Um conceito fundamental na modelagem probabilística de sequências de palavras é o de n-grama. Com relação a esse conceito, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.
( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.
( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.
As afirmativas são, respectivamente,
( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.
( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.
( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.
As afirmativas são, respectivamente,
No campo da mineração de dados existem alguns problemas fundamentais que costumam aparecer com frequência em variados cenários de aplicação. O estudo desses problemas fornece ferramentas ao analista de dados que são aplicáveis em diferentes projetos de mineração de dados. Nesse conjunto se encontram os problemas de determinação de padrões, classificação de dados, segmentação de dados (clustering) e detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.
I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.
II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.
III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.
Está correto o que se afirma em
Considerando os problemas citados, analise as afirmativas a seguir.
I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.
II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.
III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.
Está correto o que se afirma em
Um analista de dados recebeu a tarefa de estimar os consumidores de uma rede de lojas de varejo digital que têm maior probabilidade de voltar a adquirir determinado produto. A empresa disponibilizou tabelas contendo, respectivamente, a lista de consumidores com seus dados demográficos, os resultados de vendas de cada loja e os dados básicos como endereço e área ocupada por cada loja. Para alimentar sua ferramenta de mineração de dados é necessário agregar as tabelas repassadas em um único banco de dados.
Considerando o modelo de referência CRISP-DM, esse analista encontra-se na etapa de
Considerando o modelo de referência CRISP-DM, esse analista encontra-se na etapa de