Filtrar


Questões por página:
Com relação às técnicas de redução de dimensionalidade, no contexto de aprendizado de máquina, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) As técnicas de agregação formam novos atributos, por meio da combinação de grupos dos atributos originais.
( ) As técnicas de seleção de atributos descartam parte dos atributos originais.
( ) Técnicas de seleção de atributos embutidas são aplicadas na etapa de pré-processamento.

As afirmativas são, respectivamente,
Considere a matriz de confusão M dada abaixo, obtida depois da aplicação de um método de classificação em um certo conjunto de dados, para um problema com três classes.
Imagem associada para resolução da questão

Seja a acurácia do classificador definida como a proporção de previsões corretas, em relação ao total de previsões do modelo. Logo, a acurácia do classificador, com base na matriz M, é dada por
Com relação ao ajuste de dados e a aplicação de modelos preditivos de aprendizado de máquina, analise os itens a seguir.

I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.

Está correto o que se afirma em
A popularização da Internet permitiu que grande parcela da população pudesse expressar suas opiniões na forma de fóruns, blogs, avaliações de produtos, entre outros. Assim, deixou de ser necessário que empresas conduzam enquetes ou pesquisas para que possam saber a opinião dos consumidores sobre seus produtos ou de concorrentes. O volume de textos opinativos disponíveis é tal, que a tarefa de ler, sumarizar e organizar de forma útil essas informações é desafiadora. O campo da análise de sentimento, no processamento de linguagem natural, trata justamente dessa necessidade, da automatização da descoberta e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.

I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.

II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.

III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.

Está correto o que se afirma em
Um conceito fundamental na modelagem probabilística de sequências de palavras é o de n-grama. Com relação a esse conceito, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.

( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.

( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.


As afirmativas são, respectivamente,