Filtrar


Questões por página:
Com a diversificação das aplicações que empregam conjuntos de dados classificados como Big Data, foram desenvolvidos frameworks, heurísticas e metodologias para armazenar, acessar e processá-los sem comprometer o desempenho dos sistemas envolvidos. Duas soluções que se destacam nesse contexto são o Apache Hadoop e o Apache Spark.
A respeito dessas soluções, assinale a afirmativa correta.
Um profissional de TI está trabalhando com um grande banco de dados (Big Data), realizando uma análise prévia da base de dados, com o objetivo de identificar anomalias ou resultados raros, de forma a tratá-los ou descartá-los para utilização.
Esse profissional está realizando a seguinte tarefa:
Ao fazer a preparação para analisar dados em um banco de dados típico de Big Data, um profissional de TI percebeu que o número de atributos, ou colunas, era muito maior do que poderia processar com a ferramenta de análise disponível, sendo necessário, portanto, utilizar uma técnica de redução de dados para prepará-los para análise.
Uma técnica indicada, nesse caso, é a
Organizações modernas estão sujeitas a uma grande quantidade de dados, principalmente se tratam com grandes quantidades de clientes. Muitas das demandas de tecnologia de informação a que essas organizações estão submetidas passaram a ser organizadas e tratadas dentro do conceito de Big Data.
Além do grande volume de dados, o Big Data, em sua definição original, considera também a(s) seguinte(s) propriedade(s):
Assinale a opção que melhor descreve a diferença entre os frameworks Apache Spark e Apache Hadoop, no contexto do processamento de Big Data.