Big Data

Arqui e tecno

Medindo a performance do seu cluster Hadoop

O Hadoop não é uma aplicação web, um banco de dados e tampouco um webservice, você não conseguiria estressar um cluster Hadoop com teste de carga tradicional (afinal ele é feito pra suportar grandes volumes de dados). Realizar um teste de estresse no cluster é um passo geralmente esquecido, porém muito importante quando você monta o seu ambiente hadoop, afinal, é importante ter um benchmark do cluster, ou seja, avaliar seu desempenho, executando uma variedade de tipos de jobs cada uma focado em um campo específico…

Lire la suite
Arqui e tecno

Prevendo o futuro com filtros colaborativos

É possível prever o futuro? Muitos acreditam que um homem chamado Michel de Nostradamus foi capaz. Suas previsões têm intrigado estudiosos por mais de quatrocentos anos. Prever o futuro sempre foi um dos maiores desejos do ser humano, isso pode ser visto em quadrinhos, filmes de Hollywood, e até mesmo na cigana que te aborda na rua para ler a sua mão. A ciência afirma que prever o futuro pode ser uma capacidade humana: uma pesquisa empírica sugere que o cérebro possui uma certa capacidade de perceber o…

Lire la suite
Arqui e tecno

Um sistema para aplicações em tempo real e bigdata análise, graças Hadoop e Cassandra

Enquanto ecosistema Apache Hadoop cresce e ao mesmo tempo o seu núcleo amadurece, existem atualmente várias empresas que oferecem distribuição Hadoop e serviços de primeira classe. Enquanto a EMC, depois de adquirir a Greenplum, parece se destacar e sair na frente, outras outras empresas, como Cloudera ou MapR ainda seguem no páreo. Este artigo apresenta o Datastax Brisk, uma inovadora distribuição Hadoop que coloca a infraestrutura Data Warehouse Apache Hive sob uma camada compatível com HDFS baseado no Cassandra. Brisk tenta combinar  aplicações de tempo-real…

Lire la suite