Um sistema para aplicações em tempo real e bigdata análise, graças Hadoop e Cassandra

le 01/09/2011 par Ualter Azambuja
Tags: Software Engineering

Enquanto ecosistema Apache Hadoop cresce e ao mesmo tempo o seu núcleo amadurece, existem atualmente várias empresas que oferecem distribuição Hadoop e serviços de primeira classe. Enquanto a EMC, depois de adquirir a Greenplum, parece se destacar e sair na frente, outras outras empresas, como Cloudera ou MapR ainda seguem no páreo.

Este artigo apresenta o Datastax Brisk, uma inovadora distribuição Hadoop que coloca a infraestrutura Data Warehouse Apache Hive sob uma camada compatível com HDFS baseado no Cassandra. Brisk tenta combinar  aplicações de tempo-real com exigência de baixa-latência (OLTP) e grande massa de dados analíticos em um mesmo sistema.

É mesmo? Explorar o resto do artigo, em Inglês