Cloudera Impala基于Hadoop的实时查询
Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。
Impala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax),这样在使用CDH产品时,批处理和实时查询的平台是统一的。目前支持的文件格式是文本文件和SequenceFiles(可以压缩为Snappy、GZIP和BZIP,前者性能最好)。其他格式如Avro, RCFile, LZO文本和Doug Cutting的Trevni将在正式版中支持。
评论
Cloudera
Cloudera成立于2008年,是一家大数据技术公司,基于开源数据管理软件基础架构Hadoop进行二次开发,为企业提供数据管理服务。Cloudera成立于2008年,是一家大数据技术公司,基于开源数
Cloudera
0
RHadoop基于 R 语言的 Hadoop
RHadoop是由RevolutionAnalytics发起的一个开源项目,它可以将统计语言R 与 Hadoop 结合起来。目前该项目包括三个Rpackages,分别为支持用R来编写MapReduce
RHadoop基于 R 语言的 Hadoop
0