Apache ImpalaApache Hadoop 的本机分析数据库

联合创作 · 2023-09-21 16:18

Apache Impala 是 Apache Hadoop 的开源本机分析数据库。

  • Impala 为Hadoop上的BI/分析查询提供了低延迟和高并发性(Apache Hive等批处理框架无法提供)。Impala还可以线性扩展,即使在多租户环境中也是如此。
  • 利用与你的Hadoop部署相同的文件和数据格式以及元数据、安全和资源管理框架--没有冗余的基础设施或数据转换/重复。
  • 对于Apache Hive用户来说,Impala利用了相同的元数据和ODBC驱动。与Hive一样,Impala支持SQL,所以你不必担心重新发明实现轮子。
  • Impala集成了本地Hadoop安全和Kerberos认证,通过Sentry模块,你可以确保正确的用户和应用程序被授权使用正确的数据。
  • 有了Impala,更多的用户,无论是使用SQL查询还是BI应用,都可以通过一个单一的存储库和元数据存储,从源头到分析,与更多的数据进行互动。
     
浏览 5
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报