Arroyo分布式流处理引擎
Arroyo 是一个用 Rust 编写的分布式流处理引擎,旨在有效地对数据流执行有状态计算。与传统的批处理不同,流引擎可以在有界和无界源上运行,并在结果可用时立即发出。
使用 SQL 转换、过滤、聚合和连接 Kafka 流,并在亚秒级获得结果。自动从每秒 10 个事件扩展到数百万个事件。
简而言之:Arroyo 让你可以通过亚秒级结果提出大量实时数据的复杂问题。
特性:
- SQL 和 Rust 管道
- 每秒可扩展至数百万个事件
- 有状态操作,如窗口和连接
- 用于管道容错和恢复的状态检查点
- 通过数据流模型进行及时的流处理
一些示例用例包括:
- 检测欺诈和安全事件
- 实时产品和业务分析
- 实时摄取到你的数据仓库或数据湖
- 实时机器学习特征生成
评论
RikoPython 流处理引擎
Riko是一款Python流处理引擎,类似YahooPipes。采用纯python开发,用于分析处理结构化数据流。拥有同步和异步APIs,同时也支持并行RSSfeeds。Riko也支持字符终端界面。功
RikoPython 流处理引擎
0
Tigon分布式流处理框架
Tigon是一个开源的、实时的、低延迟、高吞吐量的流处理框架。基于ApacheHadoop和ApacheHBase构建。Tigon严重依赖开源项目Tephra和Apache Twill提供紧密的集成到
Tigon分布式流处理框架
0
Apache Samza分布式流处理框架
Samza是近日由LinkedIn开源的一项技术,它是一个分布式流处理框架,专用于实时数据的处理,非常像Twitter的流处理系统Storm。不同的是Samza基于Hadoop,而且使用了Linked
Apache Samza分布式流处理框架
0
MassLogProcess分布式日志处理和关联分析引擎
MassLogProcess 是一个分布式日志处理和关联分析引擎。现在处理alpha阶段,MassL
MassLogProcess分布式日志处理和关联分析引擎
0