Apache Gobblin分布式数据集成框架
Gobblin 是 Hadoop 通用数据摄取框架,可以从各种数据源中提取,转换和加载海量数据。比如:数据库,rest APIs,filers,等等。Gobblin 处理日常规划任务需要所有数据摄取 ETLs,包括作业/任务规划,任务分配,错误处理,状态管理,数据质量检测,数据发布等等。
Gobblin 通过同样的执行框架从不同数据源摄取数据,在同一个地方管理所有不同数据源的元数据。同时结合了其他特性,比如自动伸缩,容错,数据质量保证,可扩展和处理数据模型改革等等。Gobblin 变得更容易使用,是个高效的数据摄取框架。
评论
Apache Gobblin分布式数据集成框架
Gobblin是Hadoop通用数据摄取框架,可以从各种数据源中提取,转换和加载海量数据。比如:数据库,restAPIs,filers,等等。Gobblin处理日常规划任务需要所有数据摄取ETLs,包
Apache Gobblin分布式数据集成框架
0
Apache SeaTunnel高性能分布式数据集成平台
SeaTunnel 是下一代超高性能的支持海量数据快速同步与集成的云原生数据集成工具,每天可以稳定高
Apache SeaTunnel高性能分布式数据集成平台
0
Apache SeaTunnel高性能分布式数据集成平台
SeaTunnel是下一代超高性能的支持海量数据快速同步与集成的云原生数据集成工具,每天可以稳定高效同步万亿级数据,已在字节、B站、微博、腾讯云及印度电信等数百家公司生产上使用,目前也已经支持过百种数
Apache SeaTunnel高性能分布式数据集成平台
0
Apache Camel K轻量级集成框架
CamelK是一个轻量级集成框架,它使得可以直接在Kubernetes与Knative上运行Camel。Camel是一个基于规则的路由以及媒介引擎,它提供了一个基于POJO的企业集成模式的实现,开发者
Apache Camel K轻量级集成框架
0
Apache Samza分布式流处理框架
Samza是近日由LinkedIn开源的一项技术,它是一个分布式流处理框架,专用于实时数据的处理,非常像Twitter的流处理系统Storm。不同的是Samza基于Hadoop,而且使用了Linked
Apache Samza分布式流处理框架
0
Apache Dubbo分布式 RPC 服务框架
Dubbo是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的RPC实现服务的输出和输入功能,可以和 Spring框架无缝集成。主要核心部件:Remoting: 网络通信框架,实现了s
Apache Dubbo分布式 RPC 服务框架
0