搜索
PiFlow大数据流水线系统
认领
关注
0
粉丝
PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行
知识
简介
PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特性:简单易用:可视化配置流水线,实时监控流水线运行状态,查看日志功能强大:提供100+的数据处理组件, 包...
更多
其它信息
地区
国产
开发语言
Java
开源组织
无
所属分类
大数据、 数据处理
授权协议
BSD
操作系统
跨平台
收录时间
2023-09-18
软件类型
开源软件
适用人群
未知
时光轴
里程碑
1
LOG
0
2023
2023-09
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
PiFlow大数据流水线系统
PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计
PrestoDB大数据查询引擎
Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是Hive的10倍以上。PrestoDB是Facebook推出的一个大数据的分布式S
PrestoDB大数据查询引擎
Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。
TrafficTeach大数据项目:车流量监控
车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.Spa
TrafficTeach大数据项目:车流量监控
车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.Spark优化方式项目数据处理架构模块介绍卡扣流量分析SparkCore卡扣车流量转化率SparkCore
Apache MADlib大数据机器学习工具
ApacheMADlib是为数据科学提供的SQL大数据机器学习工具。ApacheMADlib拥有强大的大数据分析能力。ApacheMADlib支持Postgres,PivotalGreenplum数据
MLF大数据机器学习框架(弥勒佛)
让天下没有难做的大数据模型!功能下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现
Apache MADlib大数据机器学习工具
Apache MADlib 是为数据科学提供的 SQL 大数据机器学习工具。Apache MADli
MLF大数据机器学习框架(弥勒佛)
让天下没有难做的大数据模型!功能下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间监督式学习:最大熵分类模型(maxentropyclassifier),决策树模型(decis
Fig流水线式开发框架
Fig(无花果)是一个根据多任务流水线模型开发的运行框架,框架多任务并发使用的java的线程池进行控