简介
TePDist (TEnsor Program DISTributed) 是一个用于 DL 模型的自动分布式训练系统基础设施,而不仅仅是一种算法。TePDist 系统以客户端/服务器模式运行。客户端应该是任何可以生成 XLA HLO 的前端。服务器负责分布式策略规划和自动分布式任务启动。将客户端和服... 更多
其它信息
地区
国产
开发语言
C/C++
Python
开源组织
阿里巴巴
所属分类
神经网络/人工智能、 机器学习/深度学习
授权协议
Apache
操作系统
跨平台
收录时间
2023-09-26
软件类型
开源软件
适用人群
未知
时光轴
里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%
推荐
iBase4J分布式系统
Springboot,Spring,SpringMVC,Mybatis,mybatis-plus,motan/dubbo分布式,Redis缓存,Shiro权限管理,Spring-Session单点登录
iBase4J分布式系统
0
Primus分布式训练调度框架
Primus是一个用于机器学习应用程序的通用分布式训练调度框架,管理机器学习框架(如Tensorflow、Pytorch)的训练生命周期和数据分布,帮助训练框架获得更好的分布式能力。功能多训练框架支持
Primus分布式训练调度框架
0
Onyx分布式计算系统
Onyx是什么?Onyx是一个无中心、支持云、容错的分布式计算系统使用Clojure编写支持批处理和流处理混合提供信息模型用于描述和构建分布式工作流竞争对手:Storm,Cascading,Map/R
Onyx分布式计算系统
0