ICS
35.020
CCS
L 70
团体标准
T/AI
XXX
.
XX
—
XXXX
人工智能算力网络 第6部分:云际管理与调度
Artificial intelligence computing net – Part 6: JointCloud management and scheduling
(征求意见稿)
XXXX
-
XX
-
XX
实施
中关村视听产业技术创新联盟
发布
XXXX
-
XX
-
XX
发布
目
次
前
言
II
引
言
III
1
范围
1
2
规范性引用文件
1
3
术语和定义
1
4
缩略语
3
5
软件参考架构
3
6
功能要求
5
6.1
算力资源管理
5
6.2
镜像管理
7
6.3
数据管理
8
6.4
作业管理
10
6.5
作业调度
12
6.6
调度策略
12
6.7
调度性能评估
14
7
接口要求
14
7.1
作业管理接口
14
7.2
调度策略接口
15
7.3
调度评估模型接口
15
附录A(资料性)接口说明
16
参考文献
21
前
言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规则起草。
本文件是
T/AI 123
《人工智能算力网络》的第
6
部分,T/AI
123
已经发布了以下部分:
——第1部分:总体要求。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由新一代人工智能产业技术创新战略联盟AI标准工作组提出。
本文件由中关村视听产业技术创新联盟归口。
本文件起草单位:鹏城实验室、北京大学、国防科技大学、华为技术有限公司、中科寒武纪科技股份有限公司。
本文件主要起草人:余跃、徐春香、杨晓珍、林冯军、王晖、张叶红、刘敏、曾炜、樊春、
聂
永丰、张鹏、朱宗卫、赵轩。
引
言
T/AI 123
《人工智能算力网络》系列标准,旨在
对人工智能
算力网络
中各部分的详细功能及技术进行标准化,拟由14个部分构成。特别说明的是,
由于智算网络技术
正处于研究攻关的发展时期,该标准体系将随着技术发展而优化和更新。
——第1部分:总体要求。目的在于确立
智算网络
的系统参考架构、总体功能要求及接口要求。
——第2部分:异构资源统一度量和标识。目的在于确立数据、算力、模型、存储、网络等异构资源统一抽象度量和标识的方法与转换要求。
——第3部分:云际数据统一存储应用接口。目的在于确立全局共享数据存储的统一技术架构及其功能、接口、性能、可靠性要求。
——第4部分:调度适配器南向接口规范。目的在于确立调度适配器与
各智算中心云化
管理调度系统之间的接口,
实现智算中心
资源获取和
人工智能团体标准:云际管理与调度