开启(static):针对具有整数型 CPU requests 的 Guaranteed Pod ,它允许该类 Pod 中的容器访问节点上的独占 CPU 资源(绑核)。 在创建集群时的高级配置中可以配置CPU管理策略,如下图所示。 另外在节点池中也可以配置CPU管理策略,配置后会自动修改节点的上kubelet 参数 --cpu-manager-policy。
CTCCL(CTyun Collective Communication Library)是天翼云自研的集合通信库。CTCCL针对天翼云自身特点持续优化,提升性能并提供额外的可靠性保障。 CTCCL是基于NCCL并结合天翼云一体化计算加速平台·异构计算架构开发的集合通信库。和NCCL相比,CTCCL提升了通信效率并提供额外的可靠性保障,为用户节约时间和经济成本。CTCCL新增关键特性主动避障,RDMA网络多路径传输,当感知到部分路径异常,则在条件允许情况下自动将流量切换到正常路径。