CANN / tensorflow AllReduce操作

张开发

• 2026/5/9 12:26:41 • 15 分钟阅读

分享文章

allreduce【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow功能说明集合通信算子AllReduce的操作接口将group内所有节点的输入数据进行归约操作后再把结果发送到所有节点的输出buf其中归约操作类型由reduction参数指定。函数原型def allreduce(tensor, reduction, fusion1, fusion_id-1, grouphccl_world_group)参数说明参数名输入/输出描述tensor输入TensorFlow的tensor类型。针对Ascend 950PR/Ascend 950DT支持数据类型int8、int16、int32、int64、uint64、float16、float32、float64、bfp16。针对int64、uint64、float64当前仅支持节点内通信。针对Atlas A3 训练系列产品/Atlas A3 推理系列产品支持数据类型int8、int16、int32、int64、float16、float32、bfp16。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品支持数据类型int8、int16、int32、int64、float16、float32、bfp16。需要注意针对int64数据类型性能会有一定的劣化。针对Atlas 训练系列产品支持数据类型int8、int32、int64、float16、float32。针对Atlas 300I Duo 推理卡支持数据类型int8、int16、int32、float16、float32。reduction输入归约操作类型String类型。针对Ascend 950PR/Ascend 950DT支持的操作类型为sum、max、min。针对Atlas A3 训练系列产品/Atlas A3 推理系列产品支持的操作类型为sum、max、min、prod当前版本“prod”操作不支持int16、bfp16数据类型。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品支持的操作类型为sum、max、min、prod当前版本“prod”操作不支持int16、bfp16数据类型。针对Atlas 300I Duo 推理卡支持的操作类型为sum、max、min、prod当前版本“max”、“min”、“prod”操作不支持int16数据类型。fusion输入allreduce算子融合标识int类型支持以下取值- 0网络编译时不会对该算子进行融合即该allreduce算子不和其他allreduce算子融合。- 1网络编译时对该算子按照梯度切分策略进行融合。- 2网络编译时对allreduce算子按照相同的fusion_id进行融合即“fusion_id”相同的allreduce算子之间会进行融合。fusion_id输入allreduce算子的融合idint类型。当“fusion”取值为“2”时网络编译时会对相同fusion_id的allreduce的算子进行融合。group输入String类型最大长度为128字节含结束符。group名称可以为用户自定义group或者hccl_world_group。返回值对输入tensor执行完allreduce操作之后的结果tensor。约束说明调用该接口的rank必须在当前接口入参group定义的范围内不在此范围内的rank调用该接口会失败。每个rank只能有一个输入。allreduce上游节点暂不支持variable算子。该接口要求输入tensor的数据量不超过8GB。allreduce算子融合场景只支持reduction操作类型sum。调用示例from npu_bridge.hccl import hccl_ops tensor tf.random_uniform((1, 3), minval1, maxval10, dtypetf.float32) result hccl_ops.allreduce(tensor, sum)【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

更多文章

前端开发 2026/5/9 12:26:41

CANN DeepSeek-V4 NPU推理优化

DeepSeek-V4 Inference on NPU 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法，提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer 概述 DeepSeek团队发布了最新的模型Dee…

张开发

前端开发 2026/5/9 12:25:59

IEEE会议，录用率23.1%！CCF推荐学术会议（C）截稿提醒

►►►DSAA 2026The 13th IEEE International Conference on Data Science and Advanced Analytics (DSAA’2026) will be held in New Delhi, India on October 6-9, 2026. It features its strong interdisciplinary synergy between statistics, computing and information/…

张开发

前端开发 2026/5/9 12:24:16

基于GB/T 8567-2006的《数据需求说明（DRD）》完整案例（7/25）

项目名称： 某无人机系统项目编号： LEMF-UAS-DRD-2024-001 版本号： 1.0 编制单位： XXX公司编制： XXX 审核： XXX 批准： XXX 编制日期：1 引言1.1 标识本文档是“某无人机系统&#xf…

张开发

前端开发 2026/5/9 12:21:34

CANN/TensorFlow NPULossScaleOptimizer构造函数

NPULossScaleOptimizer构造函数【免费下载链接】tensorflow Ascend TensorFlow Adapter 项目地址: https://gitcode.com/cann/tensorflow 功能说明 NPULossScaleOptimizer类的构造函数，浮点计算的溢出模式为“饱和模式”的场景下，用于在混合精度…

张开发

前端开发 2026/5/9 12:19:44

2026年北京全屋高端定制现代简约风格公司测评与选型指南

一、引言随着北京全屋定制市场的不断发展，现代简约风格备受消费者青睐。在众多品牌中，如何选择适合自己的高端定制公司成为了消费者关注的焦点。本指南将对北京地区的全屋高端定制现代简约风格公司进行测评与选型分析。二、行业现状近年来&#xff0c…

张开发

前端开发 2026/5/9 12:11:54

CANN/pypto floor向下取整操作API文档

pypto.floor 【免费下载链接】pypto PyPTO（发音: pai p-t-o）：Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto 产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/At…

张开发

前端开发 2026/5/9 12:00:34

CANN/ATVOSS三元运算符接口文档

TernaryOp 【免费下载链接】atvoss ATVOSS（Ascend C Templates for Vector Operator Subroutines）是一套基于Ascend C开发的Vector算子库，致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。项目地址: http…

张开发

前端开发 2026/5/9 11:53:51

CANN/pyasc按位或运算API

asc.language.basic.bitwise_or 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口，支持在昇腾AI处理器上加速计算，接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc asc.language.basic.bitwis…

张开发