华为数据存储与「DaoCloud道客」发布AI推理加速联合解决方案
时间:2025-11-30 11:05 来源:科技快报网 阅读量:13123
AI产业已从“追求模型能力极限”转向“追求推理体验最优化”,推理体验决定用户与AI的交互质感。当前推理应用快速发展,Token调用量爆发式增长,推理遇到“推不动、推得慢、推得贵”三大瓶颈,成为产业规模化发展的拦路虎。在有限算力下,长序列输入导致首Token时延增加,甚至超长序列超出模型上下文窗口限制;随着并发数增加,推理吞吐开始下降,任务频繁卡顿;历史对话和行业知识的重复调用造成算力浪费,加大推理成本。如何优化推理效率,是AI产业突破发展瓶颈的关键。
算力的有效利用对AI推理性能和成本优化发挥着至关重要的作用,是企业核心竞争力。算力平台需适配多元存储、Kubernetes集群及推理框架,但硬件生态碎片化、资源分配僵化、调度缺乏AI任务感知、运维可观性不足等技术兼容难题,正严重制约推理应用发展。
近日,华为数据存储与「DaoCloud 道客」联合推出了AI推理加速联合解决方案。该方案融合了华为UCM推理记忆数据管理技术和道客d.run算力调度平台,围绕大模型历史数据,实现KV Cache数据池化管理,以资源的精细化管理和智能调度提升算力利用率,为AI推理加速提供全方位技术支撑。
道客d.run算力调度平台可支持算力与显存资源的细粒度切分及池化,通过多种调度策略实现算力资源的最大化利用。调度器具备拓扑感知能力,可优化任务在xPU间的通信效率,保障AI任务稳定低耗运行。平台提供企业级运维支持,提供多租户隔离、资源配额管理、完整的监控告警及计费计量等功能,满足企业级使用与运维需求。同时具备多元生态兼容性,适配NVIDIA、华为昇腾、寒武纪等多种品牌AI算力,支持TensorFlow等主流AI框架,借助Kubernetes的CSI无缝对接华为OceanStor AI存储,简化管理并为AI任务数据读写提供稳定支撑。
华为UCM是以KV Cache为核心,构建多级缓存空间的分层管理与智能流动机制,实现数据在高性能缓存HBM、内存DRAM和外置OceanStor A系列存储的分级缓存和查询,确保推理记忆知识全量保存。并且,UCM还融合多项创新加速算法:自适应全局Prefix Cache支持公共前缀、历史对话和RAG知识块多种拼接组合场景的复用,通过以查代算,最大程度改善TTFT;全流程稀疏加速算法提供Prefill阶段的超长KV分片卸载和增量稀疏,以及Decode阶段的动态稀疏,提升长序列推理吞吐。
在Qwen3-32B模型上,测试问答助手场景,开启Prefix Cache和RAG Chunk功能。测试数据表明,首Token时延降低约55%,且随着序列长度越长,TTFT降低效果越明显,通过“以查代算”的方式,避免了大量历史对话信息的重复计算。

图1 问答助手场景对比开关UCM的TTFT
测试长文档推理场景,设定序列长度输入32K+输出1K,开启Chunk Prefill和GSA稀疏化功能。测试数据表明,在并发数为30时,TTFT最大降低47%,端到端吞吐最大提升75%。
图2 长文档推理场景对比开关UCM的TTFT
图3 长文档推理场景对比开关UCM的E2E吞吐
关闭UCM,当并发数超17时,请求开始排队;开启UCM,当并发数超32时,请求开始排队。在以上情况下,开启UCM对比关闭UCM场景,并发能力提升88.24%。
图4 长文档推理场景对比开关UCM的并发能力
目前,该方案正在电力、金融等行业试点。未来,双方将持续深化技术合作,推动技术迭代与行业适配,助力AI技术在更多行业的落地应用。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
-
宝马中国联合华为终端深度融合鸿蒙生态开启
在科技飞速发展的今天,汽车智能化已然成为行业发展不可逆转的必然趋势。宝马中国与华为终端的合作,宛如两颗璀璨星辰在浩瀚宇宙中交汇,为汽车智能互联领域带来了全新的曙光和无限可能。宝马,一直以来凭借其卓越的驾驶操控性能,无论是在蜿蜒的山路还是平坦...
-
汽车行业首批增程器综合性能认证自主品牌技
在汽车行业技术不断迭代升级的进程中,增程器领域传来了令人振奋的消息。中国汽车工程研究院股份有限公司联合中国质量认证中心有限公司颁发了汽车行业首批“乘用车增程器综合性能之星”认证证书,这一举措在汽车行业发展历程中具有里程碑式的意义。此次认证基...
-
怎么选购电动叉车呢?易工机械分享几个要点
电动叉车是现代物流行业中的重要设备之一,与传统的燃油叉车相比,它具有更好的环保性、低噪音、更低的维护成本、操作简便、节省时间和更高的安全性等优势。但在选购电动叉车时,需要考虑以下几个方面:一、载货能力叉车的载货能力是一个非常重要的指标。在选...
-
不断创“芯”,亚略特为行业高质量发展提供
近日,由深圳市芯片行业协会联合凤凰网举办的“新时代芯未来“全球芯片产业链发展高峰论坛在深圳前海万科国际会议中心成功召开。亚略特作为杰出企业代表之一受邀参与了此次峰会,并凭借在多模态生物识别核心技术上的不断创新,以及芯片研发领域的持续突破,获...
