申城AI基础设施企业:让“满血版”DeepSeek更适配好用
时间:2025-02-12 22:57 来源:中国经济网 阅读量:19803
好消息是,“满血版”DeepSeek-R1、V3正在得到越来越多第三方平台的支持。
11日,上海AI基础设施企业无问芯穹宣布获七家国产芯片企业鼎力支持,正打通DeepSeek-R1、V3在壁仞科技、海光信息、华为昇腾、摩尔线程、沐曦、燧原科技、天数智芯等7个硬件平台的多芯片适配优化,现开发者已可通过无问芯穹Infini-AI异构云平台一键获取DeepSeek系列模型与多元异构国产算力服务。
自春节前夕爆火,DeepSeek已牵动国内超30家云服务商与近20家芯片企业宣布接入。随着无问芯穹宣布获7家国产芯片企业支持,并带着多芯片适配的DeepSeek-R1入场,DeepSeek为可控国产算力撬动的历史机遇,正变得愈发清晰。
“同题作答”到底谁更强?
DeepSeek是绝佳的商业化试炼场,激发了大量推理算力需求。几乎主流云厂商均已宣布提供R1模型服务,但全网找到服务不繁忙的“满血版”还是不容易。
以前,国产AI芯片都号称支持大模型部署,奈何实际使用者并不多。现在,DeepSeek相当于给AI芯片公司出了同一道考题:你到底“来赛”吗?
短时间内,20家国产AI芯片企业争相适配或上线DeepSeek模型,以期抓住这千载难逢的增长机遇。这恰恰反映当下AI基础设施的特点:芯片和算力资源是有,但没被高效利用起来。
如何将大量不同架构的国产芯片变得能用、好用,并在使用过程中形成硬件与算法之间的正向循环?无问芯穹的策略是做“异构云”,即统筹模型和算力需求,把分散在不同地方的异构算力整合起来,实现不同模型和不同硬件之间的统一部署和联合优化,提供给需要算力和模型的客户。
去年7月,无问芯穹就在业内首次实现了千卡规模的4+2种芯异构混训,集群算力利用率最高达到97.6%,其运营算力已经覆盖全国超13座城市。
“当下的生态环境,需要一个从算法、硬件到模型都深入理解的团队,无问芯穹便具备这样的全栈垂直优化能力。”无问芯穹联合创始人、CEO夏立雪表示。
加速全国产AI产业闭环
夏立雪说,DeepSeek的突破,激发了越来越多的下游应用创造力,未来行业日均tokens消耗量将达到百万亿级别,不仅将激发国产芯片的市场需求,也为打造全国产AI产业闭环,实现更可控的自主算力发展创造了有利条件。
记者了解到,在美国,模型、系统、芯片三个关键因素已经形成闭环生态;而国内多数大模型是通过国外芯片训练得到的,与国内的系统、芯片难以形成闭环。
“DeepSeek作为开源模型,其之于AI 2.0时代,正如Android之于移动互联网革命,将重构整个产业生态,引发链式反应,加快上层应用发展和下层系统‘统一’增速,由此广泛调动起跨越软硬件和上下游的生态,一起加大投入‘国产模型—国产芯片—国产系统’的协同优化和垂直打通。”夏立雪说。
对此,无问芯穹提出“三步走”模式,来促进全国产AI产业闭环的打通——基于主流芯片开展极致软硬件协同优化,以有限算力实现国产模型能力追赶国外模型;推动国产芯片开放底层生态,搭建“异构”AI系统解决算力缺口,实现模型能力赶超;构建国产“同构”系统,支持Scaling Law持续发展,打造“国产模型—国产芯片—国产系统”的全国产AI产业闭环,实现更可控的自主算力发展。
夏立雪表示,在劈开算力封锁的路上,DeepSeek踏出了成功的一步,接下来的“国产模型+国产算力+国产云服务+国产应用”全国产化AI之路,还要靠产业链上下游的生态伙伴合力闯出来。
软硬协同优化是必然路径
DeepSeek大语言模型共发布了3个大版本,参数规模从67B扩大到236B再到如今的671B,所用的训练算力并未与模型尺寸等比例地成倍增长,其核心便是利用软硬件协同设计的思想,不断提升系统开销——即模型的训练成本到模型尺寸、能力的转化率。
记者了解到,软硬协同优化是连接硬件和算法的桥梁,区别于各种算法层面优化方法,和硬件本身迭代的方法,而是随着硬件变化,让软件也不断优化,或根据软件的迭代来定义未来的底层电路实现,以更好地支持AI算法的运行。
业内人士指出,DeepSeek通过软硬件协同降低算力成本,给国内的启示在于这套方法论可以打破现在的闭环生态瓶颈。
无问芯穹核心技术团队早在2018年就总结出了“深度学习算法—编译—芯片联合设计”路线,致力于人工智能场景下能效电路和系统设计方法的研究,是软硬协同路线上的早期开拓者之一。自成立以来,依托“多元异构、软硬协同”的核心技术优势,打造了连接“M种模型”和“N种芯片”的“M×N”AI基础设施新范式。
蛇年春节,DeepSeek和《哪吒之魔童闹海》两匹“黑马”,扭转了中国企业技不如人的成见,也证明了只要实力强,自有不分国界的人鼓掌。前两日,本报报道了《国际权威科技商业化智库关注DeepSeek之外中国人工智能初创公司 四大AI新锐三家已入驻模速空间》,其中就包括了无问芯穹。有分析认为,DeepSeek正在让国际意识到,除了DeepSeek之外,中国还存在若干路径独特的团队,在用“力大砖飞”堆叠GPU算力储备、比拼模型精度的巨头竞赛之外,找到未被五角大楼战略家们关注到的“盲点”,跨越软硬件,攒动上下游,走出可能出奇制胜的技术路径。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
-
怎么选购电动叉车呢?易工机械分享几个要点
电动叉车是现代物流行业中的重要设备之一,与传统的燃油叉车相比,它具有更好的环保性、低噪音、更低的维护成本、操作简便、节省时间和更高的安全性等优势。但在选购电动叉车时,需要考虑以下几个方面:一、载货能力叉车的载货能力是一个非常重要的指标。在选...
-
不断创“芯”,亚略特为行业高质量发展提供
近日,由深圳市芯片行业协会联合凤凰网举办的“新时代芯未来“全球芯片产业链发展高峰论坛在深圳前海万科国际会议中心成功召开。亚略特作为杰出企业代表之一受邀参与了此次峰会,并凭借在多模态生物识别核心技术上的不断创新,以及芯片研发领域的持续突破,获...
-
我国5G基站总数达238.4万个
工信部发布2023年1—2月份通信业经济运行情况。截至2月末,我国5G基站总数达238.4万个,占移动基站总数的21.9%,5G网络建设稳步推进。数据显示,1—2月份,信息通信行业整体运行平稳。电信业务收入和业务总量稳步增长,云计算等新兴业...
-
灵感来自中国:俄罗斯电视台首次推出AI女
这年头,连女主播都可能不是真人了。据看看新闻KNEWS报道,俄罗斯南部斯塔夫罗波尔地区的一家电视台推出了一位AI天气预报女播报员,她亮相2次后就圈粉无数。3月22日SvoyoTV电视台首播了名为ldquo;未来预测rdquo;的新节目,最引...