切换到宽版
  • 9阅读
  • 2回复

[智能应用]在WAIC上,国产算力不再“斗参数” [7P] [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
147318
金币
293272
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17196(小时)
注册时间: 2012-06-21
最后登录: 2025-07-29
只看楼主 倒序阅读 使用道具 楼主  发表于: 昨天 09:00



7月26日,世界人工智能大会(WAIC)在上海正式拉开帷幕。
在展会现场,具身智能无疑是最备受瞩目的行业。从灵活完成格斗动作的人形机器人,到能精准执行家务、康复辅助的服务型机器人,这些具备物理交互能力的智能体凭借流畅的动作、自然的交互赚足了观众眼球。
然而,在这场科技盛宴中,当人们沉浸在具身智能带来的震撼体验时,人工智能产业的核心底座——以芯片、板卡、服务器、计算集群等为核心构成的算力基础设施,依然是整个行业绕不开的关键话题。

与往届大会相比,今年算力基础设施展区呈现出截然不同的风貌。
往年展台上随处可见的“参数竞赛”已悄然淡去,各厂商送展的芯片和服务器展品中,很少再有将某项极致性能参数用醒目字体刻意标记出来的情况。
曾经被重点标注的技术指标,如今更多地融入到具体的产业解决方案中,或是隐藏在真实的应用场景演示里。
现场的讨论也多是基于“碎片化算力资源统筹”、“低功耗与低成本”与“垂类产品软硬件整合”这些非常务实的话题。




全链路国产化进行时



在算力基础设施的务实转型浪潮中,“全链路国产化”的推进节奏尤为引人关注。
过去几年,全球供应链波动引发的芯片断供风险,以及核心技术“卡脖子”的现实挑战,反复挑动着国内人工智能产业的神经。在全行业已默契达成“居安思危”共识的背景下,即便部分产品应用尚未受到外部限制,国内算力基础设施厂商也主动将国产化的边界从单一芯片突破,拓展至从架构设计、软硬件生态到产业落地的全链路自主可控。
这种主动出击的国产化实践,在本届 WAIC 的展台间随处可见。
从芯片底层架构的自主研发,到操作系统、编译器等软件工具链的国产化适配,再到与本土服务器厂商、行业应用企业的深度协同,一条贯穿“芯片—软件—整机—场景” 的国产化链条正在加速成型。
刚刚提交上市辅导备案的沐曦,算是其中较为典型的代表。
本届展会上,沐曦首次公开展示了其最新研发的训推一体GPU曦云C600。据悉,其采用自研的XCORE 1.5架构及指令集,面向云端人工智能训练与推理、通用计算、AI for Science等计算任务,且拥有丰富的标量、矢量和张量计算单元,支持多种混合精度计算。

虽然现场并没有关于曦云C600的性能参数介绍,但据展台工作人员透露,这枚芯片搭载了当前业界前沿的HBM3e显存。这一关键配置势必会大幅提高显存带宽,为大模型训练及推理时的海量数据吞吐提供强力支撑。
鉴于曦云C600在本月刚刚回片,展会上并未出现基于这枚芯片打造的板卡及服务器。
而基于上代产品曦云C500系列芯片,沐曦在现场展示了PCIe服务器、OAM服务器和光互连服务器解决方案,这些服务器基本都实现了“全链路国产化”,即从编译器、驱动程序,再到卡间互联协议完全自研,或是第三方国内合作伙伴打造。

还有厂商则展示了不同于GPU的另一条高性能计算路线,比如国内唯一实现TPU量产的中昊芯英。
该公司打造的“刹那”系列TPU,采用完全可控的IP核与自研指令集、计算平台,其可重构多级存储、存算一体的设计,配合Chiplet技术实现2.5D封装,在相同AI计算任务下能耗可降低三成。

另外,该枚芯片还有较强的集群扩展能力,最高支持1024片芯片高速互联,基于“刹那”打造的“泰则”计算集群系统,单集群最大浮点运算能力在稀疏算力下达400P(TF32)以上,可支撑超千亿参数的AI大模型计算。
据现场工作人员介绍,目前“泰则”计算集群系统,已完成对AIGC大模型计算、高级无人驾驶模型训练、蛋白质结构精密预测在内的各类高强度运算场景的适配。




下沉到场景中



在两个月前的鲲鹏昇腾开发者大会上,作为华为今年来在算力基础设施上的集大成者,“384超节点”被首次公开,基于昇腾超节点技术,实现了业界规模最大的384卡高速总线互联。

本次展会上,“384超节点”真机完成了在公众面前的首次亮相,而该系统在大模型适配上的进度也令人瞩目。据悉,目前业界已基于昇腾适配和开发超过80个大模型,在基础大模型方面多个技术方向均有积累,如讯飞星火认知、DeepSeek、Qwen、鹏城、LLaMA等。
在场景适配上,基于昇腾软硬件能力、训练与推理解决方案及开源开放的软硬件生态,华为联合伙伴展示互联网、运营商、金融、政务、医疗、油气、交通等行业解决方案实践。
另一家国产GPU企业摩尔线程,在现场展示的场景适配上则要更加细致。
在摩尔线程展位,该公司共带来了包括生命科学、物理仿真、空间智能、视频超分在内的12项面对不同行业打造的Demo。
令笔者印象较为深刻的是视频超分技术MTVSR。该技术可在端侧提供2-4倍的视频实时超分,并提供多档质量设定,能够显著提升低分辨率视频在高分辨率屏幕下的播放清晰度,且以SDK形式支持播放器、浏览器等APP集成调用,可为终端用户提供无缝的视频超分体验。

不同于一般的行业垂直解决方案,视频场景中的端则软件技术,由于其广泛的应用性,一方面能够有效调动行业应用,比如降低内容创作者获取高质量素材的成本,提高内容生产效率;另一方面还能够有效刺激产业生态构建,主动吸引视频播放软件、游戏开发商、监控设备制造商等多方协同。
华为以超节点技术夯实大模型训练的算力底座,通过广泛的行业适配构建生态护城河;摩尔线程则聚焦细分场景,用轻量化技术方案打通算力应用的“最后一公里”。两者虽聚焦不同层面,但却很好地反映出了眼下国产算力基础设施所呈现出“高低搭配、全域覆盖”的发展态势。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
147318
金币
293272
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17196(小时)
注册时间: 2012-06-21
最后登录: 2025-07-29
只看该作者 沙发  发表于: 昨天 09:01
WAIC展现国产算力发展新趋势:从参数竞赛转向务实创新
在2025年世界人工智能大会(WAIC)上,国产算力基础设施的发展呈现出显著的转型特征,“参数竞赛”的时代逐渐落幕,行业聚焦点转向更为务实的全链路国产化、场景化应用及效能优化等方向,标志着国产算力进入高质量发展新阶段12。

国产算力的转型方向与行业特征
从“参数比拼”到“场景落地”的务实转向
往届WAIC展会上常见的芯片性能参数(如算力峰值、制程工艺)醒目标注现象大幅减少,厂商更注重将技术指标融入具体产业解决方案。例如,沐曦最新GPU曦云C600未公开性能参数,而是强调其搭载HBM3e显存对大模型数据吞吐的支撑能力,以及与云端训练、AI for Science等场景的适配性12。现场讨论聚焦“碎片化算力统筹”“低功耗低成本”“垂类软硬件整合”等实际问题,反映出行业从技术单点突破向系统性落地的转变1。

全链路国产化加速推进
受全球供应链波动及“卡脖子”风险驱动,国产算力厂商已从单一芯片国产化,拓展至“架构设计-软件生态-产业落地”的全链路自主可控。典型案例包括:

沐曦:自研XCORE1.5架构及指令集,实现编译器、驱动程序、卡间互联协议的全栈自研,基于曦云C500芯片的服务器方案已完成国产化闭环12。
中昊芯英:采用自研IP核与存算一体设计,推出“刹那”系列TPU,通过Chiplet技术实现2.5D封装,能耗降低30%,支持1024片芯片集群互联,单集群稀疏算力达400P(TF32)12。
华为:展示“384超节点”系统,实现384卡高速总线互联,已适配超过80个大模型(如讯飞星火、Qwen),覆盖金融、医疗等多行业场景12。
多元技术路径与场景适配深化
厂商不再单一追求GPU路线,而是根据场景需求探索差异化方案:

训推一体GPU:如沐曦曦云C600支持混合精度计算,面向通用AI训练与推理1。
专用TPU:中昊芯英“刹那”TPU聚焦高能效比,已适配AIGC、无人驾驶、蛋白质结构预测等场景2。
集群化算力:华为“泰则”计算集群通过软硬协同实现超千亿参数模型支撑,凸显算力规模化应用能力1。
国产算力发展的核心驱动与未来方向
驱动因素

外部压力:海外技术限制促使自主可控需求升级,全链路国产化从“被动应对”转向“主动布局”1。
市场需求:大模型训练对显存带宽、集群扩展的需求,推动厂商优化存储架构(如HBM3e)和互联技术23。
生态协同:芯片厂商与服务器厂商、行业应用企业深度合作,加速“芯片-软件-整机-场景”链条落地1。
未来趋势

效能优先:低功耗、低成本将成为算力竞争核心指标,存算一体、Chiplet等技术持续渗透12。
场景定制:针对金融、医疗等垂类行业的专用算力方案增多,轻量化技术推动算力普惠3。
生态开放:厂商通过开源软硬件生态(如华为升腾的模型适配支持)降低行业应用门槛2。
本届WAIC表明,国产算力已进入“脱虚向实”的关键阶段,通过技术自主化、场景深度化、生态协同化的多重突破,正构建起更具韧性的产业体系。
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
172444
金币
309792
道行
2004
原创
2406
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 39050(小时)
注册时间: 2008-10-01
最后登录: 2025-07-29
只看该作者 板凳  发表于: 昨天 09:20
2025 WAIC算力基础设施观察:从参数竞赛到场景深耕  
——国产化全链路突破与务实落地成主旋律  
(2025年7月28日,农历闰六月初四)  

---

一、核心趋势:算力基础设施的“去泡沫化”转型  
与往届WAIC相比,今年算力展区呈现显著变化:  
1. 参数竞赛退潮  
   - 厂商不再突出单一性能指标(如TOPS、显存带宽),转而强调实际场景效能(如能耗比、碎片化资源调度)。  
   - 讨论焦点转向低成本部署、垂类软硬件整合等务实议题。  

2. 国产化从“单点突破”到“全链路覆盖”  
   - 供应链风险倒逼国产化向架构设计—工具链—整机—场景全环节延伸。  
   - 典型案例:  
     - 沐曦曦云C600:自研XCORE 1.5架构+HBM3e显存,支持AI训练/科学计算,全链路国产化适配。  
     - 中昊芯英“刹那”TPU:存算一体设计+Chiplet封装,集群扩展达1024片,能耗降30%。  

---

二、国产算力“高低搭配”生态成型  
1. 高端底座:华为昇腾384超节点  
- 技术突破:384卡NPU互联,带宽提升15倍,适配80+大模型(星火、DeepSeek、Qwen等)。  
- 行业落地:覆盖金融、政务、油气等场景,构建“算力-模型-应用”闭环。  

2. 轻量化方案:摩尔线程细分场景攻坚  
- MTVSR视频超分技术:端侧实时2-4倍超分,SDK集成播放器/浏览器,降低内容创作成本。  
- 12项行业Demo:生命科学、物理仿真等长尾需求覆盖,打通算力应用“最后一公里”。  

---

三、未来挑战与机遇  
1. 生态协同:国产芯片需加速与操作系统(如OpenHarmony)、编译器(如LLVM国产分支)深度适配。  
2. 成本控制:HBM3e等高端存储依赖进口,国产替代(如长鑫存储)进度关键。  
3. 场景定义权:从“适配现有需求”转向与行业共创新场景(如AI+科学实验自动化)。  

> 总结:2025 WAIC揭示算力产业已进入“国产化深水区”与“价值回归期”,厂商竞争焦点从技术参数转向“谁更能解决真实问题”。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个