乐动体育世界杯中国官网首页 华为昇腾AI芯片获清华大学等机构超等优化:内存用量直降6倍

乐动体育世界杯中国官网首页

你的位置:乐动体育世界杯中国官网首页 > 2026世界杯赔率 > 乐动体育世界杯中国官网首页 华为昇腾AI芯片获清华大学等机构超等优化:内存用量直降6倍
乐动体育世界杯中国官网首页 华为昇腾AI芯片获清华大学等机构超等优化:内存用量直降6倍
发布日期:2026-05-27 20:11    点击次数:124

乐动体育世界杯中国官网首页 华为昇腾AI芯片获清华大学等机构超等优化:内存用量直降6倍

快科技5月24日音尘,AI算力现在的瓶颈照旧从GPU转向了存储芯片,国内尤其枯竭高性能HBM内存等芯片,是以也发展出了多样优化技能,清华大学日前的计算就在华为昇腾上完结了6倍用量的裁汰。

面壁智能、清华大学与 OpenBMB 社区日前连合发布了BitCPM-CANN,这是首个原生基于华为昇腾NPU构建的端到端1.58比特(三元)诳言语模子熟练系统。

顾名想义,这套系统引入了一套三元量化的技能,模子权重被压缩为-1、0、1三种气象,使得显存占用量裁汰了6倍,还顺带着裁汰了功耗,因为运算中高耗能的浮点乘法联想简化成了加减法运算。

NBA下注app中国官方下载

相似裁汰算子也会导致大模子的精度裁汰,不外这套三元量化的本色发扬照旧很强的,团队公布了从0.5B、1B、3B再到8B参数目的大模子与全精度MiniCPM4的对比,1B、3B和8B 三元版天职别保留了各自对应尺寸全精度原版模子97.1% 、97.2%和95.7%的平均性能。

0.5B小尺寸的性能亏欠诚然是最大的,但也达到了90.1%的比率。

速率上的亏欠也在可继承鸿沟内,在昇腾910B芯片平台上,全尺寸精度的模糊量是155TFLOP/S,乐动体育世界杯中国官网首页三元量化版也有148TFLOP/S,亏欠独一4.5%。

更病笃的是,这套系长入开动即是基于昇腾平台原生开荒的,作念到了端到端运行,况兼开源、可都备复现——从计算到部署,用户不错省心使用纵情尺寸的模子。

至于这些技能的意象,不仅仅擢升了国产AI平台的材干,更病笃的是裁汰了对HBM等高价存储芯片的依赖,当初谷歌的阿谁TurboQuant技能亦然差未几裁汰6倍内存用量,一度激发了三星、SK海力士、好意思光等公司股价暴跌。

如今内存市集不仅价钱涨得离谱,况兼厂商险些都不会增多产能,任由缺货加价扩张,改换这个时事是弗成能指望三星等公司我方了,还得靠国内的公司擢升内存闪存芯片产能,同期加大技能优化,让内存闪存的用量不那么虚高才行。

【本文截至】如需转载请务必注明出处:快科技

职守裁剪:宪瑞乐动体育世界杯中国官网首页

著述内容举报

]article_adlist-->   声明:新浪网独家稿件,未经授权结巴转载。 -->

Copyright © 1998-2026 乐动体育世界杯中国官网首页™版权所有

gzsdwjiaju.com备案号 备案号: 

技术支持:®乐动体育世界杯 RSS地图 HTML地图