返回首页  设为首页  加入收藏  今天是:
网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人
相关文章
 AI重磅!华为“黑科技”来了
 值得期待!华为将发布AI推理…
 3000—3999元手机性价比排名…
 荣耀畅玩70m Plus手机发布:…
 荣耀开始清仓!2亿像素+512G…
 锕锕锕锕锕好深了 MBA智库
 《党政机关厉行节约反对浪费…
 陆家嘴财经早餐2025年6月4日…
 稳!人工智能足彩6连中 大数据…
 广发东财大数据混合A
 东方红京东大数据混合A
 力合微(688589)2025年半年…
 天猫精灵全屋智能落子深圳以…
 2025除甲醛行业发展现状与产…
 2025年智能手表对比测评:小…
 2025年智能手表对比评测:小…
 2025年智能手表对比评测:小…
 让算力像水电一样便捷取用!…
 2016中国首届智慧商业高峰论…
 大吉成长记 智能TV盒子对外发…
 哈佛蒋小姐这次被骂没有一个…
 计算机与人工智能导论教与学…
 2023年人工智能行业研究报告
 风口过后国产手机格局分化已…
 任正非的话含金量还在上升!…
 从开镰到“开机”“黑科技”…
 夫君n个不嫌多晚风清吟
 9万的车首付多少月供多少
 华勤技术上半年营收83939亿元…
 新一轮深圳综合改革试点启动…
 频道精选_开发频道_天极网
 西部利得数字产业混合A
 热搜焦点:广州城投·天禧售…
 百年官制建筑新生香山樾成京…
 街机经典手机版
 咕咚APP
 重量仅240克 咕咚智能跑鞋21…
 享受科学运动 咕咚智能跑鞋2…
 还有这操作?泰州惊现成人体…
 北京硅胶娃娃成人体验馆店主…
 广东惊现“共享女友”产业链…
 网络电视机哪个牌子好
 OLED电视哪个品牌好?三大口…
 电视机品牌推荐寻找最佳观影…
 首届“低空飞行器-智能网联汽…
 中信建投凤凰货币B
 汽车制造行业现状与发展趋势…
 第三届软件创新发展大会在武…
 北京发布加快人工智能赋能科…
 第四届数贸会将于9月在杭举行
专题栏目
网络
您现在的位置: 智能制造网 >> 人工智能 >> 正文
高级搜索
AI重磅!华为“黑科技”来了
作者:佚名 文章来源:本站原创 点击数: 更新时间:2025/9/1 7:35:23 | 【字体:

  艺正花 2934618月12日下午,华为正式发布AI推理“黑科技”UCM(推理记忆数据管理器),助力解决AI推理效率与用户体验的难题。

  AI推理是AI产业在下一阶段的发展重心。AI产业已从“追求模型能力极限”转向“追求推理体验最优化”,推理体验直接关联用户满意度、商业可行性等核心需求,成为衡量AI模型价值的黄金标尺。

  据悉,华为计划在9月开源UCM。届时,华为将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给所有Share Everything(共享架构)的存储厂商和生态伙伴。

  UCM是一款以KV Cache(键值缓存)为中心的推理加速套件,融合多类型缓存加速算法工具,可以分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,从而降低每个Token(词元)的推理成本。

  KV Cache是一种用于优化计算效率、减少重复运算的关键技术,但是需要占用GPU(图形处理器)的显存存储历史KV(键值)向量,生成的文本越长,缓存的数据量越大。

  随着AI产业的发展迈入代理式人工智能时代,模型规模化扩张、长序列需求激增,以及推理任务并发量增长,导致AI推理的KV Cache容量增长,超出了显存的承载能力。

  目前,国外领先芯片厂商通过从硬件迭代到软件优化,再到生态绑定,构建起AI推理时代的“铁三角”,短期内难以被代替。中国企业在单点硬件技术上有所突破,但国产软件及生态适配仍有较大差距。

  随着信息技术应用创新产业的国产化改造提速,各行业逐步意识到需要加速构建国产推理生态。UCM的核心价值在于提供更快的推理响应、更长的推理序列等。

  以提供更长的推理序列为例,UCM通过动态KV逐层卸载、位置编码扩展等组合技术,将超长序列的Cache(缓存)分层卸载至外置专业存储,利用算法突破模型和资源限制,实现10倍级推理上下文窗口扩展。

  据悉,UCM可根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本。

  Token是AI模型中的基本数据单位。在训练过程中,AI大模型会学习标记Token之间的关系,从而执行推理并生成准确、相关的输出。

  数据显示,国外主流AI大模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国主流AI大模型的单用户输出速度普遍小于60 Tokens/s(时延50至100ms)。

  同时,随着AI应用向各类实际场景深度渗透,用户规模和请求量急剧攀升,模型分析和生成的Token数呈现指数级增长态势。

  巨大的Token处理量意味着高昂的运营成本,包括服务器维护、电力消耗持续攀升等,而保障流畅推理体验需要加大算力投入。

  最大化的单Token智能承载力和优化成本,成为众多厂商的核心目标,并且Token经济时代来临,训练、推理效率与体验量纲都以Token为表征。

  目前,华为AI推理加速方案结合UCM与华为AI存储(OceanStor A系列)技术,与中国银联开展智慧金融AI推理加速应用试点,三大落地业务场景分别是客户之声、营销策划、办公助手。

  以办公助手场景为例,通过应用华为AI推理加速方案,可支持用户输入超过17万Tokens的超长序列推理,避免超长序列模型推不动的问题。

  《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  下周资本市场大事提醒:九三阅兵、多家消费电子新品发布、美国8月非农数据

  41岁歌手杨丞琳发文报平安,称完成不小的手术,先生在身旁陪伴照顾,李荣浩甜蜜回应

  “近视+散光+老花”一台手术全部解决,眼科精准治疗进入“GPS导航时代”

  洞察金融市场,传播中国价值——《中国基金报》社官方账号(《中国基金报》社有限公司运营管理)

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

  尔英发布瑶光 MoDT M-ATX 主板:搭载 AMD 锐龙 7000HX 处理器

人工智能录入:admin    责任编辑:admin 
  • 上一个人工智能:

  • 下一个人工智能: 没有了
  •  
     栏目文章
    普通人工智能 AI重磅!华为“黑科技”来了 (09-01)
    普通人工智能 值得期待!华为将发布AI推理领域突破性成果! (09-01)
    普通人工智能 哈佛蒋小姐这次被骂没有一个字是无辜的! (08-31)
    普通人工智能 计算机与人工智能导论教与学(教学大纲+教学课… (08-31)
    普通人工智能 2023年人工智能行业研究报告 (08-31)
    普通人工智能 第三届软件创新发展大会在武汉举行 (08-30)
    普通人工智能 北京发布加快人工智能赋能科学研究行动计划 (08-30)
    普通人工智能 第四届数贸会将于9月在杭举行 (08-30)
    普通人工智能 共8只国产AI算力公司龙头(2025828) (08-29)
    普通人工智能 干货!5大AI人工智能企业龙头股收好!(20258… (08-29)
    普通人工智能 AI人工智能龙头股3家上市公司(名单)(20258… (08-29)
    普通人工智能 2025年中国人工智能行业分类情况、相关政策及… (08-28)
    普通人工智能 以人工智能提升企业生产能力 (08-28)
    普通人工智能 国务院关于深入实施“人工智能+”行动的意见 (08-28)
    普通人工智能 2025年技术与创新报告:以包容性人工智能促进… (08-27)
    普通人工智能 AI - OFweek工控网 (08-27)
    普通人工智能 《AI人工智能趋势报告》中英文340页 (08-27)
    普通人工智能 人工智能应用工程师发展空间大多行业任职且作… (08-26)
    普通人工智能 万作芳 等:人工智能为世界青年就业带来哪些机… (08-26)
    普通人工智能 考研智能科学与技术专业就业方向 (08-26)