新浪财经

泛站群程序

滚动播报 2026-04-24 22:42:53

(来源:上观新闻)

实际效果用两个🧷🌄数字就能概括:🎭在百万toke🇸🇮▪n上下文设置🇸🇲下,V4-P🇸🇹🇦🇩ro每处理🐆◻一个tok👨‍✈️✒en的算力🏋消耗只有📖🆒V3.2🛎的27%,KV缓🧜‍♀️🙍存占用只有💻10%🐕。服务器🙅‍♂️🖥将搭载香🌒港大学📜牵头研制的火星地🥣物高光谱成🤳🌽像仪,用🤚于开展生🧒命痕迹、含🏜🐡水矿物及🔙资源普查🛋等探测🇵🇪🕕。

华为给出了一组具5️⃣体的性能数据:🔹基于昇腾950超🇨🇴节点,V4-🥫Pro在🐳8K输入场景下实✳现了约20🆓🐫ms的单🇹🇭tok👁️‍🗨️en解码时👨‍🏫🕥延,单卡吞🎙吐4700 T🛡PS;V4-F⏰🦙lash可以做到🕝😤约10ms🧠🔢时延,单卡吞吐1🔧🧠600 TPS🛳👨‍🎨。虽然当前这一🍣技术主要应用于卫📳星制造,但🚖航天工业的通用👈规律是:当🔤🌼设计、材料、制💙造工艺实😕现质的飞跃时,火🚈箭和飞船🍎的制造同样会受🤬🇦🇱益🌌👯‍♂️。

整个模型在🏟超过32万🍄亿toke🚸⏪n上完成了预🧨训练🥂🚼。但当一个万亿参🚳⛩数级的开源👨‍❤️‍💋‍👨旗舰模型📼,在发布首😢☸日就能跑在🆗🇸🇷国产算力的全系列🦵产品上,适配代码✏直接开源⬜🔠,推理性能给出🇰🇲🤽‍♂️了具体的吞吐🎠和时延👨‍🌾🌥数据而不是"即将🐴支持"——这💛🚻件事的意义🧛‍♂️🆘,已超出了任何💭单一模型的评测🍍🇻🇪范畴👝🈹。