新浪财经

蜘蛛

滚动播报 2026-04-25 00:27:01

(来源:上观新闻)

如果每次🦘有用户提问,👕🏡AI都要把这些文🇹🇹档从头到尾重🈁🕡新读一遍👨‍👩‍👦‍👦,那效率无🎓疑极为🥼低下🇬🇫。这次发布的🇳🇫🇬🇹两个版本,🏴󠁧󠁢󠁳󠁣󠁴󠁿一个是🦸‍♂️总参数1.6🔘万亿,激活49B🏠🦷的旗舰版V4 P🤼‍♂️RO,一◼个是经济😌型V4-🇩🇪🌊Flash,总参🦂🐴数284B,激🥍🥊活13B,均支持✊100万toke💌n上下文,MI📏T协议完🇨🇬全开源🏬。

昇腾A3超节点同😣步适配,64卡🧾🚿大EP模式下♍部署V4-Fla🦅sh,✒😯基于vLLM推理❤引擎可⛓实现单卡200⛑蜘蛛0+T😵🦌PS的De🍀🌻code吞吐👨‍🦰💨。GPT-5🎷.5 🌼9️⃣的设计、🐞😒训练和运行都与🏛英伟达GB20👨‍👨‍👧0 和 GB3💜3️⃣00 👩‍🌾🍺NVL72 系🤭统紧密结合🇲🇳🥀。