新浪财经

泛目录

滚动播报 2026-04-24 22:01:54

(来源:上观新闻)

201🏓1 年,原☣🅾力灵机联合创始人📦兼 CEO 唐文*️⃣🇸🇹斌与两位清华同学⬜,印奇、杨📄🔉沐一起创立旷视,🏫🐺这是中国最⚒早的 AI 创👺业公司,只比🥪📞 DeepM🇧🇴ind 晚一🌥🐲年🚾。一个KV Pa🏴‍☠️🇨🇱cket(K👨‍🚀V文件包🇸🇰)的结构就是:🎑👆头部适配器 + 🇪🇸文档正文🍂 + 尾部适配器👍🙌。在Llama模型🍲🔃上,KV Pac🇵🇱ket在人物💈📊传记任务⁉🇳🇪上比最🇬🇬🆎接近的重💵📡计算方案🧙‍♂️快1.36🇷🇸倍,在Hotp🥽👷‍♀️otQA上快🇦🇽3.3倍🚑🥒。底层用B🇧🇧angC高性能编⛩程语言编🐋👨‍🏭写稀疏/压缩A👨‍👨‍👦🎑tten🦢☦tion、Gro🦐upGemm🇧🇧等热点算子🇲🇳的极致优化Ker🙇‍♀️🇻🇦nel,🇲🇲🏋目标是充分👩‍🦲🙇释放硬件🙋‍♂️底层性能🙅。

三、"文件包"🏁方案的核心🇲🇪思路:给文档💳🛏穿上一件⚗"隔离服" 研👙究团队提🌌出的KV P💆ack🔝et方案走🚮的是一条完全不😤同的路🍳。它的FLOPs与🇸🇩🏐"完全不做任何6️⃣🇦🇸修补直接🇨🇳拼接"的方🎟🏡法相同,几乎只💭🇿🇼剩下位🦖⛵置编码🔯🇬🇲调整那一点点🧵微小的计算量💄🇸🇻。唐文斌:单个🇨🇮场景并不是在🙅😄做单个、固定的👨‍🎤🇫🇰任务,我们🏂要找的是📨📽那种有一些泛🌨化性的场景📼🈚。换句话🇷🇪👨‍🦳说,V4的架构设🇹🇲计本身就在为🧲国产芯片🍷🎵铺路🇸🇧🐻。