魔术泛站群
(来源:上观新闻)
财联社🚏🕳4月24日讯(🚠📍编辑 赵昊)👨👨👧👦最新消息显🐒☁示,软银集团👨👨👧👧⏩旗下的软银公司🐻🗼计划将位于大阪🧬的一部分工厂改造🕟📐为日本最大规🌾🕊模之一的大型电🍀池生产线,为👄其人工智能🚎👋数据中心🔽🔊提供电力🇪🇬。此次交易🚶♀️是Meta近期一🕛系列大手笔🗄😽基础设施投资♨的延续🇬🇼。“成都造、西昌📌🇵🇹发”:“双核”👀拼出的“省内闭🇸🇯🇰🇳环” 成都🥼🐛的独特之💳处,不🙊在于独自包揽一切🛑🔶,而在于🏺🤸♂️它所在的四川省,👩💻恰好用“🇷🇴成都研发制造+👓🥪西昌发🦃🎁射服务”🖥的组合,拼出了⛰一块独特的拼📳⬅图——在省内🉐🐬完成从火箭📢总装到卫🍠🕎星发射的全过🚰程🚪🍵魔术泛站群。
寒武纪🇦🇮❇同样在发布当天🗂宣布,已基于🎫🇺🇿vLL☎🎨M框架完💎👷♀️成V4-Flas🇸🇩🇲🇭h和V🧥4-Pr👖o的Day📰💏 0适配,🎚魔术泛站群代码开源🇬🇸🇹🇹到Gi🔜📩tHub🔉👩🎨。MTT S50👨🦰🛫00恰好是原🔳🧟♂️生支持FP8的😴全功能📟🇯🇴GPU,🇳🇫😾内置FP8 T🔞ensor C🥁🛎ore♊加速单💉元,从🇧🇬🐾传统BF16/🌥FP16🏝🏂到FP8可以逐⏸🔠位直接切入,显存👧🦆压缩超过🤣50%的同🚆🚰时计算👲🧤吞吐实现翻🆘倍📅🧜♀️。
因为具身智能🐕🍬跟硬件强相关👽,中国更🇹🇿有优势来做💉⏮。这也从侧面💝印证了V4在自🍥主算力适配🏆👹上的深度投入🎻。基于这🏬♿个认识,研究🇬🇸团队设计了一🧬⛓种非常简🇺🇳🏏洁的解决方案🤥🦛:在每个文档的前😽面和后🚰面各插入几♻🌶个特殊的"软标👩⚖️🚧记"(Soft 🍨4️⃣Token)🐽🇫🇷,分别叫做"👈🇹🇦头部适🎉🏫配器"(Head🇸🇬er)和🐺🇹🇨"尾部适🇩🇿👾配器"🥰(Traile🎂🏳r)🌋🇧🇩。