目录树
(来源:上观新闻)
Day0🦎适配是一📞🐡个漂亮的开始,🇨🇨但要让开发⏏者真正愿意从CU🇮🇸🤪DA迁移🚢👘过来,需要🇭🇰的不仅仅👻是性能对标,还有📦🗄持续数年的🇲🇰🇪🇸生态建设👯♂️😎。百亿元未来产🙆♂️业创投基金🔣❔落地,明➖确“投早、投小🗂🔜、投新、投🤙硬”🤖。Dee🧣🏄♀️pSeek🏈对V4👩⚕️😮-Pro的定位给🤭🌨了一个🥃直白的对♌标:内部📞员工已🤹♀️📪经把它当作日常❣🌦Agen💳🇪🇨tic 💑Coding🇬🇭工具使🚇🥰用,体验优于C🏃laude 🕠Sonnet◽ 4.5🇧🇧1️⃣,交付质量🌧🧩接近Opus 4🚬.6非思考模🇬🇩式,但与Opus♥🎷 4.6思考模😥式仍有差🦈距🇵🇪。
两个飞😟🦂轮分别是模型训🥘❤练数据飞轮和🇦🇫智能体运营数🛸据飞轮,前者促进🧐“更优🛰异的模型🤔🔢性能”,后者带🧜♂️来“更完整🇨🇿👨💻的上下文网络👮”🚃。在单一领域🇺🇾训练的适配器中🍸目录树,用人物🚓传记数据训练的🐉🇬🇸适配器在传记任㊗务上几乎完美(🕢0.96🎇🧱),但🎀🇲🇱在多跳推理🍳🍎任务上表现惨🏬淡(Hotpo🔘tQA仅0.1🐨8,MusiQu😧🧲目录树e仅0🚵🏃♀️.16)—🌷—它学会了处理🇵🇱🔵简单的信🥦息检索,5️⃣但没有学会🌱处理复🎿🇲🇴杂的逻辑推理🏸。晚点:你们具体🔭🇺🇸怎么解决📍这些问题? 💇♂️唐文斌♾️♥:第一,😿在 VLM 初期🌫就让模型见到机🧞♀️🇸🇲器人的数🏌✉据;第二,在🇮🇳 VLA 训练时🏤🈚,不只训练 ac🥔tion(动作)🇧🇿能力,同时♿😹也去训练 g☕round8️⃣ing(视🥁觉定位)🥝🚫、VQA👩👦💜(视觉🌞问答)这类偏 V✋LM 的能力,🌬🦝做联合训练🍿。