引谷歌蜘蛛

滚动播报 2026-04-25 10:27:34

（来源：上观新闻）

”他称🎱。智谱GLM🇸🇹👲-5.1本身在2🦝026🧸⤵年4月⛵🇩🇰初的一次更👙新中，已💫🕗经展现📫出令人印象深刻的🖋工程能力🧪。斯坦福大学今年🤟发布的《AI I🥤ndex💃🛀 2026》已经🧢记录了这🤚🅱场追赶的速度🇵🇦🔯：美中顶尖模🚶型的性能🔺差距，从2023🔌🇸🇧年5月的最🔷高31.6👟个百分点，➰压缩到了20🇨🇨26年3月的⏬🌾2.7%😣🍍。

当AI的Agen🌓t能力🇬🇮继续往前走🇯🇲，芯片架构可🕴能还会变🏆。他来了之后做的第🚒一件事，是让公🥪🧲司重新变瘦📻。在Agentic◻ Codin🉐🌠g评测中，其👩‍👧‍👦表现达到当前🕗🗄开源最优🇸🇯水平，并在内部直🌦⏲接作为‼🛷工程团队的🦀编码工具🇨🇳🇱🇧使用🔠。第二个叫"Sw🇮🇩📴iGLU截断👩‍👩‍👧‍👧"：直接把激👗活函数💌的线性分🇬🇷量输出截断在📽[-10, 10⛈🗓]范围内🇻🇳，门控分量上限👯‍♂️👩‍👧‍👦截断至10，物理🦹‍♀️上压制异常值的🇸🇭🥃产生🇨🇩🇱🇺。

在LoCoMo📡基准测📫试上（该基准💍🇺🇦由来自麻省大🏵学等机构的🐠🔓研究者于202💸♓4年AC🇦🇫✡L会议发表，🇺🇦专门评🙇🍒测LLM🧙‍♀️🎳引谷歌蜘蛛代理的超长期对🚲👭话记忆，全🌘称是E🤫valua🛰🥓tin🍵🇵🇸g Very 📥Long🚲👩‍🔬-term Co🇳🇿💹nvers👩‍👧atio🇷🇸nal◻ Memory 🇧🇫✊of LLM🧚‍♀️📭 Agents😚），研究者取🔃🤒了10个对📍话中的2⬇👴个，摄入了15🌿⚔85条事实，🤹‍♀️生成304对🇸🇳问答对，用A📝zure的GPT🇲🇵-5.🤔4-min👞🇹🇹i作为评🏋👈判模型🧜‍♂️，以Lik👨‍🌾ert量🦍🐲表1-5分🛷、≥4分算正确🧜‍♂️的方式打⬇分📼💛。