目录编辑
(来源:上观新闻)
”但他也💊认为,单纯🤘看马拉松跑多🍨远、跑🥎🐞多快,甚至🇰🇪🇧🇮宣称“😛1500米超🧺📓越人类”,意义🤾♂️并不大✡。把这些跑分放在👩🦲🧦一起看,会发现这🧒次模型的💃评价标准正🌧🤠在发生变化:过去🇱🇻我们常用MMLU🇬🇪♈、GPQA这🛑👩👦👦样的指标看模型的👯♂️知识和推理能力,📌😳目录编辑但现在更侧🚑重于G📉🔮DPval、O▪🍔SWorl🧝♀️⛅d这类“任务级评☀😔估”⏬。
他强调:“🇦🇷而我个🐼🏯人认为,AI对我🏏们的价值首先是增📂🏄♀️强能力,其次是🦊♻提高效率🦡。当企业客户🅿🔲的需求从一块G🎖PU变成了帮我管👨👧👧住一千个A🎢🔎gent,卖芯🤫片的就比👣📱不过卖系统的了🇱🇰✡。”周津告⛏诉「甲子👨👨👦光年」📽🌏。