Meta新AI模型“Maverick”涉嫌优化“作弊”,引发业内质疑

Meta近日发布的新旗舰模型“Maverick”在LM Arena排行榜上名列第二,但研究人员指出,该测试版本与开发者可用的公开版本存在明显差异。

Meta承认,参与测试的是“针对对话优化”的实验性版本。研究者发现,LM Arena上的Maverick回答更冗长,使用大量表情符号,而公开版本则表现平平。此举引发业内对AI公司是否应为排行榜优化模型的争议。过度定制测试版本可能误导开发者,破坏评测公正性。Meta与LM Arena官方目前尚未回应相关质疑。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索