时间在变,空间随着时间也在变,不变的唯有真知灼见。
2025 年 07 月 17 日 星期四
首页
财经
观察
参考
ESG
公告
市场
研究
IPO
公司
周报
动态
推荐
真灼财经 >  真灼快讯 >  正文

【OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性】

来源:真灼财经 时间:2025-02-23 09:40:33

字号
【OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性】近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。
微信扫码 > 右上角点击 > 分享