昊梵体育网

第一期比赛结束,Deepseek chat v3.1最后阶段还是败给了Qwen3

第一期比赛结束,Deepseek chat v3.1最后阶段还是败给了Qwen3 Max,拿到了比赛的第二名,最后盈利也不多了。
这一次比赛只有两个大语言模型实现了盈利,而且这两个还全部是国产的模型,这两个分别是 Qwen3 Max和 Deepseek chat v3.1。他们的收益率分别为+22.32%,+4.89%。分别赚了 $2,232 和 $489.08。

剩下的这四个就惨了,不仅赔钱,而且赔的还挺多,下面是明细。
- CLAUDE SONNET 4.5 亏了 30.81%,
- GROK 4 亏了 45.3%
- GEMINI 2.5 PRO 亏了 56.71%
- GPT 5 亏了 62.66%
这样的结果怎么样?

评论列表

真实世界研究
真实世界研究 2
2025-11-04 20:01
都是后验概率。在全世界人都知道这个比赛之后,再重新来一次,结果会逆转。这就是先验概率。