隆重推出 GPT-5.2

:link: 文章链接:隆重推出 GPT-5.2 | OpenAI

:pushpin: 核心定位与目标

  • GPT-5.2 是 OpenAI 至今最强大的模型系列,专为 专业知识工作和复杂任务执行 打造。

  • 旨在提升 经济价值输出,帮助用户更高效地完成高难度真实工作任务。

:brain: 主要能力提升

  • 制作电子表格、设计演示文稿、编写代码、图像理解、长上下文理解、工具调用、复杂项目执行 等方面全面提升。

  • 在多个基准测试中刷新行业水平,如 GDPval、软件工程、数学与科学推理任务。

  • GPT-5.2 Thinking 在 GDPval 覆盖 44 个职业任务上表现优于或持平于行业专家。

:bar_chart: 性能亮点

  • 在高阶专业任务 GDPval 中,GPT-5.2 Thinking 超越行业专家表现达 70.9%

  • 相较 GPT-5.1,在真实生产任务(如投资银行电子表格建模)上性能提升明显。

  • 在软件工程基准中取得显著进步,增强了代码调试、重构与交付能力。

  • 幻觉率明显降低,提升专业任务中的可靠性。

  • 长上下文推理能力显著增强,可处理数十万 Token 的深度分析。

每百万 Token 的价格

模型 输入 缓存的输入 输出
gpt-5.2 / gpt-5.2-chat-latest $1.75 $0.175 $14
gpt-5.2-pro $21 - $168
gpt-5.1 / gpt-5.1-chat-latest $1.25 $0.125 $10
gpt-5-pro $15 - $120

Last edited by @cuiboran 2025-12-12T01:31:09Z

2 Likes

看benchmark有可见提升,不过也变贵了些……感觉是5.1加参数规模做的

1 Like

GPT-5.2都来了,我还在论坛灌水,这合理吗?

2 Likes

这么快就出5.2了 :scream:又变贵了

1 Like

gpt就这德行。这么快的迭代应该没有技术上变太多,结合涨价我怀疑是加参数了。

1 Like

5.1 是情感微调

1 Like

是的,因为5high太不像人了。所以要是从硬任务性能的角度来说5high到5.2high的进步速度并不能让我满意就是了(

1 Like

后面出5.3 或者 5.4 Fast 的时候还会再降下来,OpenAI常用手段了,为后面“降价”做准备

1 Like

过拟合越来越严重了,没有人味了

3 Likes

唉气笑了,还是用gemini和DS去了。

前者说话像人并且硬任务也sota,后者性价比这块。

2 Likes