更少词元,更高质量,GPT-5.4 Thinking 跟 Pro,今天将在 ChatGPT应用、API跟 Codex逐步投放给所有用户,下图是某免费用户Codex。
一些亮点
1️⃣提高了创建PPT的水平,另外有Excel表格跟word文档
2️⃣改善computer use——模型自己“看”、自己操作,批量填表单例子见下图(几秒钟填完11份表单),具体评估集,Online-Mind2Web有较大提升(70.9%到9.8%),OSWorld-Verified测评号称超越人类表现,其他只是略微提升(WebArena-Verified、MMMU-Pro、OmniDocBench)
3️⃣幻觉率下降。
4️⃣编程方面,在SWE-Bench Pro表现上略优于GPT-5.3-Codex,同时降低推理延迟。可以调试Electron.js应用,通过Playwright (Interactive) Skill5️⃣
1️⃣更多信息见openai.com/index/introducing-gpt-5-4/
2️⃣Excel插件 chatgpt.com/apps/spreadsheets/
3️⃣幻灯片Skill :github.com/openai/skills/tree/main/skills/.curated/slides
4️⃣Excel Skill :github.com/openai/skills/tree/main/skills/.curated/spreadsheet5️⃣ Playwright (Interactive) Skill github.com/openai/skills/tree/main/skills/.curated/playwright-interactive