最新:OpenAI最新模型打不动了?GPT-5.2因“降智”陷“差评潮”
该模型上线后遭到大量用户吐槽,认为其从常识问答到情感交互,“智商不稳定”。
(资料图)
OpenAI推出不到一周的最新旗舰模型没能等来“好评如潮”。
近日,OpenAI在十周年之际发布了GPT-5.2系列模型,官方数据显示其在GDPval等专业基准测试中超越人类专家,是迄今为止在“专业知识工作方面”表现最好的模型。
据OpenAI官方披露,GPT-5.2在多领域实现技术突破:GDPval测试中覆盖44个职业的任务表现70.9%优于顶尖专家,SWE-bench Pro编程测试获55.6%的SOTA成绩,还将幻觉率较GPT-5.1降低38%。该公司CEO山姆·奥特曼称其为“许久以来最大的升级”,并透露计划2026年1月解除应对谷歌竞争的“红色警报”。
但该模型上线后遭到大量用户吐槽,认为其从常识问答到情感交互,“智商不稳定”。
SimpleBench常识推理测试显示,GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7,甚至在“garlic有几个r”的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的Gemini 3.0等竞品均稳定通关。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前AWS总经理Bindu Reddy直言,“不值得从GPT-5.1升级”。
网友晒出的网友晒出GPT-5.2在SimpleBench上的成绩单。
一些编程爱好者则发现,GPT-5.2生成的交通灯模拟代码画面仅达“黑白火柴人级别”,蒙娜丽莎ASCII艺术创作效果远逊于GPT-4o。情感交互中有用户倾诉“恐慌发作”,竟收到“很高兴听到这个消息”的回复,安慰失宠孩童时则机械强调“生物都会停止运作”,缺乏此前版本的亲和力和自然表达。
此外,该版本在处理连续对话时不稳定,甚至在明确选择“高级思考模式”时也会返回低质量的自动响应,令用户不得不重新调整使用方式。
还有用户表示,GPT-5.2的安全策略实施过于严格,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。
有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI推广时着重强调GPT-5.2的专业能力和基准测试成绩,但普通用户更关注日常对话、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差。
截至发稿,OpenAI尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。
当前,OpenAI仍面临来自谷歌的巨大竞争压力。谷歌此前推出的Gemini 3在编程、多模态理解等关键企业应用场景上实现了对ChatGPT的性能超越。11月,谷歌宣布Gemini月活跃用户已突破6.5 亿,较7月报告的4.5亿实现大幅增长,而OpenAI披露的周活跃用户数接近8亿。
为此,奥特曼曾发布“红色代码”警报,决定暂时搁置包括Sora视频生成器在内的长期研发项目,转而在短期内全力通过提升用户活跃度来巩固ChatGPT的大众市场地位。但急转直下的口碑或在很大程度上影响ChatGPT的使用率,OpenAI能否拿出更强有力的“武器”反击谷歌仍存在不确定性。
关键词: 最新资讯
相关阅读
-
最新:OpenAI最新模型打不动了?GPT-5.2...
该模型上线后遭到大量用户吐槽,认为其从常识问答到情感交互,“智... -
今日讯!阿斯:皇马希望球队的表现有改...
阿斯:皇马希望球队的表现有改变,否则阿隆索仍有可能下课,阿斯,皇马, -
前沿热点:实丰文化(002862.SZ):股东蔡...
格隆汇12月15日丨实丰文化(002862 SZ)公布,公司股东蔡俊权先生(持有 -
绿盟科技:为关键信息基础设施网络安全...
证券日报网讯12月15日,绿盟科技(300369)在互动平台回答投资者提问时 -
焦点报道:和讯投顾贺梦怡:此处支撑的力...
12月15日,和讯投顾贺梦怡分析称,今天这个保险证券在科技在涨,那不就 -
桥见江苏|五峰山长江大桥
桥见江苏|五峰山长江大桥
- 最新:OpenAI最新模型打不动了?GPT-5.2因2025-12-16
- 速看:江西2026年机制电价竞价结果公示!光2025-12-16
- 微资讯!氯碱双雄触底反弹?创新低后,重要2025-12-16
- 关注:金斯瑞生物科技(01548)授出合共3.632025-12-16
- 哈尔滨市市安食品有限公司成立 注册资本102025-12-16
- 今日讯!阿斯:皇马希望球队的表现有改变,2025-12-16
- 前沿热点:实丰文化(002862.SZ):股东蔡俊权2025-12-15
- 炭黑题材龙头,看看有你的没?(2025/12/152025-12-15
- 焦点快报!李明钦获准担任泉州银行董事、行2025-12-15
- 鹏鹞环保(300664.SZ):拟注册发行科技创新债券2025-12-15
- 绿盟科技:为关键信息基础设施网络安全保驾2025-12-15
- 【报资讯】同仁堂回应磷虾油涉嫌造假:责令2025-12-15
- 广州4宗涉宅用地67.72亿元底价成交 观察2025-12-15
- 焦点报道:和讯投顾贺梦怡:此处支撑的力气2025-12-15
- 昇辉科技:股票交易异常波动2025-12-15
- 新华保险:前11月累计原保险保费收入为11882025-12-15
- 朗新集团股东户数减少286户,户均持股39.312025-12-15
- 桥见江苏|五峰山长江大桥2025-12-15
- 大美南海黄岩岛|焦点讯息2025-12-15
- 银行账户管理对财富增长有影响吗?2025-12-15
- 生意社:12月15日山东地区异辛醇行情下跌2025-12-15
- 聚焦:派杰投资:将可口可乐目标价上调至872025-12-15
- 每日报道:高兴太早了!广东队险胜却收两大2025-12-15
- 年底买茅台要贵了?停货后飞天茅台单日涨802025-12-15
- 中证转债指数早盘收跌0.07% 今日观点2025-12-15
- 中科信息:公司未开展量子计算相关研究2025-12-15
- 天顺风能拟不超19.5亿定增 13%股本质押股2025-12-15
- 今日播报!生意社:12月15日连棕榈油早盘下跌2025-12-15
- 观点:14%反对票拦路!苏农银行5亿科创债“2025-12-15
- 精彩看点:高考604分就读高职!她的目标:电2025-12-15








