GPT-5之一波用户反馈:笨拙,还我4o

音符科技网

  炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:网易科技)

OpenAI备受瞩目的新一代模型GPT-5在发布后遭遇了意想不到的初步反应,部分早期用户抱怨其表现“笨拙”,甚至不如前代产品。

许多用户表示,这款被誉为能将ChatGPT提升至“博士级专家”水平的新模型,在实际使用中却频频在简单的数学和拼写问题上出错,甚至会编造信息。有许多付费用户表达了失望情绪,甚至呼吁恢复使用其前代模型GPT-4o。

OpenAI首席执行官Sam Altman于周五迅速做出回应。他承认GPT-5的发布过程“坎坷”,并将用户体验不佳归咎于技术故障。Altman表示,一个负责根据用户提问自动选择不同复杂程度模型的“自动切换器”在发布当天大部分时间处于失灵状态,导致系统调用了较弱的模型,使得GPT-5看起来“笨拙得多”。

对OpenAI而言,此次发布的成败攸关重大。该公司不仅需要以此证明其在人工智能领域的持续领先地位,更需要说服企业和个人用户为其高级服务付费。这些收入对于抵消其在人才、芯片和数据中心等方面的巨额投入至关重要,而一个不稳定的开局无疑会为这一商业目标蒙上阴影。

“自动切换”机制引发困惑

此次用户负面反馈的根源,很大程度上指向了GPT-5底层一个全新的运行机制。与以往版本不同,GPT-5引入了一个“自动切换器”(autoswitcher),系统会根据用户查询的复杂程度,自动在不同等级的模型之间进行切换。OpenAI希望通过这种方式更大限度地优化其宝贵的计算资源。

然而,这种设计也意味着用户并非总能调用OpenAI最强大的技术。当该切换机制未能准确判断或出现故障时,用户的体验便会大幅下降。

一个测试案例生动地说明了这一点:当被问及单词“blueberry”中有几个字母“b”时,GPT-5最初给出了错误的答案“三个”。但在被提示“再想一想”之后,系统似乎调用了更高级的推理模型,最终给出了正确答案。这一机制的不透明性是用户感到困惑和不满的主要原因之一。

尽管负面反馈占据了社交媒体的头条,但GPT-5的早期评价呈现两极分化。部分专业人士在试用后给出了积极评价。开发者Simon Willison在一篇博客文章中称GPT-5是“我最喜欢的新模型”,认为它“能胜任工作”且“偶尔表现出色”,但也补充说,“它与我们之前拥有的模型没有本质上的区别”。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick则对其研究、写作和简化编程的能力感到惊叹:

Altman承认首秀失误并承诺改进

面对汹涌的*,OpenAI管理层试图平息用户的担忧。在周五于Reddit平台举行的“Ask Me Anything”(AMA)活动中,Altman坦承了发布初期的技术问题。他承诺,“从今天开始,GPT-5会显得更智能”。

他表示,OpenAI正在研究允许Plus付费用户继续使用GPT-4o的方案,并将为Plus用户提供双倍的使用速率限制,以鼓励他们更好地适应新模型。

此外,针对发布会上引发“图表犯罪”(chart crime)嘲讽的一张严重失准的图表,Altman在社交平台X上承认这是一个“巨大的图表失误”,进一步显示了此次发布的仓促与混乱。

根据用户排名的流行榜单LMArena,GPT-5在周五中午已升至多个类别的榜首。但另一个基准测试ARC-AGI-2则显示,GPT-5落后于xAI的最新版Grok模型。

GPT-5的此次发布正值人工智能领域竞争空前激烈的时刻,这使其表现出的任何不稳定性都备受关注。OpenAI正努力维持其近三年前由ChatGPT引爆的生成式AI热潮所带来的领先优势,而包括马斯克的xAI在内的竞争对手正穷追不舍。

对于每周拥有近7亿用户的ChatGPT而言,一个平稳、可靠的用户体验是维持其市场地位和证明其商业价值的关键。此次发布的波折,无疑对投资者和市场信心构成了一次考验。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 正军职退休干部、公安部原消防局局长孙伦逝世,享年84岁
  • 女子1997年存入2万元定期,27年后利息只有4000多元!她将银行告上法庭,法官查明关键疑点
  • 知名机器人企业老总提议给自己发200万元固定月薪,被投资人“手撕”:这是在掏空公司
  • 特朗普:华盛顿特区已成为世界最危险城市之一
  • 甘肃省委常委会召开会议,全体与会同志向遇难同胞默哀
  • 中国驻墨尔本总领事馆通报塔州中国留学生被打伤案最新进展
  • 最高法重拳整治高利贷、砍头息,叫停银行“随意抽断贷”行为
  • 中国留学生被当地五名未成年人殴打致重伤,驻墨尔本总领事馆通报最新进展
  • 甘肃榆中受灾区域80%已恢复供电,15名伤员已送医治疗
  • 餐饮店使用草酸清洗龙虾,南京公布4起涉及食品安全案例
  • 千岛群岛以东海域发生6.0级地震,震源深度10千米
  • 2025世界机器人大会观察:机器人越来越强,集体“找活干”
  • 小米汽车在丢掉消费者信任吗?
  • 伊朗处决一名核科学家!他被指是以色列间谍,因泄露伊核机密被判死刑
  • 50年来,共有197个批次超过2000名中国医护人员驰援摩洛哥——“中国医疗队是摩中友谊的使者”(新时代中非合作)
  • 6岁女童殒命酒店水上乐园,夺命14分钟:母亲拼尽全力却无能为力……
  • 法治课|法律是如何界定网暴的?与正常的批评、维权有何区别?
  • 泽连斯基与欧洲三国领导人通电话,讨论结束俄乌冲突等问题
  • 柯文哲:告诉赖清德,我绝不投降
  • 美俄往事:那些起起伏伏的“顶峰相见”
  • 靴子落地,宁德时代枧下窝采矿端确定停产!相关人士:短期未有复产计划
  • 加沙地带媒体办公室:以方蓄意制造混乱致援助物资被抢
  • 何以中国|中新网评:以六百年和合水韵,成世界之津,答时代之问
  • 事关存钱取钱!超过5万元或将全面尽调
  • 韩再芬带着新剧《延年和乔年》来到上海,黄梅戏演绎安庆子弟
  • 又有个股,被外资买到“限购”
  • 中超争冠悬念回归!上海德比海港击败申花,积分仅落后1分
  • 何以中国丨天津:从百年风华到科创未来
  • 巴勒斯坦,会亡国么?
  • 甘肃榆中县95%灾毁道路已恢复通行
  • 华裔女子在澳洲出车祸交了天价保释金?确获保释,但保释金信息未披露
  • 广西北海被雷击的比亚迪宋PLUSEV车况首次曝光
  • 万岁山NPC被游客锁喉抢银票,景区回应:及时制止,NPC身体无碍
  • 24岁中国男子落地柬埔寨数小时内身亡,监控曝光:被绑架带往网赌园区
  • 大河奔涌万象新丨陕西韩城:以金文铭刻唤醒尘封千年的“芮国记忆”
  • 女子逆行与骑车小伙发生剐蹭,小伙只回答“我听交警的!”
  • 包头通报人才引进问题调查处理结果:讲师团主要负责人被免职
  • 【文物里的抗战记忆】小纺车背后的延安大生产运动
  • 盐城市政府秘书长徐宁建被查,9个月内已有多名建湖县委原常委被查
  • 北京新政执行首日:购房者高温下看房,房企火速营销抢客
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码