GPT-5登场!OpenAI奥特曼:幻觉大幅降低,已从大学生变博士级专家

音符科技网

千呼万唤始出来,GPT-5终登场。

8月8日,人工智能(AI)巨头OpenAI正式推出GPT-5。OpenAI CEO山姆·奥特曼(Sam Altman)称之为“进化”,“比任何以往的AI都更实用、更聪明、更迅捷、更人性化。”

山姆·奥特曼正式发布GPT-5

奥特曼用三个身份类比了OpenAI的三代模型:GPT-3像是高中生,偶有灵光闪现但常伴挫败感;GPT-4像大学生,具备真实智慧与实用价值;GPT-5则如同按需召唤各领域的博士级专家,随时助力达成目标。

奥特曼表示,GPT-5是OpenAI通往通用人工智能(AGI)道路的重要里程碑。

根据发布会所展示的,GPT-5在编程、数理逻辑、文本创作、健康咨询及视觉感知等多维度,整体智能水平相较前代产品实现跃升。

健康医疗领域,GPT-5可以通过动态适应用户背景、知识储备及地域特征,其提供的健康指导精准度与可靠性达到全新高度;文本创作能力也迎来提升,模型可将抽象概念转化为兼具文学性、情感共鸣与韵律节奏的优质内容;编程方面提升更大,刷新了OpenAI历代模型纪录,尤其在复杂前端架构生成与大型代码库调试环节表现突出。

GPT-5还推出了mini、nano以及pro版本

具体来看,GPT-5有几大突出亮点。

首先是幻觉显著降低。在启用网页搜索时,GPT-5响应的事实错误率较GPT-4o降低约45%;深度思考模式下,错误率较OpenAI o3降低近80%。

GPT-5在奉承和谄媚等方面也有了很大改善,回答的亲切感有所减弱,不必要的表情符号也更少。OpenAI表示,与其说是“与AI对话”,不如说更像是在与一位拥有博士级智力水平的朋友聊天。同时,GPT-5还引入了批判者(Cynic)、分析者(Robot)、倾听者(Listener)和书呆子(Nerd)四种“人格”供用户自由选择

同时,深度思考模式下也能更诚实地向用户传达其操作和能力了。GPT-5在处理不可能完成、具体要求不明确或缺少关键工具的任务时,不会为了获得高额奖励,“谎报”自己成功完成了任务或者对不确定的答案过于自信,而是更准确地识别任务无法完成的情况,并清晰地传达局限性。

GPT-5相较OpenAI o3幻觉显著降低

据OpenAI介绍,团队在GPT-5中引入了一种全新的安全训练形式——安全补全(safe completions),让模型在安全界限内尽可能给出最有帮助的答案,也就是部分回答用户的问题,或只提供高水平的回答。如果模型需要拒绝,GPT-5会经过训练,以透明的方式告知拒绝原因,并提供安全的合规替代方案。

GPT-5将取代GPT-4o、OpenAI o3、GPT-4.5等一系列旧模型,变成ChatGPT所有用户的默认模型。OpenAI还专门开发了一个路由系统,可以根据对话类型、复杂度、工具需求以及用户的明确意图(例如如果提示词中说到“认真思考一下”)自动切换版本,路由系统会根据真实信号持续训练,包括用户切换模型的时间、响应偏好率以及测量的正确率,并不断改进。

目前Plus、Pro、团队和免费用户均已接入,企业版与教育版用户预计将在一周内覆盖,免费用户将在数天内完成覆盖。

同时,Plus用户可在基础版GPT-5与具备深度推理能力的版本间切换,日常使用次数将多于免费用户;Pro用户则通过设置保留访问历史模型的权限,同时享有无 *** GPT-5使用权及专属的GPT-5 Pro(专为高复杂度任务优化)入口;而免费用户在达到限额后,系统将自动切换至轻量化版本GPT-5 mini。

token定价方面,GPT-5为每百万输入token 1.25美元,每百万输出token 10美元,mini与nano版本价格较低。

GPT-5三版本API定价公布

根据近日OpenAI披露的数据,目前每周约有7亿人在使用ChatGPT。OpenAI此前预计今年营收将增加两倍以上,达127亿美元,明年将增长一倍以上,达294亿美元。

8月初,OpenAI由软银领投的400亿美元融资确定,公司估值达到约3000亿美元。据媒体报道,OpenAI目前正就一项可能的员工股票二次出售事宜进行谈判,公司估值有望达到约5000亿美元。

值得一提的是,奥特曼在发布会后又发文表示:“我们完全有能力发布更强大的模型(未来也必将发布),但GPT-5的特殊价值在于——全球超过十亿人将因此受益”。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 尔玛部分美国门店销售额增长4.8% CEO称每周都能感到成本增加
  • 收盘:美股收跌标普指数五连阴 市场聚焦财报与美联储年会
  • 纽约汇市:彭博美元指数上涨 受PMI数据和联储官员讲话提振
  • 派拉蒙Skydance尾盘大涨13.8%
  • 科蒂尾盘股价暴跌21.5%,业绩欠佳且财测疲软
  • 周四国际油价收高 受需求强劲迹象和俄乌和谈不确定性提振
  • 尾盘:标普500指数可能录得五连跌
  • “现在这种忙法,忙得充实”(在现场·看作风)
  • 特朗普称俄乌问题“约两周后就能知道结果”
  • 以总理指示立即启动加沙停火谈判
  • 浙江宁波一厂房发生火灾:消防正在扑救,暂无人员伤亡
  • 民主党正调查派拉蒙与天舞传媒的合并交易 质疑是否屈从特朗普的“非法要求”
  • 美国司法部拟调查美联储理事库克 敦促鲍威尔将其免职
  • 欧洲股市涨势暂歇 投资者权衡经济数据和政策前景
  • 中央代表团在拉萨看望慰问各族干部群众,王沪宁参加活动
  • 辽宁沈阳发生龙卷风,6人受轻微伤
  • 特朗普表示大约两周后可以知道乌克兰能否实现和平
  • 美国政府启动对风力涡轮机调查 或为加征更多关税铺路
  • 欧盟承诺继续争取葡萄酒和烈酒获得美国关税减免
  • 解难题出实招,让农民工有活干有钱赚(农民工稳岗就业在行动)
  • 欧美商定后续关税举措以重塑贸易关系 涵盖汽车、钢铝等方方面面
  • 纽约上诉法院认定特朗普违法 但撤销4.64亿美元的欺诈罚款
  • 分析师:杰克逊霍尔年会将吹响美债收益率上行号角
  • 以总理:即使哈马斯同意停火协议,以色列仍将接管加沙
  • 形成全产业链,年产值超七十五亿元——你的毛绒玩具,可能来自秦巴山区
  • 特朗普:在虚假的纽约州总检察长案件中取得彻底胜利
  • 智利财政部长Mario Marcel辞职 政府失去最市场友好的官员
  • 亚特兰大联储行长:仍预计年内降息一次 关注劳动力市场
  • 美国司法部计划对美联储理事库克展开调查
  • “北溪”爆炸事件一嫌疑人在意大利被捕
  • 午盘:美股走低道指跌逾200点 沃尔玛下跌4.5%
  • 记者手记:这本笔记本,写满西藏人民的祝福与期盼
  • 欧洲主要股指收盘涨跌不一,欧洲斯托克50指数跌0.17%
  • 克利夫兰联储行长Hammack:如果明天就举行决策会议 不会支持降息
  • 广西南宁市新发现4例基孔肯雅热病例
  • 言短意长|院士增选,颜宁可以推荐同门师兄柴继杰吗
  • 美国司法部将调查美联储理事库克 敦促鲍威尔将其免职
  • 美国制造业活动扩张速度为2022年以来最快 受需求提振
  • 外汇市场8月波动反常低迷 交易员静候美联储信号
  • 以色列总理将与军方高官就接管加沙城进行安全磋商
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码