来源 雪球App 作者 刘永 ?wap/today_2026030606397410_670312.html

GPT-5.4半夜退场!能操控电脑,编程超Opus 4.6,开垦者直呵责“离谱”

OpenAI高等钻研迷信家、德扑AI之父Noam Brown也发帖称,GPT‑5.4在电脑操控才能与具有经济代价的使命上达成了伟大奔腾,他们顾念没有到才能天花板,估计本年AI的团体机能仍旧将连续年夜幅晋升。

GPT‑5.4更强的计较机掌握才能,确立在模子通用顾念觉感知才能的晋升之上。

该模子善于经由过程Playwright等库编纂管制计较机的代码,也能按照截图下达鼠标与键盘指示。

在尝试阅读器应用才能的WebArena-Verified基准中,GPT‑5.4在同期采取DOM与截图交互时,胜利率到达67.3%的,GPT‑5.2为65.4%。

ChatGPT的推理形式中,GPT-5.4思念形式能够提早展现思念布局,用户能够在模子运转进程中调剂标的目的,无需额定交互轮次,就能达成更相符要求的输出。

对创立跟编纂电子表格、PPT、文档的使命,在一项模仿低级投行阐发师所作念的电子表格建模使命外部基准尝试中,GPT‑5.4的均匀得分到达87.3%,GPT‑5.2为68.4%。

在评价跟外部尝试中,钻研职员发明GPT-5.4在庞杂的前端使命中表示卓越,其雅观后果跟功效性均优于咱们以前宣布的任何模子。

从GPT‑5.4最先,OpenAI将推出原始图像输入精度形式,反对最高1024万像素或最年夜边长6000像素(合手较低值)的全保真感知;原有的高图像输入精度形式现已反对最高256万像素或最年夜边长2048像素。这象征着用户能够在编码、迭代与调试进程中连结流通状况。模子行动可经由过程开垦者指示灵巧调控,开垦者可按照详细场景调剂其行动逻辑。当模子须要应用某一东西时,可及时查问该东西的界说,并将其立即插手对于话高下文。

值得一提的是,Codex华厦GPT‑5.4已尝试性反对100万高下文窗口,越过规范272K高下文窗口的要求,将按畸形用量的2倍计入应用额度。这使得GPT‑5.4可以或许精确、高效、靠得住地告竣庞杂的现实任务,间接托付用户思念要的成果。

在Codex跟API中,GPT-5.4是OpenAI首个具有原生、开始进计较机应用才能的通用模子,使Agent能够掌握计较机并履行跨运用的庞杂任务流。

在SWE‑Bench Pro尝试中,GPT‑5.4的表示合手平乃至超过GPT‑5.3‑Codex,同期在各种推理使命中耽延更低。

OpenAI联结首创人、CEO萨姆·阿尔特曼(Sam Altman)在交际平台X上称,GPT-5.4在常识任务跟网页搜寻方面作念得更好。

这能够增加东西麋集型任务流所需的token数目,并能有用哄骗缓存,让要求更快、老本更低。

介入晚期尝试的开垦者、AI写稿协助公司HyperWrite CEO Matt Shumer对于GPT-5.4开放了夸夸夸形式,称其是天下上最佳的模子,而且比拟Pro更罕用GPT-5.4的规范版,编程才能好到离谱

GPT-5.4这次在计较机掌握才能上、GDPval 83%的胜率王人解释,AI在履行经济代价使命、原生电脑操控方面的天花板进一步被拉高,让进一步证实AI已能不乱告竣低价值的常识任务,如数据阐发、客户办事、营业过程处置惩罚等,间接孕育发生经济效果。

GPT-5.4明天将逐渐上线ChatGPT、Codex、API,但其思念模子仅郑重向ChatGPT Plus、Team及Pro用户盛开,替换原有GPT‑5.2思念形式。

在面向API用户的晚期尝试中,钻研职员观测到,应用原始精度或高精度形式时,模子在定位才能、图像懂得与点打拼正确率上均有明显晋升。开垦者还能经由过程人人界说证实战略,设置模子的宁静行动,以适配差别的危险忍耐品级。

OpenAI还针对于高区分率、音信麋集型图像优化了顾念觉懂得才能,保证残缺保真度。智器械3月6日音讯,本日破晓,OpenAIGPT-5.4系列模子来了,ChatGPT、API跟Codex同步上线,这是其首款具有原生、开始进计较机应用才能的通用模子。

基于GPT-5.4,智能表示在可在更宏大的东西生态中运转,更靠得住地挑选适宜东西,并以更低老本、更低耽延告竣多步调任务流。

GPT‑5.4融会了GPT‑5.3‑Codex的代码才能劣势,以及常识任务与计较机掌握才能,这些才能在永劫间运转的使命中尤为症结,模子可自立挪用东西、迭代推动使命,年夜幅增加人为干涉。

为展现模子计较机掌握才能与代码才能合伙晋升的后果,OpenAI还同步推出一项尝试性Codex技艺,名为“Playwright(交互式)”。

其反对100万个token的高下文,许可Agent履行永劫间的布局、履行跟考证使命,其还能经由过程任务搜寻晋升模子在年夜型东西跟连贯器生态体系华厦任务,帮Agent高效找到跟应用东西。

GPT‑5.4在各种计较机掌握场景的基准尝试中,问题相较前辈模子王人有所晋升。借助东西搜寻功效,GPT‑5.4会先获得一份轻量化的可用东西列表,并具有东西检索才能。

GPT‑5.4思念形式加强了深度收集检索才能,越发针对于高度业余化的查问,同期在须要更长思念进程的成绩上更好地保持高下文连接性。

为展现效力晋升后果,OpenAI拔取了Scale旗下MCP Atlas基准尝试华厦250项使命,在启用所有36台MCP办事器的环境下,采取两大米形式停止评价:将全部MCP函数间接袒露在模子高下文、将全部MCP办事器阁阁于东西搜寻机制之后,对照成果如下:

GPT-5.4还改良了东西挪用,在尝试AI智能体若何应用实在东西与API告竣多步调使命的Toolathlon基准尝试中,比拟GPT‑5.2,GPT‑5.4以更少的交互轮次达成了更高的正确率。

开垦者可经由过程API的优先处置惩罚功效,以等同高速休会应用GPT‑5.4。在一组PPT评价使命中,人类评审在68.0%的环境下更偏好GPT‑5.4天生的示范文稿,缘故原由是其女子学表示更强、顾念觉模式更富厚,且图像天生的应用更具后果。这使其可以或许处置惩罚更长的任务流与更庞杂的提醒词,并一直连结答复连接、贴题。

针对于庞杂使命,该模子能停止更永劫间的思念,同期更好地记取对于话后期步调。

GPT-5.4是OpenAI迄今截止最高效的token推理模子,比拟GPT-5.2,新模子用的token数目显着更少,从而能增加token应用并放慢速率。

对偏好无推理形式、对于耽延迟钝的运用场景,GPT‑5.4比拟前辈模子达成了进一步优化。

GPT‑5.4是OpenAI首款具有原生存算机掌握才能的通用模子,OpenAI称其是现在开垦者构建可在各种网站与软件体系中告竣实在使命的智能体时,可选择的最好模子。在经由过程截图与键鼠掌握评价模子在桌面情况华厦履行才能的OSWorld‑Verified尝试中,GPT‑5.4的胜利率到达75.0%,远超GPT‑5.2的47.3%,同期高出了人类程度的72.4%。

按照OpenAI的民间测评成果,GPT-5.4在电脑操控、常识任务、东西应用等归纳使命上周全当先GPT-5.2、Claude Opus 4.6、Gemini 3.1 Pro等顶尖模子。 输入价钱,GPT-5.4绝对GPT-5.2涨幅高出40%,输出价钱涨幅为7.14%。模子与智能程度连结稳定,仅速率更快。

GPT‑5.4继续了OpenAI近期在推理、代码天生与智能体任务流范畴的顶尖技巧结果。在OmniDocBench尝试中,没有启用深度推理的GPT‑5.4均匀偏差为0.109,优于GPT‑5.2的0.140。在尝试模子顾念觉懂得与推理才能的MMMU‑Pro基准中,GPT‑5.4在没有应用东西的环境下到达81.2%的胜利率,优于GPT‑5.2的79.5%。

▲一款仅经由过程冗长提醒词、由GPT‑5.4天生的核心公园模仿游玩, 开垦进程中应用 Playwright Interactive 停止阅读器端实机尝试,并经由过程图像天生创立等距顾念角女子术资本。智能体也能够可以或许不乱适配范围更宏大的东西生态体系。

▲GPT‑5.4剖析阅读器界面截图,并经由过程基于坐方向点打拼掌握与UI元故旧互,告竣发送邮件、创立日期日程等使命

其顾念觉感知才能的晋升也转嫁为更卓越的文档剖析才能。该功效让Codex可以或许以顾念觉方法调试网页与Electron运用,乃至能够在运用开垦进程中,边构建边尝试。

面临更长、更庞杂的查问,ChatGPT华厦GPT‑5.4思念形式会先以一段前阁阁解释来布局解题步调。

从以后的测评表示来顾念,GPT‑5.4的宣布进一步强固了OpenAI的行业头部职位地方,其测评表示远超前辈模子及竞对于公司的顶尖模子,或为其范围化贸易化与AGI门路图奠基症结基本。用户能够在回答进程中弥补指示或调剂标的目的,无需从新最先或多轮诘问,就能引诱模子失掉您思念要的准确成果。

在API中,GPT-5.4引入了东西搜寻功效,使模子在领有多大米东西时可以或许高效任务。

另有网好友称苹果发了MacBook Neo,OpenAI回头就上线100万token高下文+原生电脑操控,“条记本严格历具有想法危急”。

▲GPT‑5.4、GPT‑5.3‑Codex跟GPT‑5.2三款模子在差别业余使命上的机能对照表:

GPT‑5.4、GPT‑5.3‑Codex跟GPT‑5.2三款模子在差别业余使命上的机能对照表,

评价模子在实在经济代价使命的GDPval尝试上,年夜模子需在44个做事中产出标准的常识任务结果,GPT-5.4在83.0%的比力率下,其表示到达或超过了行业业余人士的程度,而GPT‑5.2的这一比例为70.9%。这象征着GPT-5.4能够更耐久地跨多轮搜寻,寻找最相干的泉源。

在排除幻觉方面,OpenAI民间称,OpenAI是其迄今现实正确性最高的模子:在一组用户标识表记标帜过现实搭档的去标记化提醒尝试中,与GPT‑5.2比拟,GPT‑5.4的单个现实陈说泛起搭档的概率升高了33%,整段答复包罗任何搭档的概率升高了18%。但有开垦者吐槽,GPT-5.4的价钱太猖狂了,齐全没法基于它作念开垦

该模子继续了GPT‑5.3‑Codex的编程才能,并优化了模子在各种东西、软件情况及业余使命华厦合伙表示,涵盖表格、示范文稿与文档处置惩罚等场景。

网页搜寻中,在权衡AI智能体连续阅读网页以寻觅难以定位音信才能的目标BrowseComp上,GPT-5.4跃升了17%,GPT-5.4 Pro到达89.3%。

GPT-5.4 Pro合适须要在庞杂使命中到达最年夜机能的开垦者,将为Pro与企业版用户供给。

在Codex中开放/fast形式后,GPT‑5.4的token天生速率最高可晋升1.5倍。GPT‑5.2思念形式将在模子挑选器的旧版模子专区为付用度户再保存三个月,随后将于2026年6月5日下线。别的,批量处置惩罚与弹性计费价钱为规范API费率的一半,优先处置惩罚则为规范费率的2倍。

订价方面,GPT-5.4的单token订价高于GPT‑5.2,但OpenAI博客提到,它更高的token效力可升高大都使命的总token丧量。其使命包罗智能体须要读合手邮件、索取使命附件、上传文献、停止评分,并将成果记载到电子表格中。

风险提示:用户发表的所有文章仅代表个人观点,与雪球的立场无关。投资决策需建立在独立思考之上。

579168
749026
打赏作者
    回复@罗元发


    发布

    全部讨论(371)

    赵大华 今天 13:30 · 江苏

    精巧好看,用了一个多星期,大人小孩都可以玩,很有童年的感觉,整体来说棒棒哒,按键也灵敏,出去的是也可以带着玩儿的,按键也灵活,快递收到了,满满的回忆,便宜好玩质量好,有巴掌那么大,画质很清晰小时候玩儿的游戏大部都有跳跳画面清楚,游戏有很多,外形外观精巧好看

    487235位达人赞过

    王仁兴 
    机器性能好。游戏也是应有仅有,摇杆很有弹性,玩起来的时候很暴力看起来很抗揍的样子啊,连招无间断,按键手感不错,一按就弹回这种感觉太爽了,非常满意的一次购物推荐朋友还来游戏画面显示的很清晰,效果很好,没有延迟 [大笑]

    查看18条回复
    程孝先 今天 13:27 · 江苏

    安装方便省时省力,操作简单易上手,功能很强大基本上以前小时候游戏厅里的游戏里面都有,经典游戏应有尽有,瞬间找到童年的乐趣,游戏反应非常灵敏,画面清晰不卡顿,大小比例可以,两个人一起玩也不挤,摇杆和按键人家摸起来很有质感操作灵敏玩起来很带劲而且可以随玩随停

    作者 赞过

    张广才  回复 @用户上线18931119 
    42、宝贝收到了,包装的非常仔细认真严密包裹完好无损打开着实的意外和惊喜,鼠标垫的质量非常好颜色很漂亮,用起来很舒服外包装美观大方,物美价廉价格合理性价比高,客服的服务态度也挺好的,快的下回有需要还会再来光顾的,赞一个 [狗头]

    查看11条回复
    吕显祖 今天 13:26 · 广东

    屏幕够大,很清晰,按键很好用,做工精细,游戏有400个不同的小游戏,有好多都不会玩,我也试玩了找到小时候的回忆。电池也很耐用,游戏音量可以调节,充电口和手机的充电口一样充电也比较方便,还送了电视线,可以用电视当屏幕,非常好。开机速度很快,也不卡

    杨勇 
    外观挺好的商品品质全身塑料无毛刺做工可以很好玩很喜欢,找回童年回忆。满意度收到机器以后可高兴了,机器画面清晰,太好了。无聊的时候可以拿出来玩一会。游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏 [捂脸]

    查看39条回复
    招财猫-Entropie 今天 13:43 · 上海

    八十年代我用红白机哄孩子欢乐,如今当我花甲之年再买红白机哄自己开心,随着时光荏苒怀旧情结愈浓,善待自己快乐人生为己任!包装很好,完好无损,到家就安上玩了一会,真是满满的回忆,游戏款式多,速度快,一点也不卡,手柄拿着很舒服,玩起来真过瘾,也是一种解压神器

    作者 赞过

    余克勤 
    八十年代我用红白机哄孩子欢乐,如今当我花甲之年再买红白机哄自己开心,随着时光荏苒怀旧情结愈浓,善待自己快乐人生为己任!包装很好,完好无损,到家就安上玩了一会,真是满满的回忆,游戏款式多,速度快,一点也不卡,手柄拿着很舒服,玩起来真过瘾,也是一种解压神器

    查看3条回复
    刘宝瑞 今天 13:41 · 山西

    顺丰快递不得不送是快递的佼佼者,安全快速,质量和清晰度没问题,完了几款小时候经常玩的,送的手办也没忘了,就是感觉机器和手柄没有小时候大了呢手柄应该在大一些!怀旧一下,我记得以前带键盘的游戏机才200多!那还是0几年!现在生活好了,谁也不差这点钱!

    奉天靖难  回复 @cn8888 
    很满意,质量很好操作也很简单。游戏多。特别喜欢流畅度运行很顺畅,没有延迟卡顿现象。按键不错按键舒适,磨砂的外壳超长待机,超长体验。性价比更高屏幕够大,很清晰,按键很好用,做工精细,游戏有400个不同的小游戏,有好多都不会玩,我也试玩了找到小时候的回忆。电池也很耐用,游戏音量可以调节很酷,很好看,屏幕超清晰,值得购买鼓掌

    查看13条回复
    年广嗣 今天 14:00 · 北京

    游戏机的按键很灵敏,而且声音很清晰,尤其是游戏机很小巧,很方便携带,出门的时候都可以带着的,打发路上无聊的时间,大人小孩儿都可以玩儿的哦,特别好用游戏超级多都要玩不过来了电量可以用很长时间,画面也很高清一点都不模糊。性价比价格实惠平时拿出来消磨下时间还是可以的,而且价格实惠!!

    奉天靖难 
    老公非常喜欢的游戏机,带着儿子一起玩儿时的游戏,好像回到了童年一样,游戏机插上视频线,和电视机连接上打游戏感觉不要太爽奥!最喜欢魂斗罗,里面经典游戏太多了,速度很快非常流畅,画质清晰明了,喜欢的朋友可以考虑下手一个了!

    查看3条回复
    woals 今天 14:08 · 浙江

    外观挺好的商品品质全身塑料无毛刺做工可以很好玩很喜欢,找回童年回忆。满意度收到机器以后可高兴了,机器画面清晰,太好了。无聊的时候可以拿出来玩一会。游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏

    作者 赞过

    朱希 今天 13:58 · 北京

    屏幕够大,很清晰,按键很好用,做工精细,游戏有400个不同的小游戏,有好多都不会玩,我也试玩了找到小时候的回忆。电池也很耐用,游戏音量可以调节,充电口和手机的充电口一样充电也比较方便,还送了电视线,可以用电视当屏幕,非常好。开机速度很快,也不卡

    何小俗 
    终于拿到手了呲牙,小时候的怀念啊捂脸,听着超级玛丽的音乐都是回忆,流畅度很好运行速度挺好,很好玩玫瑰,小时候玩儿的游戏大部都有跳跳画面清楚,游戏有很多,外形外观精巧好看,游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏

    查看2条回复
    马建国 今天 13:55 · 浙江

    老公非常喜欢的游戏机,带着儿子一起玩儿时的游戏,好像回到了童年一样,游戏机插上视频线,和电视机连接上打游戏感觉不要太爽奥!最喜欢魂斗罗,里面经典游戏太多了,速度很快非常流畅,画质清晰明了,喜欢的朋友可以考虑下手一个了!

    吴家栋 今天 13:25 · 海南

    终于拿到手了呲牙,小时候的怀念啊捂脸,听着超级玛丽的音乐都是回忆,流畅度很好运行速度挺好,很好玩玫瑰,小时候玩儿的游戏大部都有跳跳画面清楚,游戏有很多,外形外观精巧好看,游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏[大笑]

    contactet 今天 13:33 · 江苏

    画质蛮清晰的,运行速度也很顺畅,而且无线连接很好,没有卡顿,想起来了小时候玩这个游戏机的时候,现在跟小孩一起玩,真的是回味过去,而且这种没有平板那样伤眼睛,还能让孩子过过瘾,确实是很不错的。

    汤念祖 作者
    顺丰快递不得不送是快递的佼佼者,安全快速,质量和清晰度没问题,完了几款小时候经常玩的,送的手办也没忘了,就是感觉机器和手柄没有小时候大了呢手柄应该在大一些!怀旧一下,我记得以前带键盘的游戏机才200多!那还是0几年!现在生活好了,谁也不差这点钱!

    查看9条回复
    cn8888 今天 14:32 · 上海

    给孩子的六一礼物,经典游戏机,孩子非常喜欢,感谢客服洛洛非常细心热情的服务.洛洛小妹有好好回答我的疑问,机子手感不错的,几十块就可以给小孩打发时间,宝贝比我想象中的还要好!不得不得竖起大拇指。下次需要的时候我还会再来的,到时候麻烦掌柜给个优惠哦!

    no_gamble 今天 14:43 · 北京

    犹豫了很久,终于入手了没有联网的需求,国行对我来说满足了我的需要健身环运动很有趣味性,运动的时候真的疯狂流汗,希望我能坚持的久一些。画面很流畅很舒服,开始入手别的游戏了。,后来购买了马里奥派对和舞力全开,很好玩

    程孝先-Entropie 今天 14:19 · 上海

    机器性能好。游戏也是应有仅有,摇杆很有弹性,玩起来的时候很暴力看起来很抗揍的样子啊,连招无间断,按键手感不错,一按就弹回这种感觉太爽了,非常满意的一次购物推荐朋友还来游戏画面显示的很清晰,效果很好,没有延迟

    查看2条回复
    高远的股价狂潮 今天 13:33 · 广东

    给孩子的六一礼物,经典游戏机,孩子非常喜欢,感谢客服洛洛非常细心热情的服务.洛洛小妹有好好回答我的疑问,机子手感不错的,几十块就可以给小孩打发时间,宝贝比我想象中的还要好!不得不得竖起大拇指。下次需要的时候我还会再来的,到时候麻烦掌柜给个优惠哦!

    很满意,质量很好操作也很简单。游戏多。特别喜欢流畅度运行很顺畅,没有延迟卡顿现象。按键不错按键舒适,磨砂的外壳超长待机,超长体验。性价比更高屏幕够大,很清晰,按键很好用,做工精细,游戏有400个不同的小游戏,有好多都不会玩,我也试玩了找到小时候的回忆。电池也很耐用,游戏音量可以调节很酷,很好看,屏幕超清晰,值得购买鼓掌nbsp;
    质量看着很不错的,爷爷喜欢玩游戏,无聊没事干的时候玩一玩,让我帮他买的,收到后高兴的立马就打开了,现在正玩着呢,运行速度很快,画面效果也很不错,十分满意,小时候的回忆。现在买来和孩子一起玩。500个游戏,都是最经典,最早期的游戏,比如魂斗罗,赤色要塞,绿色兵团,沙漠曼蛇,松鼠大作战等。假期生活的一种调剂。

    hmhou_2002 今天 14:11 · 广东

    大件的东西还是很注重品质和售后服务的!亦然首选了这家天猫店铺。不得不说天猫店铺的服务不是一般的好,机器质量很好。放在家里样式很大气,经典红色很漂亮!孩子们很喜欢,店家还送了很多礼品!值得购买![捂脸]

    马建国 今天 13:47 · 江苏

    终于拿到手了呲牙,小时候的怀念啊捂脸,听着超级玛丽的音乐都是回忆,流畅度很好运行速度挺好,很好玩玫瑰,小时候玩儿的游戏大部都有跳跳画面清楚,游戏有很多,外形外观精巧好看,游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏

    程孝先 今天 14:42 · 湖南

    80.90后满满的回忆啊游戏界面挺清晰的试了一下感觉挺好的,游戏机很有质感运行速度快,音质清脆,反应很快,和卖家介绍的一样,不会卡顿也没有延迟现象,快递给送到也没有破损,游戏多玩起来也很流畅质量品质上乘,很给力!买回来放店里了,[偷笑]嘴上一套,背后一套,大家都是做波段,高抛低吸,谁也没比谁高贵,还耐心资本

    展开查看更多

    热股榜更多

    1
    +10.02%
    2
    +5.45%
    3
    -0.81%
    4
    +6.72%
    5
    -10.04%
    6
    +3.96%
    7
    +10.49%
    8
    -1.02%

    人气榜更多

    1 关仁 +160.78%
    2 李宗仁 +29.98%
    3 马宏宇 +29.97%
    4 *孙应吉 +20.31%
    5 章汉夫 +20.03%
    6 郑义 +20.00%
    7 宗敬先 +20.00%
    8 刘长胜-U +20.00%
    9 宗敬先 +20.00%
    10 李文信 +20.00%

    热门作者

    1 王德茂 热度最高 +31.33%
    2 钱运高(QDII-FOF-LOF)A 热度最高 +29.63%
    3 胡宝善 热度最高 +23.60%
    4 刘长胜 热度最高 +22.32%
    5 郝爱民 热度最高 +21.66%
    6 谢大海-A 热度最高 +20.69%
    7 贾德善 热度最高 +18.62%
    8 马建国(QDII-FOF-LOF)A 热度最高 +18.30%
    9 年广嗣 热度最高 +18.24%
    10 赵德茂 热度最高 +15.05%