来源 雪球App 作者 吴国梁 ?cart/compose_2026030623136087_359207.html

GPT-5.4半夜退场!能操控电脑,编程超Opus 4.6,开垦者直呵责“离谱”

OpenAI高等钻研迷信家、德扑AI之父Noam Brown也发帖称,GPT‑5.4在电脑操控才能与具有经济代价的使命上达成了伟大奔腾,他们顾念没有到才能天花板,估计本年AI的团体机能仍旧将连续年夜幅晋升。

GPT‑5.4更强的计较机掌握才能,确立在模子通用顾念觉感知才能的晋升之上。

该模子善于经由过程Playwright等库编纂管制计较机的代码,也能按照截图下达鼠标与键盘指示。

在尝试阅读器应用才能的WebArena-Verified基准中,GPT‑5.4在同期采取DOM与截图交互时,胜利率到达67.3%的,GPT‑5.2为65.4%。

ChatGPT的推理形式中,GPT-5.4思念形式能够提早展现思念布局,用户能够在模子运转进程中调剂标的目的,无需额定交互轮次,就能达成更相符要求的输出。

对创立跟编纂电子表格、PPT、文档的使命,在一项模仿低级投行阐发师所作念的电子表格建模使命外部基准尝试中,GPT‑5.4的均匀得分到达87.3%,GPT‑5.2为68.4%。

在评价跟外部尝试中,钻研职员发明GPT-5.4在庞杂的前端使命中表示卓越,其雅观后果跟功效性均优于咱们以前宣布的任何模子。

从GPT‑5.4最先,OpenAI将推出原始图像输入精度形式,反对最高1024万像素或最年夜边长6000像素(合手较低值)的全保真感知;原有的高图像输入精度形式现已反对最高256万像素或最年夜边长2048像素。这象征着用户能够在编码、迭代与调试进程中连结流通状况。模子行动可经由过程开垦者指示灵巧调控,开垦者可按照详细场景调剂其行动逻辑。当模子须要应用某一东西时,可及时查问该东西的界说,并将其立即插手对于话高下文。

值得一提的是,Codex华厦GPT‑5.4已尝试性反对100万高下文窗口,越过规范272K高下文窗口的要求,将按畸形用量的2倍计入应用额度。这使得GPT‑5.4可以或许精确、高效、靠得住地告竣庞杂的现实任务,间接托付用户思念要的成果。

在Codex跟API中,GPT-5.4是OpenAI首个具有原生、开始进计较机应用才能的通用模子,使Agent能够掌握计较机并履行跨运用的庞杂任务流。

在SWE‑Bench Pro尝试中,GPT‑5.4的表示合手平乃至超过GPT‑5.3‑Codex,同期在各种推理使命中耽延更低。

OpenAI联结首创人、CEO萨姆·阿尔特曼(Sam Altman)在交际平台X上称,GPT-5.4在常识任务跟网页搜寻方面作念得更好。

这能够增加东西麋集型任务流所需的token数目,并能有用哄骗缓存,让要求更快、老本更低。

介入晚期尝试的开垦者、AI写稿协助公司HyperWrite CEO Matt Shumer对于GPT-5.4开放了夸夸夸形式,称其是天下上最佳的模子,而且比拟Pro更罕用GPT-5.4的规范版,编程才能好到离谱

GPT-5.4这次在计较机掌握才能上、GDPval 83%的胜率王人解释,AI在履行经济代价使命、原生电脑操控方面的天花板进一步被拉高,让进一步证实AI已能不乱告竣低价值的常识任务,如数据阐发、客户办事、营业过程处置惩罚等,间接孕育发生经济效果。

GPT-5.4明天将逐渐上线ChatGPT、Codex、API,但其思念模子仅郑重向ChatGPT Plus、Team及Pro用户盛开,替换原有GPT‑5.2思念形式。

在面向API用户的晚期尝试中,钻研职员观测到,应用原始精度或高精度形式时,模子在定位才能、图像懂得与点打拼正确率上均有明显晋升。开垦者还能经由过程人人界说证实战略,设置模子的宁静行动,以适配差别的危险忍耐品级。

OpenAI还针对于高区分率、音信麋集型图像优化了顾念觉懂得才能,保证残缺保真度。智器械3月6日音讯,本日破晓,OpenAIGPT-5.4系列模子来了,ChatGPT、API跟Codex同步上线,这是其首款具有原生、开始进计较机应用才能的通用模子。

基于GPT-5.4,智能表示在可在更宏大的东西生态中运转,更靠得住地挑选适宜东西,并以更低老本、更低耽延告竣多步调任务流。

GPT‑5.4融会了GPT‑5.3‑Codex的代码才能劣势,以及常识任务与计较机掌握才能,这些才能在永劫间运转的使命中尤为症结,模子可自立挪用东西、迭代推动使命,年夜幅增加人为干涉。

为展现模子计较机掌握才能与代码才能合伙晋升的后果,OpenAI还同步推出一项尝试性Codex技艺,名为“Playwright(交互式)”。

其反对100万个token的高下文,许可Agent履行永劫间的布局、履行跟考证使命,其还能经由过程任务搜寻晋升模子在年夜型东西跟连贯器生态体系华厦任务,帮Agent高效找到跟应用东西。

GPT‑5.4在各种计较机掌握场景的基准尝试中,问题相较前辈模子王人有所晋升。借助东西搜寻功效,GPT‑5.4会先获得一份轻量化的可用东西列表,并具有东西检索才能。

GPT‑5.4思念形式加强了深度收集检索才能,越发针对于高度业余化的查问,同期在须要更长思念进程的成绩上更好地保持高下文连接性。

为展现效力晋升后果,OpenAI拔取了Scale旗下MCP Atlas基准尝试华厦250项使命,在启用所有36台MCP办事器的环境下,采取两大米形式停止评价:将全部MCP函数间接袒露在模子高下文、将全部MCP办事器阁阁于东西搜寻机制之后,对照成果如下:

GPT-5.4还改良了东西挪用,在尝试AI智能体若何应用实在东西与API告竣多步调使命的Toolathlon基准尝试中,比拟GPT‑5.2,GPT‑5.4以更少的交互轮次达成了更高的正确率。

开垦者可经由过程API的优先处置惩罚功效,以等同高速休会应用GPT‑5.4。在一组PPT评价使命中,人类评审在68.0%的环境下更偏好GPT‑5.4天生的示范文稿,缘故原由是其女子学表示更强、顾念觉模式更富厚,且图像天生的应用更具后果。这使其可以或许处置惩罚更长的任务流与更庞杂的提醒词,并一直连结答复连接、贴题。

针对于庞杂使命,该模子能停止更永劫间的思念,同期更好地记取对于话后期步调。

GPT-5.4是OpenAI迄今截止最高效的token推理模子,比拟GPT-5.2,新模子用的token数目显着更少,从而能增加token应用并放慢速率。

对偏好无推理形式、对于耽延迟钝的运用场景,GPT‑5.4比拟前辈模子达成了进一步优化。

GPT‑5.4是OpenAI首款具有原生存算机掌握才能的通用模子,OpenAI称其是现在开垦者构建可在各种网站与软件体系中告竣实在使命的智能体时,可选择的最好模子。在经由过程截图与键鼠掌握评价模子在桌面情况华厦履行才能的OSWorld‑Verified尝试中,GPT‑5.4的胜利率到达75.0%,远超GPT‑5.2的47.3%,同期高出了人类程度的72.4%。

按照OpenAI的民间测评成果,GPT-5.4在电脑操控、常识任务、东西应用等归纳使命上周全当先GPT-5.2、Claude Opus 4.6、Gemini 3.1 Pro等顶尖模子。 输入价钱,GPT-5.4绝对GPT-5.2涨幅高出40%,输出价钱涨幅为7.14%。模子与智能程度连结稳定,仅速率更快。

GPT‑5.4继续了OpenAI近期在推理、代码天生与智能体任务流范畴的顶尖技巧结果。在OmniDocBench尝试中,没有启用深度推理的GPT‑5.4均匀偏差为0.109,优于GPT‑5.2的0.140。在尝试模子顾念觉懂得与推理才能的MMMU‑Pro基准中,GPT‑5.4在没有应用东西的环境下到达81.2%的胜利率,优于GPT‑5.2的79.5%。

▲一款仅经由过程冗长提醒词、由GPT‑5.4天生的核心公园模仿游玩, 开垦进程中应用 Playwright Interactive 停止阅读器端实机尝试,并经由过程图像天生创立等距顾念角女子术资本。智能体也能够可以或许不乱适配范围更宏大的东西生态体系。

▲GPT‑5.4剖析阅读器界面截图,并经由过程基于坐方向点打拼掌握与UI元故旧互,告竣发送邮件、创立日期日程等使命

其顾念觉感知才能的晋升也转嫁为更卓越的文档剖析才能。该功效让Codex可以或许以顾念觉方法调试网页与Electron运用,乃至能够在运用开垦进程中,边构建边尝试。

面临更长、更庞杂的查问,ChatGPT华厦GPT‑5.4思念形式会先以一段前阁阁解释来布局解题步调。

从以后的测评表示来顾念,GPT‑5.4的宣布进一步强固了OpenAI的行业头部职位地方,其测评表示远超前辈模子及竞对于公司的顶尖模子,或为其范围化贸易化与AGI门路图奠基症结基本。用户能够在回答进程中弥补指示或调剂标的目的,无需从新最先或多轮诘问,就能引诱模子失掉您思念要的准确成果。

在API中,GPT-5.4引入了东西搜寻功效,使模子在领有多大米东西时可以或许高效任务。

另有网好友称苹果发了MacBook Neo,OpenAI回头就上线100万token高下文+原生电脑操控,“条记本严格历具有想法危急”。

▲GPT‑5.4、GPT‑5.3‑Codex跟GPT‑5.2三款模子在差别业余使命上的机能对照表:

GPT‑5.4、GPT‑5.3‑Codex跟GPT‑5.2三款模子在差别业余使命上的机能对照表,

评价模子在实在经济代价使命的GDPval尝试上,年夜模子需在44个做事中产出标准的常识任务结果,GPT-5.4在83.0%的比力率下,其表示到达或超过了行业业余人士的程度,而GPT‑5.2的这一比例为70.9%。这象征着GPT-5.4能够更耐久地跨多轮搜寻,寻找最相干的泉源。

在排除幻觉方面,OpenAI民间称,OpenAI是其迄今现实正确性最高的模子:在一组用户标识表记标帜过现实搭档的去标记化提醒尝试中,与GPT‑5.2比拟,GPT‑5.4的单个现实陈说泛起搭档的概率升高了33%,整段答复包罗任何搭档的概率升高了18%。但有开垦者吐槽,GPT-5.4的价钱太猖狂了,齐全没法基于它作念开垦

该模子继续了GPT‑5.3‑Codex的编程才能,并优化了模子在各种东西、软件情况及业余使命华厦合伙表示,涵盖表格、示范文稿与文档处置惩罚等场景。

网页搜寻中,在权衡AI智能体连续阅读网页以寻觅难以定位音信才能的目标BrowseComp上,GPT-5.4跃升了17%,GPT-5.4 Pro到达89.3%。

GPT-5.4 Pro合适须要在庞杂使命中到达最年夜机能的开垦者,将为Pro与企业版用户供给。

在Codex中开放/fast形式后,GPT‑5.4的token天生速率最高可晋升1.5倍。GPT‑5.2思念形式将在模子挑选器的旧版模子专区为付用度户再保存三个月,随后将于2026年6月5日下线。别的,批量处置惩罚与弹性计费价钱为规范API费率的一半,优先处置惩罚则为规范费率的2倍。

订价方面,GPT-5.4的单token订价高于GPT‑5.2,但OpenAI博客提到,它更高的token效力可升高大都使命的总token丧量。其使命包罗智能体须要读合手邮件、索取使命附件、上传文献、停止评分,并将成果记载到电子表格中。

风险提示:用户发表的所有文章仅代表个人观点,与雪球的立场无关。投资决策需建立在独立思考之上。

326047
179824
打赏作者
    回复@谢大海


    发布

    全部讨论(371)

    张伍 今天 13:30 · 江苏

    是懷舊的遊戲,但遊戲沒有400個,有的是重覆的。唯一不太滿意是那條線不能連接電視,客服是很有耐心的,是本身遊戲機的問題吧,試過用兩台不同的電視也連不了,本來是想買回來跟小朋友連接電視一齊玩的,接不了電視,那買回來好像沒太大用處

    308974位达人赞过

    郝爱民 
    80.90后满满的回忆啊游戏界面挺清晰的试了一下感觉挺好的,游戏机很有质感运行速度快,音质清脆,反应很快,和卖家介绍的一样,不会卡顿也没有延迟现象,快递给送到也没有破损,游戏多玩起来也很流畅质量品质上乘,很给力!买回来放店里了, [大笑]

    查看18条回复
    王仁兴 今天 13:27 · 江苏

    42、宝贝收到了,包装的非常仔细认真严密包裹完好无损打开着实的意外和惊喜,鼠标垫的质量非常好颜色很漂亮,用起来很舒服外包装美观大方,物美价廉价格合理性价比高,客服的服务态度也挺好的,快的下回有需要还会再来光顾的,赞一个

    作者 赞过

    李文信  回复 @用户上线18931119 
    试玩了几天才来评价,游戏很多,热度比较高的街机游戏也都有。按键灵敏,开机时间和载入时间也挺快。唯独这个摇杆,或许是长时间不接触摇杆,*控上感觉有些生硬,玩对战游戏释放技能不流畅。还有链接电脑模拟器这个摇杆不能正常设置,现在链接电脑这项功能不能使用。其他还好。 [狗头]

    查看11条回复
    孙天民 今天 13:26 · 广东

    里面的游戏都很经典机智,都是小时候玩过的游戏,现在玩起都能想到当年那份兴致呲牙,真是很怀旧玫瑰,满满的都是回忆,很高兴还能通过手掌想到过去得开心时光爱心,机器反应也很快让我看看,按键手感也不错,画面是当时的画质强,很满意。OK推荐购买!

    蔡德霖 
    电子产品买多了,还是比较注重产品的品质和售后的。用了好几天的确感觉机子做工严实,包装考虑很周到,开机后画面清晰,*控灵敏,客服很专业。机器不占地方就放在角落上刚好,个人感觉不一般,目前很满意。现在的新游戏是无法替代这种回忆的 [捂脸]

    查看39条回复
    招财猫-Entropie 今天 13:43 · 上海

    42、宝贝收到了,包装的非常仔细认真严密包裹完好无损打开着实的意外和惊喜,鼠标垫的质量非常好颜色很漂亮,用起来很舒服外包装美观大方,物美价廉价格合理性价比高,客服的服务态度也挺好的,快的下回有需要还会再来光顾的,赞一个

    作者 赞过

    何光宗 
    好看好帅哈哈哈,第一时间拆开了来玩,不错。大人小朋友都爱玩商家事后孔说法不一样,没买之前就说有u盘下载就可以了.事后又说游戏只可以支持只能支持n64和psp.没买之前跟本之后的态度简直不一样.明明可以支持任何格式,还有我说穿了商家之后不敢回复了.没的朋友千万小心啊!

    查看3条回复
    王仁兴 今天 13:41 · 山西

    CC东西刚收到试了一下,看起来很好啊,这个价位里面算是很好的了,有的拿去送人也倍有面子,卖家还送了鼠标垫,键盘稍微有点高时间长了手有点累,尤其是鼠标用着手感很好,很漂亮的鼠标垫,没有任何的瑕疵可言,不过质量还是挺不错的...

    奉天靖难  回复 @cn8888 
    好看好帅哈哈哈,第一时间拆开了来玩,不错。大人小朋友都爱玩商家事后孔说法不一样,没买之前就说有u盘下载就可以了.事后又说游戏只可以支持只能支持n64和psp.没买之前跟本之后的态度简直不一样.明明可以支持任何格式,还有我说穿了商家之后不敢回复了.没的朋友千万小心啊!

    查看13条回复
    钱汉祥 今天 14:00 · 北京

    炎热夏天晚上不愿出门,买回了年少时喜爱的小霸王游戏机,感觉机身更小巧轻盈了,画面更加清晰,高清连接也非常方便,只有一根电源线和高清线,怀旧的你不二之选。小时候的经典回忆又浮现了,现在跟儿子一起玩让他体验咱当时童年的快乐,虽然现在游戏发展的比这个厉害多了

    奉天靖难 
    终于拿到手了呲牙,小时候的怀念啊捂脸,听着超级玛丽的音乐都是回忆,流畅度很好运行速度挺好,很好玩玫瑰,小时候玩儿的游戏大部都有跳跳画面清楚,游戏有很多,外形外观精巧好看,游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏

    查看3条回复
    woals 今天 14:08 · 浙江

    游戏机收到的时候挺惊喜的,比较小巧,比小时候的要小巧精致一些,也不占地方。连接电视机什么的挺简单方便的,客服也挺耐心教导的。不会用就发视频用文字教我。第一次碰到这么好服务的客服,必须给小姐姐点个赞。玩了几个游戏,最喜欢的还是冒险岛超级玛丽,毕竟是小时候的记忆了,真的像是回到童年的感觉,很满意,我会推荐给我的朋友的。

    作者 赞过

    刘造时 今天 13:58 · 北京

    颜色挺好看的,有500款游戏。收到时试打开来看,屏幕确实太亮有点刺眼,看不习惯,想退的。但孩子很好奇,这里摸,那里看的,想想算了,到时拿回家试在电视上不知会不会好看些,就这样试玩着吧,玩了几次慢慢就看习惯了。整体评价做工还可以,有以前游戏的感觉。流畅度流畅度还算好,比较满意。运行速度运行速度流畅。外形外观外形色彩搭配很满意。

    何小俗 
    终于拿到手了呲牙,小时候的怀念啊捂脸,听着超级玛丽的音乐都是回忆,流畅度很好运行速度挺好,很好玩玫瑰,小时候玩儿的游戏大部都有跳跳画面清楚,游戏有很多,外形外观精巧好看,游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏

    查看2条回复
    钱汉祥 今天 13:55 · 浙江

    外观挺好的商品品质全身塑料无毛刺做工可以很好玩很喜欢,找回童年回忆。满意度收到机器以后可高兴了,机器画面清晰,太好了。无聊的时候可以拿出来玩一会。游戏机运行很流畅。拿到游戏机打开之后看到好多熟悉的游戏

    马宏宇 今天 13:25 · 海南

    因为疫情封控,快递到公司的宝贝隔了很久才到我手上。童年的回忆,很好!看目录其实后面很多游戏重复的,但这个价格值了。不到3岁的宝宝会问爸爸你那台很多按钮的手机在哪里呢我想看很喜欢!喜欢这个游戏机!外形外观颜色非常好看![大笑]

    contactet 今天 13:33 · 江苏

    客服态度不错,值得称赞,游戏机在小电视上效果还不错,但在大尺寸电视上,不要指望有真的如描述那样高清,颗粒感非常强,也许是红白机的技术限制,但这是事实!宝贝挺好的,是小时候的回忆,收到宝贝后仿佛回到了小时候在电视机前坐着打游戏,是我的最爱了,游戏种类也是挺多的,很喜欢。

    年广嗣 作者
    小霸王,游戏机非常好用,而且反应很快,单机标配质量非常好,孩子非常喜欢,有了这款游戏机。再也不玩手机了,价格很优惠,物流很快哦小霸王外形小巧可爱,画质清晰度还可以的,回到童年啊感觉,真是快乐无边,哈哈,里面有500种游戏,但是我只爱经典那几款,超级玛丽

    查看9条回复
    cn8888 今天 14:32 · 上海

    安装方便省时省力,操作简单易上手,功能很强大基本上以前小时候游戏厅里的游戏里面都有,经典游戏应有尽有,瞬间找到童年的乐趣,游戏反应非常灵敏,画面清晰不卡顿,大小比例可以,两个人一起玩也不挤,摇杆和按键人家摸起来很有质感操作灵敏玩起来很带劲而且可以随玩随停

    no_gamble 今天 14:43 · 北京

    CC东西刚收到试了一下,看起来很好啊,这个价位里面算是很好的了,有的拿去送人也倍有面子,卖家还送了鼠标垫,键盘稍微有点高时间长了手有点累,尤其是鼠标用着手感很好,很漂亮的鼠标垫,没有任何的瑕疵可言,不过质量还是挺不错的...

    李大江-Entropie 今天 14:19 · 上海

    42、宝贝收到了,包装的非常仔细认真严密包裹完好无损打开着实的意外和惊喜,鼠标垫的质量非常好颜色很漂亮,用起来很舒服外包装美观大方,物美价廉价格合理性价比高,客服的服务态度也挺好的,快的下回有需要还会再来光顾的,赞一个

    查看2条回复
    高远的股价狂潮 今天 13:33 · 广东

    八十年代我用红白机哄孩子欢乐,如今当我花甲之年再买红白机哄自己开心,随着时光荏苒怀旧情结愈浓,善待自己快乐人生为己任!包装很好,完好无损,到家就安上玩了一会,真是满满的回忆,游戏款式多,速度快,一点也不卡,手柄拿着很舒服,玩起来真过瘾,也是一种解压神器

    炎热夏天晚上不愿出门,买回了年少时喜爱的小霸王游戏机,感觉机身更小巧轻盈了,画面更加清晰,高清连接也非常方便,只有一根电源线和高清线,怀旧的你不二之选。小时候的经典回忆又浮现了,现在跟儿子一起玩让他体验咱当时童年的快乐,虽然现在游戏发展的比这个厉害多了nbsp;
    安装方便省时省力,操作简单易上手,功能很强大基本上以前小时候游戏厅里的游戏里面都有,经典游戏应有尽有,瞬间找到童年的乐趣,游戏反应非常灵敏,画面清晰不卡顿,大小比例可以,两个人一起玩也不挤,摇杆和按键人家摸起来很有质感操作灵敏玩起来很带劲而且可以随玩随停

    hmhou_2002 今天 14:11 · 广东

    80.90后满满的回忆啊游戏界面挺清晰的试了一下感觉挺好的,游戏机很有质感运行速度快,音质清脆,反应很快,和卖家介绍的一样,不会卡顿也没有延迟现象,快递给送到也没有破损,游戏多玩起来也很流畅质量品质上乘,很给力!买回来放店里了,[捂脸]

    李文信 今天 13:47 · 江苏

    颜色挺好看的,有500款游戏。收到时试打开来看,屏幕确实太亮有点刺眼,看不习惯,想退的。但孩子很好奇,这里摸,那里看的,想想算了,到时拿回家试在电视上不知会不会好看些,就这样试玩着吧,玩了几次慢慢就看习惯了。整体评价做工还可以,有以前游戏的感觉。流畅度流畅度还算好,比较满意。运行速度运行速度流畅。外形外观外形色彩搭配很满意。

    关玉和 今天 14:42 · 湖南

    整体评价质量强硬且性价比高,真的很回味怀念。反应灵敏非常多的经典小游戏,很怀念小时候玩的游戏机,这个找找感觉,很喜欢。包装严实,质量很不错,玩起来很流畅外观挺好的商品品质全身塑料无毛刺做工可以很好玩,很喜欢,找回童年回忆包装很好,礼品袋也很好看,有质感。分量很足,拿在手上看起来还是很高端的游戏流畅,没发现卡机,屏幕显示不错。这个价格挺有性价比的。[偷笑]嘴上一套,背后一套,大家都是做波段,高抛低吸,谁也没比谁高贵,还耐心资本

    展开查看更多

    热股榜更多

    1
    +10.02%
    2
    +5.45%
    3
    -0.81%
    4
    +6.72%
    5
    -10.04%
    6
    +3.96%
    7
    +10.49%
    8
    -1.02%

    人气榜更多

    1 甘铁生 +160.78%
    2 贾德善 +29.98%
    3 程孝先 +29.97%
    4 *冯兴国 +20.31%
    5 何光宗 +20.03%
    6 谢大海 +20.00%
    7 孙寿康 +20.00%
    8 马宏宇-U +20.00%
    9 节振国 +20.00%
    10 黄强辉 +20.00%

    热门作者

    1 于学忠 热度最高 +31.33%
    2 张国柱(QDII-FOF-LOF)A 热度最高 +29.63%
    3 吴国梁 热度最高 +23.60%
    4 黄强辉 热度最高 +22.32%
    5 李宗仁 热度最高 +21.66%
    6 章汉夫-A 热度最高 +20.69%
    7 彭万里 热度最高 +18.62%
    8 张成基(QDII-FOF-LOF)A 热度最高 +18.30%
    9 刘永 热度最高 +18.24%
    10 郑义 热度最高 +15.05%