米兰体育中国官网约 1000 行代码搭起网页 AI 智能体: 微软 Webwright 登场

发布日期：2026-05-28 07:47 来源：未知作者：admin 浏览次数：

IT之家5月26日音书，微软推断院本月发布开源网页智能体框架Webwright，让AI模子在末端里编写Playwright（浏览器自动化库）代码、履行bash敕令、检验日记并反复修正。

IT之家征引博文先容，常见网页智能体选拔“截图或DOM景况→展望下一次点击、输入或升沉”方式，而微软Webwright让模子径直在末端中写Playwright代码、履行shell敕令、查验日记、截图和报错，再捏续修改剧本。

在架构方面，该框架选拔Runner、ModelEndpoint和末端环境3个中枢组件。公开信息透露，Runner约150行代码，模子接口约550行，环境部分约300行，共计约1000行，莫得多智能体编排，也莫得复杂分层蓄意。

在履行过程上，Runner把现时高下文发给模子，模子复返想考实质与一条shell敕令，环境履行后再复返末端输出、日记、截图或误差栈，随后插控制一轮。

相较一次只展望一个初级算作，代码神色更符合抒发多步网页任务，米兰体育中国官网举例完好填写表单、取舍日历、跨页面重迭操作，也更容易借助轮回、函数和详尽复用智力。

团队要点处理了2个工程问题。领先是“过早宣告完成”，模子可能在职务没的确凿现后就宣称凯旋。

为此，Webwright加入一个门控次序：模子必须先生成自检竖立，再在全新文献夹里驱动最终剧本，勾通日记和截图通过自我反想判断凯旋或失败，之后智力输出完成标志。

其次是高下文彭胀，长轨迹编码容易超出高下文浪漫，因此系统每20步会把历史压缩成一份选录。

基准测试方面，Webwright在Online-Mind2Web和Odysseys上王人给出较强发达。前者包含300个任务、隐秘136个常用网站，基于GPT-5.4的Webwright举座准确率达到86.67%，在100步预算下位列公开harness配方前方。

Odysseys暖热跨多网站的长链路浏览任务，任务请示平均272.3个词。2026年4月榜单最好模子Opus4.6得分为44.5%，而Webwright＋GPT-5.4达到60.1%，相对此前最好后果擢升35.1%，比基础GPT-5.4的33.5%卓绝26.6个百分点，擢升81.49%。

2026年世界杯中国官网

参考米兰体育中国官网

米兰体育MILAN中国官网