IT之家 5 月 23 日消息,微软研究院 AI Frontiers 实验室最新发布 Fara1.5 系列模型,主要适用于浏览器场景下的计算机使用智能体,涵盖 4B、9B 和 27B 三个参数规模版本。
该系列模型配套 MagenticLite(微软为此类智能体设计的沙盒浏览器界面)使用,可以直接读取浏览器截图,再输出鼠标和键盘操作,完成网页任务。
Fara1.5 采用 Qwen3.5 基础检查点,使用“观察 — 思考 — 行动”循环。每一步都会结合历史对话与最近 3 张浏览器截图,输出推理内容和下一个动作。

性能方面,Fara1.5-27B 在 Online-Mind2Web 上拿到 72% 任务成功率,该基准覆盖 136 个热门网站、300 项任务。
对比来看,OpenAI Operator 为 58.3%,Gemini 2.5 Computer Use 为 57.3%,Yutori Navigator n1 为 64.7%,Fara1.5-9B 也达到 63.4%。

训练层面,Fara1.5 采用约 200 万条样本做 Fine-tuning(微调),其中 60% 来自网页轨迹,12.8% 来自合成环境,12.5% 来自表单填写与用户交互,8.8% 来自事实锚定(Grounding),4.9% 来自视觉问答。




安全与协作方面,模型会在缺少个人信息、任务描述含糊、即将执行未经批准的不可逆操作 3 种情况下,会主动停下并询问用户。所有动作都记录在 MagenticLite 中,沙盒浏览器也构成智能体与用户设备之间的安全边界。
IT之家附上参考地址
Fara1.5 – A family of frontier computer use agent models
