谷歌 AI 推出 Stax：帮助开发者根据自定义标准评估大语言模型 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

谷歌 AI 推出 Stax：帮助开发者根据自定义标准评估大语言模型

2025-09-03

谷歌AI推出了实验性评估工具Stax，旨在帮助开发者根据自定义标准测试和分析大语言模型。Stax具备“快速比较”和“项目与数据集”两大功能，支持结构化的评估流程，提高了测试效率和一致性。该工具内置了流畅性、基础性和安全性等多种评估器，并允许开发者自定义评估标准，以适应不同应用场景的需求。通过Stax的分析仪表板，开发者可以直观地比较模型表现，从而更有效地评估模型在实际应用中的适用性。

上一篇：济南市大数据局与华为签署人工智能合作协议

下一篇：IDC：AI智能体瞄准6500亿美元企业级应用软件市场

返回列表

热文阅读

2 天前

长江存储市占率突破13%！韩国大厂发出警告：中国追兵杀到了

2 天前

马斯克又盯上AI基建：特斯拉要卖“算力积木”了

2 天前

评奖赛事｜2026世界人工智能大会SAIL奖TOP30及青年优秀论文奖TOP20发布

2 天前

美国新提案：「国有化」AI巨头，「全民持股」50%