标签 "benchmark" 下的文章

共找到 1 篇文章
Large language Model

大型语言模型评估基准手册:2026 年 5 月完整版

· Large language Model · 99 分钟阅读
Handbook for Large Language Model Evaluation Benchmarks — Full Academic Markdown Edition, May 2026版本日期: 2026-05-31 文档类型: 研究论文式学术报告 / 技术手册 适用范围: 大型语言模型(LLM)与语言智能体(language agents)的研究评测、产品验收、模型选型、风险审计与基...