分类 artificial intelligence 下的文档

Large language Model

大型语言模型评估基准手册：2026 年 5 月完整版

2026年05月31日 · Large language Model · 99 分钟阅读

Handbook for Large Language Model Evaluation Benchmarks — Full Academic Markdown Edition, May 2026版本日期： 2026-05-31 文档类型：研究论文式学术报告 / 技术手册适用范围：大型语言模型（LLM）与语言智能体（language agents）的研究评测、产品验收、模型选型、风险审计与基...

Large language Model

大型预训练语言模型一体化训练流程

2026年05月01日 · Large language Model · 58 分钟阅读

0. 术语与适用范围本文将“大预言模型”按当前学术和工业语境解释为“大型预训练语言模型”（large pretrained language model / large language model）。流程主线覆盖从数据治理、分词、模型架构、分布式预训练，到中期再训练、监督微调、偏好对齐、评估、部署和持续迭代的闭环。默认模型类别为 GPT-3、PaLM、Llama、OLMo/OLMo 2 等公开文...

智能体, openSource

OpenClaw + Ollama + Qwen3 完整本地部署教程

2026年03月06日 · 智能体, openSource · 9 分钟阅读

目标：✅ 完全本地运行 AI Agent✅ 不需要任何 API Key✅ 0 成本运行 AI✅ 支持 OpenClaw agent + tools + chat一、最终架构本教程部署完成后的架构：User ↓ OpenClaw Agent ↓ OpenClaw Gateway ↓ Ollama API ↓ Qwen3 Model ↓ Local GPU / CPUOpenClaw 会调用 Olla...

Large language Model

Research Report: Handbook for Large Language Model Evaluation Benchmarks-v2025F1

2025年10月18日 · Large language Model · 32 分钟阅读

Executive SummaryLarge Language Model （LLM） evaluation benchmarks serve as critical infrastructure for the responsible development, deployment, and regulation of artificial intelligence systems. This ...

Large language Model

大模型评估基准手册研究报告

2025年10月17日 · Large language Model · 20 分钟阅读

大模型评估基准手册是指导大模型性能评估的专业工具，其重要性随着大模型在各行业的应用日益广泛而显著提升。构建科学、全面、客观的大模型评估体系，不仅能帮助研究者和开发者准确把握模型能力边界，还能为模型优化提供方向性指导，同时为行业应用选型提供可靠依据。本报告基于最新研究进展，系统梳理了大模型评估的关键维度、指标、方法及工具，旨在为大模型研发、测试和应用提供标准化评估框架。一、大模型评估的关键维度与指标...

分类 "artificial intelligence" 下的文章