标签 "Agent" 下的文章

共找到 3 篇文章

Agent速查手册

· 智能体 · 35 分钟阅读
一、Agent 的工作循环(Perception–Thinking–Action)几乎所有 Agent 框架都遵循同一个主循环:while not done: observe(state) think(plan or react) act(action) reflect(feedback)这与经典的认知科学模型如 Sense → Think → Act → Reflect 一致。现代 LLM-Ag...

AI-Agent 技术学习提纲

· 智能体 · 50 分钟阅读
第一部分:AI-Agent 基础概念1.1 人工智能(AI)简介1.1.1 基本定义人工智能(Artificial Intelligence, AI)是指使计算机、机器等具备模仿人类智能的能力的学科。具体来说,它涉及到通过算法、数据和模型,使得机器能够执行智能任务,如感知、推理、学习、理解、决策等。AI的目标是使机器能够执行复杂的任务,而这些任务通常需要人类智慧才能完成。1.1.2 发展历史人工智...

🐪如何用 PPO 微调 LLM 作为 Agent

· 智能体 · 17 分钟阅读
使用 PPO(Proximal Policy Optimization)微调大语言模型(LLM)作为智能体(Agent),适用于任务型对话、工具调用、自主规划等场景。我们将结合 Hugging Face Transformers + TRL(Transformer Reinforcement Learning)库 + 自定义环境,以一个简化但完整的例子说明整个流程。🎯 目标场景示例任务:让 LLM...