分类 "artificial intelligence" 下的文章

共找到 18 篇文章

支持向量机(SVM)基础

· artificial intelligence · 37 分钟阅读
一、SVM 是什么?支持向量机(Support Vector Machine, SVM) 是一种监督学习算法,主要用于分类(也可用于回归,称为 SVR)。其核心思想是:在特征空间中找到一个最优的超平面(decision boundary),使得不同类别的样本被尽可能清晰地分开,并且分类边界到最近样本点的距离(即“间隔”)最大化。SVM 属于判别模型,追求结构风险最小化(而非经验风险最小化),具有良...

XGBoost 基础笔记

· artificial intelligence · 28 分钟阅读
一、XGBoost 是什么(一句话)XGBoost(eXtreme Gradient Boosting)是一个高性能的梯度提升库,提供了基于树的 GBDT/DART 与(历史上的)线性模型接口,具备稀疏感知、正则化、早停、分布式/多 GPU、类别特征等特性,适合结构化数据的分类、回归与排序任务。官方文档入口与导航在此。 (docs.xgboost.com.cn)二、核心工作原理(你需要知道的几个“...

🚀 PyTorch 速查手册

· Large language Model · 56 分钟阅读
模块/主题核心类/函数/操作主要用途/说明Tensor操作torch.tensor(), torch.randn(), view(), reshape(), to(device)创建张量、改变形状、设备转换自动微分requires_grad=True, backward(), grad, torch.no_grad()设置梯度追踪、计算梯度、清空梯度、禁用梯度计算数据加载与处理Dataset, D...

Agent速查手册

· 智能体 · 35 分钟阅读
一、Agent 的工作循环(Perception–Thinking–Action)几乎所有 Agent 框架都遵循同一个主循环:while not done: observe(state) think(plan or react) act(action) reflect(feedback)这与经典的认知科学模型如 Sense → Think → Act → Reflect 一致。现代 LLM-Ag...

deepseek原理笔记(1)

· Large language Model · 50 分钟阅读
deepseek原理综述🔢 核心思想:下一个词的预测大型语言模型的本质是一个概率模型。给定一个词序列(即上下文或提示),其根本任务是预测下一个最可能出现的词。基本设定:设有一个词序列(w_1, w_2, w_3, \dots, w_{t-1}),其中每个(w_i)来自一个庞大的词汇表 (V)。核心目标:计算在给定上文的情况下,下一个词 (w_t) 是词汇表中任意一个词的条件概率:$$ P(w_t ...