分类 Large language Model 下的文档

Large language Model

deepseek原理笔记(1)

2025年10月05日 · Large language Model · 50 分钟阅读

deepseek原理综述🔢 核心思想：下一个词的预测大型语言模型的本质是一个概率模型。给定一个词序列（即上下文或提示），其根本任务是预测下一个最可能出现的词。基本设定：设有一个词序列(w_1, w_2, w_3, \dots, w_{t-1})，其中每个(w_i)来自一个庞大的词汇表 (V)。核心目标：计算在给定上文的情况下，下一个词 (w_t) 是词汇表中任意一个词的条件概率：$$ P(w_t ...

Large language Model

📘 LangChain 速查手册（2024）

2025年10月01日 · Large language Model · 22 分钟阅读

✅ 基于 LangChain 0.2+（2024 年主流版本） 📌 导入惯例：from langchain import ... 或 from langchain_core import ...🧱 一、核心概念概念说明LLM大语言模型接口（如 OpenAI、Anthropic、Ollama）ChatModel支持对话格式的模型（messages 输入）PromptTemplate构建结构化提示词C...

分类 "Large language Model" 下的文章