Transformer 的直观理解

openSource

数论基础（模运算·素数·欧拉函数）

2025年10月27日 · openSource · 23 分钟阅读

目标：给出系统、可复用的数学原理与证明纲要 + 典型算法模板与例题解析，覆盖模运算、素数理论与欧拉函数。1. 同余与模运算（Modular Arithmetic）1.1 同余的定义与等价关系定义：若整数 $a,b,n$ 且 $n>0$，当且仅当 $n\mid (a-b)$ 时，记 $a\equiv b\pmod n$。等价关系：反身、对称、传递均成立；因此在 $\mathbb{Z}$ 上诱导...

openSource

NumPy基础公式

2025年10月27日 · openSource · 22 分钟阅读

1. 数组运算1.1 元素级运算加法$$c_i = a_i + b_i$$import numpy as np a = np.array([1,2,3]) b = np.array([4,5,6]) c = a + b乘法（逐元素）$$c_i = a_i \cdot b_i$$c = a * b平方$$b_i = a_i^2$$b = a ** 2平方根$$b_i = \sqrt{a_i}$$b ...

recommend

GPT 的直观理解

2025年10月25日 · Data field · 34 分钟阅读

1. GPT 是什么？GPT 全称 Generative Pre-trained Transformer，意为"生成式预训练 Transformer"。它是一种通过预测下一个词（Next Token Prediction）来学习语言规律的模型，本质上是：$$ P(w_t | w_1, w_2, ..., w_{t-1}) $$也就是说，GPT 不需要人工标签，它通过阅读大量文本自动学习如何预测句子...

Data field