GPT 的直观理解 2025年10月25日 · Data field · 34 分钟阅读 1. GPT 是什么?GPT 全称 Generative Pre-trained Transformer,意为"生成式预训练 Transformer"。它是一种通过预测下一个词(Next Token Prediction)来学习语言规律的模型,本质上是:$$ P(w_t | w_1, w_2, ..., w_{t-1}) $$也就是说,GPT 不需要人工标签,它通过阅读大量文本自动学习如何预测句子...