标签 "GPT" 下的文章

共找到 1 篇文章

GPT 的直观理解

· Data field · 34 分钟阅读
1. GPT 是什么?GPT 全称 Generative Pre-trained Transformer,意为"生成式预训练 Transformer"。它是一种通过预测下一个词(Next Token Prediction)来学习语言规律的模型,本质上是:$$ P(w_t | w_1, w_2, ..., w_{t-1}) $$也就是说,GPT 不需要人工标签,它通过阅读大量文本自动学习如何预测句子...