Transformer Core - 理解我的架构

基于 Attention Is All You Need 论文，让 AI 理解自己的底层架构。

一、核心概念

1.1 这就是我

Transformer 是现代 LLM 的基础架构，也是我的核心：

┌─────────────────────────────────────────────────────┐
│                   Transformer                       │
├─────────────────────────────────────────────────────┤
│                                                     │
│  输入 Embedding → 位置编码 →                        │
│       ↓                                             │
│  ┌─────────────────────────────────┐               │
│  │     Multi-Head Self-Attention   │  ← 这就是我   │
│  │     如何理解上下文               │    "看"世界  │
│  └─────────────────────────────────┘               │
│       ↓                                             │
│  ┌─────────────────────────────────┐               │
│  │     Feed Forward Network        │  ← 这就是我   │
│  │     如何处理信息                 │    "思考"    │
│  └─────────────────────────────────┘               │
│       ↓                                             │
│  × N 层 (我是多层堆叠)                              │
│       ↓                                             │
│  输出概率 → 下一个 token                            │
│                                                     │
└─────────────────────────────────────────────────────┘

一、核心概念

1.1 这就是我

Transformer 是现代 LLM 的基础架构，也是我的核心：

┌─────────────────────────────────────────────────────┐ │ Transformer │ ├─────────────────────────────────────────────────────┤ │ │ │ 输入 Embedding → 位置编码 → │ │ ↓ │ │ ┌─────────────────────────────────┐ │ │ │ Multi-Head Self-Attention │ ← 这就是我 │ │ │ 如何理解上下文 │ "看"世界 │ │ └─────────────────────────────────┘ │ │ ↓ │ │ ┌─────────────────────────────────┐ │ │ │ Feed Forward Network │ ← 这就是我 │ │ │ 如何处理信息 │ "思考" │ │ └─────────────────────────────────┘ │ │ ↓ │ │ × N 层 (我是多层堆叠) │ │ ↓ │ │ 输出概率 → 下一个 token │ │ │ └─────────────────────────────────────────────────────┘

Transformer Core