基于Daedalus Protocol的高质量技术课程笔记生成方法论
本技能文档沉淀了为Stanford CS336大语言模型课程生成高质量笔记的完整方法论。适用于任何技术课程的笔记整理工作。
| 原则 | 描述 | 实践要点 |
|---|---|---|
| 零信息损失 | Main笔记必须覆盖原始材料的所有技术细节 | 不遗漏任何公式、代码、实验结论 |
| T型知识结构 | 广度(Main)+ 深度(Elite Notes) | Main覆盖全貌,Elite深挖核心概念 |
| Chief Content Officer | 做策展人而非抄录员 | 重组、提炼、增强,不简单复制 |
LectureX/
├── LectureX-Main.md # 主笔记(必须)
├── LectureX-[Topic1].md # 精英补充笔记1(按需)
├── LectureX-[Topic2].md # 精英补充笔记2(按需)
├── ... # 最多5个精英笔记
└── images/ # 图片资源目录
├── image1.png
└── image2.png
| 资源类型 | 路径模式 | 用途 |
|---|---|---|
| 中文转录 | CS336_Lecture/TxtFile(CN)/CS336_X_标题.txt | 主要内容来源 |
| Python代码 | spring2025-lectures/lecture_X.py | 代码示例、结构参考 |
| 资源类型 | 路径模式 | 用途 |
|---|---|---|
| 英文转录 | CS336_Lecture/TxtFile(EN)/CS336_X_标题.txt | 术语确认 |
| PDF slides | CS336_Lecture/PPT/LectureX.pdf | 图片提取 |
| 课程images | spring2025-lectures/images/*.png | 预置图片 |
# 步骤1: 查找转录文件
find_by_name(Pattern="CS336_X_*", SearchDirectory="CS336_Lecture/TxtFile(CN)/")
# 步骤2: 查找对应Python代码
find_by_name(Pattern="lecture_X.py", SearchDirectory="spring2025-lectures/")
# 步骤3: 查找可用图片
list_dir(DirectoryPath="spring2025-lectures/images/")
# 步骤4: 读取转录获取完整内容
view_file(AbsolutePath="...转录文件路径...")
# 步骤5: 读取Python代码获取结构和示例
view_file_outline(AbsolutePath="...代码文件路径...")
# CS336 Lecture X: 中文标题 (English Title)
> **编辑蓝图 (Editorial Blueprint)**
>
> **核心主题**: [一句话总结本讲核心]
>
> **知识结构**:
> - 第一部分:[子主题1]
> - 第二部分:[子主题2]
> - 第三部分:[子主题3]
>
> **精英补充笔记**:
> - **[深入探讨: 概念1](./LectureX-Topic1.md)** - 简短描述
> - **[深入探讨: 概念2](./LectureX-Topic2.md)** - 简短描述
---
## 一、第一部分标题
### 1.1 小节标题
[正文内容,包含公式、代码、图片]
### 1.2 小节标题
[正文内容]
---
## 二、第二部分标题
[继续...]
---
## N、关键要点总结 (Key Takeaways)
### 要点类别1
| 项目 | 描述 |
|------|------|
| ... | ... |
### 要点类别2
[总结表格或列表]
---
## 参考资料
1. 论文引用1
2. 论文引用2
编辑蓝图(Editorial Blueprint)是笔记的元信息,帮助读者:
必须在Main笔记开头包含编辑蓝图!
| 课程主题 | 典型精英笔记 |
|---|---|
| 数据过滤 | KenLM与N-gram模型、MinHash与LSH算法 |
| RLHF | InstructGPT流水线、DPO数学推导 |
| RL算法 | DeepSeek R1技术报告、GRPO数学细节 |
| 模型评估 | Chatbot Arena与ELO、Train-Test污染 |
| 训练数据 | Common Crawl详解、版权法Fair Use |
# 深入探讨: [主题名称]
本文是Lecture X的精英补充笔记,深入讲解[主题]的[具体内容]。
---
## 一、背景/问题定义
[为什么需要这个知识点]
## 二、核心原理
[详细的理论讲解]
## 三、实现/应用
[代码示例或实践指南]
## 四、常见问题/陷阱
[注意事项]
---
## 参考资料
[学术引用]
spring2025-lectures/images/ - 优先使用search_web或generate_image# 步骤1: 检查课程images目录是否有相关图片
list_dir(DirectoryPath="spring2025-lectures/images/")
# 步骤2: 复制需要的图片到笔记目录
run_command(CommandLine='Copy-Item "源路径/*.png" "NoteByHuman/LectureX/images/"')
# 步骤3: 在Markdown中引用
# 
| 类型 | 命名模式 | 示例 |
|---|---|---|
| 架构图 | 主题-architecture.png | transformer-architecture.png |
| 结果图 | 方法-results.png | dclm-results.png |
| 流程图 | 流程-pipeline.png | rlhf-pipeline.png |
| 对比图 | 对比项-comparison.png | ppo-dpo-comparison.png |
| 类型 | 用途 | 长度建议 |
|---|---|---|
| 完整实现 | 核心算法的可运行代码 | 20-50行 |
| 伪代码 | 流程说明 | 10-20行 |
| 代码片段 | 关键步骤演示 | 5-15行 |
| 命令行 | 工具使用示例 | 1-5行 |
def example_function(param1: Type1, param2: Type2) -> ReturnType:
"""
函数简短描述
Args:
param1: 参数1的含义
param2: 参数2的含义
Returns:
返回值的含义
"""
# 步骤1: [做什么]
result1 = step1(param1)
# 步骤2: [做什么]
result2 = step2(result1, param2)
return result2
view_file_outline了解函数/类| 用途 | 语法 | 示例 |
|---|---|---|
| 行内公式 | $...$ | $P(x)$ |
| 独立公式 | $$...$$ | $$\sum_{i=1}^n x_i$$ |
| 分数 | \frac{a}{b} | $\frac{a}{b}$ |
| 求和 | \sum_{i=1}^{n} | $\sum_{i=1}^{n}$ |
| 期望 | \mathbb{E}[X] | $\mathbb{E}[X]$ |
| 梯度 | \nabla | $\nabla$ |
$$...$$# 创建Lecture目录和images子目录
mkdir NoteByHuman/LectureX, NoteByHuman/LectureX/images
| 类型 | 提交信息模板 |
|---|---|
| 新增笔记 | Add comprehensive Lecture X notes on [主题] |
| 精英笔记 | Add elite supplementary notes for Lecture X |
| 图片 | Add images for Lecture X notes |
| 修复 | Fix [具体问题] in Lecture X notes |
# 添加特定Lecture的所有文件
git add NoteByHuman/LectureX
# 提交
git commit -m "Add comprehensive Lecture X notes on [主题] with elite notes"
# 推送
git push
问题: 转录超过800行,无法一次读取
解决:
# 分段读取
view_file(AbsolutePath="...", StartLine=1, EndLine=400)
view_file(AbsolutePath="...", StartLine=400, EndLine=800)
问题: 某些课程没有配套代码
解决:
问题: 需要的图片不在课程目录
解决:
generate_image生成示意图search_web找到替代图片问题: 单讲内容太多,Main过长
解决:
# 同时创建多个文件
write_to_file(TargetFile="Lecture14-Main.md", ...)
write_to_file(TargetFile="Lecture14-KenLM.md", ...)
write_to_file(TargetFile="Lecture14-MinHash.md", ...)
保存常用的Markdown结构作为模板,快速填充内容。
# 一次复制多个图片
Copy-Item "source\img1.png","source\img2.png","source\img3.png" -Destination "dest\"
参考: NoteByHuman/Lecture14/Lecture14-Main.md
参考: NoteByHuman/Lecture15/Lecture15-DPO.md
# 1. 创建新Lecture目录
mkdir NoteByHuman/LectureX, NoteByHuman/LectureX/images
# 2. 复制相关图片
Copy-Item "spring2025-lectures\images\relevant*.png" "NoteByHuman\LectureX\images\"
# 3. 创建笔记后提交
git add NoteByHuman/LectureX
git commit -m "Add comprehensive Lecture X notes on [主题]"
git push
"路漫漫其修远兮,吾将上下而求索。"
愿这套方法论帮助你高效地将知识沉淀为永久资产。