在任何需要联网检索的信息型问题上,用此技能指导多轮、多角度使用本项目的 `web_search` 工具。触发于「X 是什么」「解释 X」「比较 X 和 Y」「调研/研究 X」等,以及在开始任何内容生成任务(如 PPT、文章、UI、视频等)之前。提供系统化、多角度、多轮次的研究方法,而不是单次浅尝辄止的搜索。只要用户的问题需要线上信息,就应主动使用。
本技能提供一套系统化的方法论,用于进行深入的网页研究。在开始任何内容生成任务之前先加载本技能,以确保从多个角度、不同深度与多类来源获取足够信息。
在 Mini Agent 运行时,联网检索只通过 LangChain 工具 web_search 完成(见 backend/tools/web_search.py,由 config.yaml 的 tools.web_search 配置加载)。
| 要点 | 说明 |
|---|---|
| 工具名称 | 调用时使用 web_search(函数名即工具名),不要使用其他环境中的 WebSearch、web_fetch 等名称。 |
| 配置 | config.yaml → tools.web_search:provider 为 tavily(需有效 API key)或 duckduckgo(免费);还可调 、。 |
max_resultstimeout_seconds| 返回内容 | 每条结果包含 标题、链接、摘要;摘要为截断后的片段(约 500 字以内),不是整页全文。 |
| 无 URL 抓取工具 | 当前仓库没有单独的「按 URL 拉取整页」工具。深度靠 多轮 web_search、换关键词、site: 限定、针对具体标题/机构再搜来弥补,而不是假设能 fetch 全文。 |
结构化数据(学生成绩、考勤等)属于 data_query,与网页研究无关;本技能仅约束 web_search 的使用方式。
在以下场景务必加载本技能:
不要只凭一般常识就生成内容。 输出质量直接取决于研究的质量与数量。单条搜索查询永远不够。
先用较宽的检索建立「地图」,理解全貌:
web_search 搜主题,获得整体背景示例:
主题:"AI in healthcare"
初步搜索(每次调用 web_search,一次一个 query):
- "AI healthcare applications 2026"
- "artificial intelligence medical diagnosis"
- "healthcare AI market trends"
识别出的维度:
- 诊断型 AI(放射、病理)
- 治疗推荐系统
- 行政自动化
- 患者监测
- 监管与合规
- 伦理与偏见
对每个重要维度进行定向研究:
web_searchsite:example.com + 关键词 再发起新的 web_search,而不是假定能打开 URL 读全文web_search示例:
维度:"Diagnostic AI in radiology"
定向搜索:
- "AI radiology FDA approved systems"
- "chest X-ray AI detection accuracy"
- "radiology AI clinical trials results"
随后基于结果:
- 对最相关的 1~2 个来源换角度再搜(作者、机构、报告名)
为了覆盖全面且保持平衡,主动寻找多种信息类型:
| 信息类型 | 目的 | 示例检索词 |
|---|---|---|
| 事实与数据 | 提供可验证证据 | "statistics", "data", "numbers", "market size" |
| 案例与示例 | 真实世界应用 | "case study", "example", "implementation" |
| 专家观点 | 权威分析 | "expert analysis", "interview", "commentary" |
| 趋势与预测 | 未来方向 | "trends 2026", "forecast", "future of" |
| 对比分析 | 方案/竞品语境 | "vs", "comparison", "alternatives" |
| 挑战与批评 | 平衡视角 | "challenges", "limitations", "criticism" |
在开始内容生成前,确认:
web_search(多轮、多 query)?site:、报告名/论文名)以弥补摘要长度限制?如有任一项为否,继续用 web_search 迭代,不要进入生成阶段。
# 加上语境,让查询更具体
❌ "AI trends"
✅ "enterprise AI adoption trends 2026"
# 暗示权威来源类型
"[topic] research paper"
"[topic] McKinsey report"
"[topic] industry analysis"
# 指定内容形态
"[topic] case study"
"[topic] statistics"
"[topic] expert interview"
# 加入时间限定——必须使用 <current_date> 中的真实年份
"[topic] 2026" # ← 替换为真实当前年份,绝不要写死成过去年份
"[topic] latest"
"[topic] recent developments"
在形成任何搜索词之前先检查上下文中的 <current_date>。
<current_date> 会提供完整日期(年/月/日/星期)。根据用户意图决定时间精度:
| 用户意图 | 需要的时间精度 | 示例查询 |
|---|---|---|
| 「今天/刚发布/刚刚」 | 月 + 日 | "tech news February 28 2026" |
| 「这周」 | 周范围 | "technology releases week of Feb 24 2026" |
| 「最近/最新」 | 月份 | "AI breakthroughs February 2026" |
| 「今年/趋势」 | 年份 | "software trends 2026" |
规则:
"tech news 2026" 往往抓不到当天的新闻)2026-02-28)、英文月份格式(February 28 2026)与相对词(today, this week)示例对比:
"new technology 2026" → 可能漏掉当天新闻"new technology February 28 2026" + "tech news today Feb 28" → 更可能覆盖当天当满足以下任意条件时,应追加或改写 web_search,而不是假设能读取完整 HTML:
"statistics"、"pdf"、"full report" 等研究是迭代的。初步搜索之后:
web_search当你能有把握回答以下问题时,研究就「够用」了:
web_search 就停止web_fetch、环境专属的 WebSearch),应统一使用 web_search完成研究后,你应该具备:
只有达到上述程度,才进入内容生成阶段,用研究结果支撑高质量输出。