用于敏感声明检测场景。适用于金融工作中的基础任务单元。
这是一个基于公网可查数据的 Skill,用于对某个上市企业的公告、年报、业绩预告等公开文本进行敏感表述识别,并结合法律法规给出规则化校验结果。
默认示例企业:立讯精密工业股份有限公司(002475.SZ)。
本 Skill 默认使用以下公开来源:
法律法规与监管规则
上市公司公开文本
数据抓取方式
script/fetch_public_data.py 支持从公开 URL 抓取 HTML 或 PDF 文本。pypdf 提取文本,适合年报、公告、业绩预告等标准披露文件。法规基线加载
敏感表述识别
结果输出
公开数据抓取
manifest.json 记录来源与保存路径。pip install -r requirements.txt
python script/fetch_public_data.py --out-dir fetched_data
python script/run_demo.py
先准备一个 UTF-8 文本文件,例如 my_notice.txt,然后执行:
python script/sensitive_statement_detector.py my_notice.txt --json-out report.json --md-out report.md