name
contract-structure-parsing
description
用于条款/义务/责任解析的合同结构解析原子 skill,适用于通用行业文档解析场景。
合同结构解析 Skill
数据来源
本 Skill 支持多种合同文档输入格式,核心数据来源包括:
- 合同文档类型
PDF格式
:合同PDF文档
Word格式
:合同Word文档
图片格式
:扫描版合同图片
- 合同内容类型
贷款合同
:银行贷款合同、民间借贷合同
担保合同
:保证合同、抵押合同、质押合同
投资协议
:股权投资协议、债权投资协议
并购协议
:股权转让协议、资产收购协议
- 文档特征
语言类型
:中文、英文
版式类型
:标准版式、复杂版式、扫描版式
文档大小
:小文档(<10MB)、大文档(>10MB)
- 数据格式要求
文件路径
:本地文件路径或网络文件URL
文件编码
:UTF-8、GBK、GB2312等
文件权限
:需要读取权限
说明:本 Skill 不包含文档采集功能,需要用户提供合同文档文件。建议文档格式规范,以便进行准确的结构解析。
功能
本 Skill 提供全面的合同结构解析能力,涵盖多种解析功能:
- 合同结构识别
合同标题识别
:识别合同标题和合同类型
合同主体识别
:识别合同双方主体信息
合同日期识别
:识别合同签署日期和生效日期
合同编号识别
:识别合同编号和版本信息
- 条款结构解析
条款层级识别
:识别合同的条款层级结构
条款标题提取
:提取各级条款标题
条款内容提取
:提取各条款的具体内容
条款定位
:记录条款在文档中的位置
- 义务责任识别
义务条款识别
:识别各方的义务条款
责任条款识别
:识别各方的责任条款
违约责任识别
:识别违约责任条款
权利义务映射
:建立权利义务的映射关系
- 关键信息提取
主体信息提取
:提取合同双方的基本信息
金额信息提取
:提取涉及金额和支付条款
期限信息提取
:提取合同期限和履行期限
条件信息提取
:提取合同生效条件和解除条件
- 版式还原
版式结构还原
:尽可能还原合同的原始版式
格式信息保留
:保留字体、字号等格式信息
布局信息记录
:记录页面布局和元素位置
- 高级处理功能
OCR识别
:对扫描版合同进行OCR识别
多语言识别
:识别合同中的多语言内容
结构化输出
:输出结构化的合同内容
使用示例
输出示例
{
"document_info"
:
{
"filename"
:
"contract.pdf"
,
"file_size"
:
1024000
,
"page_count"
:
20
,
"language"
:
"zh-CN"
,
"contract_type"
:
"贷款合同"
}
,
"header"
:
{
"title"
:
"银行贷款合同"
,
"contract_number"
:
"LOAN-2024-001"
,
"party_a"
:
"示例银行股份有限公司"
,
"party_b"
:
"示例公司"
,
"sign_date"
:
"2024-03-15"
,
"effective_date"
:
"2024-03-20"
}
,
"structure"
:
{
"clauses"
:
[
{
"level"
:
1
,
"title"
:
"第一条 贷款金额和用途"
,
"content"
:
"贷款金额和用途内容..."
,
"page"
:
1
,
"obligations"
:
[
"借款人应按约定用途使用贷款"
]
,
"responsibilities"
:
[
"贷款人应按约定发放贷款"
]
}
,
{
"level"
:
1
,
"title"
:
"第二条 贷款利率和期限"
,
"content"
:
"贷款利率和期限内容..."
,
"page"
:
2
}
]
}
,
"key_information"
:
{
"loan_amount"
:
10000000
,
"interest_rate"
:
4.35
,
"loan_term"
:
12
,
"repayment_method"
:
"等额本息"
,
"guarantee"
:
[
"抵押"
,
"保证"
]
}
}
注意事项与限制