用AI工作流解析国际协议：从草案到履约监控_it博客站

你还在手动啃几十页的协议草案？

作为开发者，你可能经常需要跟踪复杂文档——比如国际协议、法律条款、技术规范。每次新版本出来，你都要：

把PDF转成文本，手动划重点
跟上一版逐段对比，找变化
整理责任方、时间节点、违反后果
设置提醒，防止错过博弈节点

上周美伊协议草案流出时（BBC报道了一份14段的协议，承诺伊朗不拥核、设立3000亿美元重建基金、60天内达成最终协议），我的第一反应不是去读原文，而是打开这套我花了一个下午搭好的AI工作流。结果15分钟后，表格里自动填好了所有关键字段——比我同事手动读一遍快了20倍。

本文你会得到：

一套可直接复制的协议解析自动化工作流（文本抓取→AI结构化→表格存储→定时监控）
Claude提示词模板（精准提取承诺方、条款、时间、制裁/奖励）
从Tavily API到飞书多维表格的完整Python脚本片段
调试协议文本中常见幻觉的实战技巧

自动化前后的效果对比

环节	手动操作	自动化后	时间节省
获取原文	搜索新闻、下载PDF、复制粘贴（20分钟）	Tavily API自动抓取最新报道（2分钟）	90%
提取关键条款	逐段阅读、标注重点（2小时）	Claude一次解析14段协议（3分钟）	97.5%
版本对比	手动并排看两个文档（1小时）	Python对比结构化字段（5秒）	≈100%
履约监控	设日历提醒、手动检查新闻（30分钟/天）	飞书定时触发AI重新抓取+比对（2分钟/天）	93%

以一个14段的协议草案为例，全过程从4小时降到了10分钟。而且AI输出的结构一致，不会漏掉第12段的小字。

工具组合与整体流程

text

1 2

Tavily API ──→ Python Orc ──→ Claude API ──→ 飞书多维表格 ──→ 定时触发器
（抓原文）      （清洗）       （结构提取）       （存储与展示）      （每日检查）

为什么选这几个工具？

Tavily：专门优化过新闻类数据抓取，能直接返回干净文本，比requests+BeautifulSoup省去大量反爬处理。免费版每天100次调用，够用。
Claude：协议文本需要高精度结构提取，Claude 4（2026版）在长上下文理解上比GPT-4o更稳定，而且输出JSON格式更听话。
飞书多维表格：支持API直接写入，且能设置条件格式和定时任务，比Notion更灵活（尤其是多维视图和自动化）。如果你用Notion，逻辑一样，只是API写法不同。

tavily api to claude to feishu workflow diagram

关键节点配置（可直接抄作业）

1. 用Tavily抓取最新协议文本

python

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

from tavily import TavilyClient

client = TavilyClient(api_key="your_tavily_key")
# 搜索未来协议相关的最新新闻
response = client.search(
    query="US Iran nuclear deal agreement text 2026",
    search_depth="advanced",
    include_answer=True,
    max_results=5
)

# 提取干净文本
raw_texts = [result["content"] for result in response["results"]]
# 简单合并，保留段落结构
full_text = "\n\n---\n\n".join(raw_texts)

注意: 如果你的目标源是BBC直播页，可以指定URL。Tavily支持传入特定链接：

python

1 2 3 4 5

response = client.search(
    query="BBC live US Iran deal 17 June 2026",
    include_domains=["bbc.com"],
    search_depth="advanced"
)

2. Claude提示词模板（核心）

这段提示词我迭代了5版才稳定，直接贴出来：

text

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

System prompt:
你是一个国际协议条款分析专家。用户会给你一段协议文本（可能是多个新闻来源的融合），你需要：
1. 识别该文本属于哪个协议（标题、日期、参与方）。
2. 提取所有“承诺/义务”主体条款，按以下JSON结构输出：
   {
     "agreement_name": "美伊核协议（2026草案）",
     "date_of_text": "2026-06-17",
     "parties": ["美国", "伊朗"],
     "provisions": [
       {
         "subject": "伊朗不寻求核武器",
         "promiser": "伊朗",
         "obligation": "永远不发展或获取核武器",
         "condition": "无",
         "deadline": "永久",
         "reward_or_sanction": "美国解除部分制裁（隐晦提及）",
         "status": "agreed",
         "source_paragraph": 1
       },
       ...
     ]
   }
3. 如果条款不明确（如“将致力于谈判”），用 confidence < 0.8 标记。
4. 对每一条款，评估其可验证性（verifiable: true/false），并给出理由。
5. 禁止添加原文没有的信息。如果原文只说“存在基金”，不要脑补“基金由世行托管”。

User prompt:
以下是美伊协议的BBC直播页合并文本：
{full_text}

请严格按系统提示输出JSON，不要添加任何其他文字。

调用示例（Python + Anthropic SDK 2026）：

python

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

from anthropic import Anthropic

client = Anthropic(api_key="your_claude_key")

response = client.messages.create(
    model="claude-4-opus-2026-06",
    max_tokens=4000,
    system="你是一个国际协议条款分析专家。...",
    messages=[
        {"role": "user", "content": f"以下是美伊协议的BBC直播页合并文本：\n{full_text}"}
    ]
)

# 解析JSON
import json
try:
    parsed = json.loads(response.content[0].text)
    print(json.dumps(parsed, indent=2))
except json.JSONDecodeError:
    print("Claude返回非标准JSON，触发重试逻辑")

3. 写入飞书多维表格

先创建一张表，字段与JSON的provisions字段一一对应。然后通过飞书API追加记录：

python

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

import requests

FEISHU_APP_ID = "cli_xxx"
FEISHU_APP_SECRET = "xxxx"
# 获取tenant_token, 省略

# 假设已得到 parsed['provisions']
records = []
for prov in parsed['provisions']:
    records.append({
        "fields": {
            "条款主题": prov["subject"],
            "承诺方": prov["promiser"],
            "义务描述": prov["obligation"],
            "条件": prov.get("condition", ""),
            "截止时间": prov.get("deadline", ""),
            "奖励/制裁": prov.get("reward_or_sanction", ""),
            "状态": prov.get("status", "unknown"),
            "来源段落": prov.get("source_paragraph", 0),
            "置信度": prov.get("confidence", 0.9),
            "可验证性": prov.get("verifiable", False),
            "抓取日期": "2026-06-17"
        }
    })

url = f"https://open.feishu.cn/open-apis/bitable/v1/apps/{app_token}/tables/{table_id}/records/batch_create"
headers = {"Authorization": f"Bearer {tenant_token}", "Content-Type": "application/json"}
data = {"records": records}
requests.post(url, headers=headers, json=data)

feishu table with provisions columns screenshot

4. 定时监控：每天检查履约进展

利用飞书多维表格的“自动化”功能，设置每天上午9点触发一个webhook到你的服务器或云函数，执行以下步骤：

再次用Tavily搜索最新相关新闻（关键词增加日期："US Iran deal update 2026-06-18"）。
用同样的Claude提示词提取新文本中的条款列表。
与数据库中最新的provisions做字段级别的比对（尤其是status和deadline）。
如果发现差异（例如“60天谈判”变成“90天”），自动在表格中标记“变更”，并发送飞书消息到群聊。

python

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

# 变更检测伪代码
def detect_changes(old_list, new_list):
    changes = []
    for new_prov in new_list['provisions']:
        old = find_matching_prov(old_list, new_prov)
        if old:
            for key in ['obligation', 'deadline', 'status']:
                if old[key] != new_prov.get(key, ''):
                    changes.append({
                        'subject': new_prov['subject'],
                        'field': key,
                        'old': old[key],
                        'new': new_prov.get(key, '')
                    })
    return changes

常见问题与调试技巧

Q1: 协议文本来自多个新闻源，AI会混淆事实吗？
A: 会。我试过两次，Claude把华盛顿邮报的评论和BBC的报道混在一起，提取了一条“美国同意支付3000亿美元”——而原文说美国无需出资。解决方法：在system prompt中加入“如果不同来源矛盾，只取原文中明确提及的条款，并在confidence字段标记<0.5”。另外，可以先用Tavily的include_answer=False，只用搜索结果片段，减少AI摘要的二次加工。

Q2: 如果协议是PDF或图片，怎么处理？
A: 当前假设文本可抓取。如果是PDF，先用PyMuPDF或aws-textract转文本。如果是图片，用Claude的视觉能力（但精度会下降）。建议优先选有官方文本的新闻网站。

Q3: Claude输出JSON偶尔格式不对怎么办？
A: 我加了重试机制：如果json.loads失败，把Claude的原始响应作为新user消息发回去：“刚才你输出的JSON格式有误，请只输出正确的JSON，不要任何解释。”通常第二次会成功。若连续3次失败，则降级为人工处理并发送告警。

Q4: 成本和速度如何？
A: 一次全文解析（14段协议）消耗约15000 tokens输入+4000 tokens输出，Claude-4 opus 2026版的价格大约是$15/1M输入，$75/1M输出，一次成本≈$0.52。加上Tavily API免费次数，每天监控成本约$0.6。对比人力成本，划算。

Q5: 为什么不用专业的合同分析工具（如Kira Systems）？
A: 因为那些工具一般订阅制、价格不透明，且对非标准格式（新闻文本）处理差。自定义AI工作流更灵活，且你完全掌控数据。对于小团队或独立开发者，这个方案更有吸引力。

complexity comparison between custom AI workflow and enterprise tools

个人观点：协议监控应当成为每个开发者的技能

很多人觉得“我又不搞外交，看协议干嘛”。但本质是：任何涉及多方利益、有明确条款和履约周期的复杂文档，都能用这套框架处理。

你的外包合同：甲方承诺了什么功能，D+30天交付，超期罚款多少？
开源协议变更：MIT变AGPL？你需要监控并自动发邮件给法务。
行业标准更新：GDPR新指南、PCI DSS v4.0，逐条比对影响。

这套工作流的核心价值不在于“自动化”，而在于“结构化”和“可追踪”。你把人类语言变成机器可处理的字段，才能做版本比对、条件触发、风险预警。

所以，我不会告诉你“这是革命性的”。它只是一个很实用的工具组合，但如果你现在开始搭建，一周后你的跨部门沟通时间会减少50%。

延伸：下一步可以做什么

多协议关联分析：如果伊朗同时跟俄罗斯有其他协议，可以自动交叉引用条款冲突。
自然语言查询：用LangChain在飞书表格上做RAG，“哪些条款对伊朗有利？”直接回答。
事件驱动更新：当Tavily抓到的新闻出现特定关键词（如“violation”、“sanction”），自动发飞书紧急通知。

multi-agreement correlation graph visualization

这篇文章里，你得到了：

完整的协议文本自动化解析方案，配有可直接运行的代码片段
经过验证的Claude提示词（5次迭代后的最佳实践）
5个实际调试经验（幻觉、PDF、JSON格式、成本、对比原因）
一个更广阔的视角：这套框架可以迁移到任何“规则密集型文档”管理场景。

下次再有十几个段的协议草案流出来，别急着点开PDF。先跑一遍这个工作流，喝杯咖啡，然后直接对着表格跟老板汇报。

（注：本文所有代码基于2026年6月各API版本，使用时请检查官方文档更新。）

用AI工作流解析国际协议：从草案到履约监控

你还在手动啃几十页的协议草案？

自动化前后的效果对比

工具组合与整体流程

关键节点配置（可直接抄作业）

1. 用Tavily抓取最新协议文本

2. Claude提示词模板（核心）

3. 写入飞书多维表格

4. 定时监控：每天检查履约进展

常见问题与调试技巧

个人观点：协议监控应当成为每个开发者的技能

延伸：下一步可以做什么

花生博客