这个提示词解决什么问题
每次看TradingView上的财报新闻,密密麻麻的英文,想快速对比几家公司的营收、净利润?手动扒表格太累。让AI帮你做结构化提取——直接把一段新闻文本转成JSON,省得你写正则或者爬虫。
核心思路
关键不是让AI“读懂”内容,而是给它一个明确的“输出格式指令”。普通Prompt会说“提取关键数据”,结果AI给你一段散文;好Prompt会定义字段、数据类型、示例,甚至告诉它如果找不到数据就填null。另外,加上一条“禁止输出任何解释”,直接给JSON,方便你后续代码消费。
完整提示词模板(可直接复制)
markdown
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
你是一个金融数据提取助手。用户会给你一段财报新闻或表格文本,你需要从中提取以下字段,并以JSON格式输出:
- company_name: 公司名称(字符串)
- fiscal_year: 财报年份(字符串,如"2025/26")
- revenue: 营收(数字,单位:百万日元,如12000)
- operating_income: 营业利润(数字,单位:百万日元)
- net_income: 净利润(数字,单位:百万日元)
- currency: 货币(字符串,如"JPY")
提取规则:
1. 如果某个字段在文本中未明确给出,请填入null。
2. 数值去掉逗号和货币符号,直接保留数字。
3. 如果利润显示为负数,使用负号。
4. 只输出JSON代码块,不要输出任何其他文字、解释或前缀。
示例输入:
"Kitazawa Sangyo reported parent revenue of ¥12,345 million for FY2025/26, operating income ¥567 million, net income ¥89 million."
示例输出:
```json
{
"company_name": "Kitazawa Sangyo",
"fiscal_year": "2025/26",
"revenue": 12345,
"operating_income": 567,
"net_income": 89,
"currency": "JPY"
}
现在,请处理以下输入:
{{输入文本}}
text
1
2
3
4
5
6
7
## 效果演示
### 差Prompt
```text
从这段话中提取财务数据:
[粘贴新闻]
输出(典型结果):
根据文本,Kitazawa Sangyo 在2025/26财年的营收为123.45亿日元,营业利润5.67亿日元,净利润0.89亿日元。注意单位是亿日元。
问题:输出是自然语言,单位不统一,还要手动解析;没有JSON结构,无法直接喂给程序。
好Prompt(使用上面的模板)
输入(模拟TradingView新闻风格)
text
1
2
3
4
5
TABLE-Kitazawa Sangyo -2025/26 parent results — TradingView News.
* Revenue: ¥12,345 million
* Operating income: ¥567 million
* Net income: ¥89 million
* Currency: JPY
输出
json
1
2
3
4
5
6
7
8
{
"company_name": "Kitazawa Sangyo",
"fiscal_year": "2025/26",
"revenue": 12345,
"operating_income": 567,
"net_income": 89,
"currency": "JPY"
}
优势:干净JSON,字段明确,可直接丢给前端或数据库。
为什么这样写有效
- 显式定义字段和类型:告诉AI你想要什么,避免它自由发挥。
- 提供示例:Few-shot示例让输出格式稳定,尤其是JSON的括号和逗号位置。
- 限制输出格式:强制只输出代码块,消除任何多余解释——很多Prompt失败是因为AI喜欢说“根据文本,我提取了……”这种废话。
- 处理缺失值:用null代替空字段,防止AI胡编乱造(幻觉)。
变体和注意事项
变体1:多公司同时提取
如果你给一段包含多家公司的新闻,可以改字段为数组:
json
1
2
3
4
5
6
7
8
9
10
11
12
{
"reports": [
{
"company_name": "Kitazawa Sangyo",
...
},
{
"company_name": "Ohashi Technica",
...
}
]
}
在Prompt里加一句“如果文本包含多家公司,以数组形式输出所有公司”,并提供一个示例。
变体2:支持不同货币
在字段里加一个currency,并让AI自动识别文本中的货币符号(¥、$、€)。如果遇到混合货币,可以让AI根据上下文决定,或者输出时带上多个货币字段。
注意事项
- 输入文本的质量:新闻摘要通常干净,但如果是OCR后的PDF文字可能有乱码,先做预处理。
- 大模型风险:GPT-4o和Claude 3.5对这类提取任务表现很好,但免费模型可能格式不稳定。建议先用示例测试一次,再批量用。
- 不要过度依赖:财报有时有特殊项目(比如“non-GAAP”),需要你手动审核数值是否准确。这个Prompt只适合快速预览,不适合审计。
试试把上面模板里的{{输入文本}}换成你手头的财报新闻,跑一次就知道多省时间了。
如果你觉得单个JSON不够,想直接生成表格,改输出为Markdown表格即可,类似思路。