文件内容
references/table_patterns.md
# 常见财报表格模板
> 用于在抽取后做 schema 推断与异常检测(如行项数明显偏少时提示可能漏抽)。
## 模板 1:合并资产负债表(A 股标准格式)
| 项目 | 期末余额 | 期初余额 |
|------|---------|---------|
| **流动资产** | | |
| 货币资金 | | |
| 交易性金融资产 | | |
| 应收账款 | | |
| 存货 | | |
| 流动资产合计 | | |
| **非流动资产** | | |
| 长期股权投资 | | |
| 固定资产 | | |
| 无形资产 | | |
| 非流动资产合计 | | |
| **资产总计** | | |
**结构特征**:
- 两列数值(期末/期初);偶有四列(合并/母公司 × 期末/期初)
- 含 2 级层级(大类 + 行项)
- 必有"合计"行作为校验锚点(合计 = 子项之和)
## 模板 2:合并利润表
| 项目 | 本期金额 | 上期金额 |
|------|---------|---------|
| 一、营业收入 | | |
| 减:营业成本 | | |
| 营业税金及附加 | | |
| 销售费用 | | |
| 二、营业利润 | | |
| 加:营业外收入 | | |
| 三、利润总额 | | |
| 减:所得税费用 | | |
| 四、净利润 | | |
**结构特征**:
- 使用"一、二、三、四"作为段落标识
- "减:" / "加:" 前缀是符号信号
- 与负数识别相关(如 `(123)` 是减项)
## 模板 3:现金流量表
经营 / 投资 / 筹资三段固定结构。每段以"小计"结束,全表以"现金及现金等价物净增加额"收尾。
## 跨页表格识别启发式
- 续表关键词:`(续)` / `(续)` / `Continued` / 紧接的页码 + 表头重复
- 跨页判定:当前页末尾未出现"合计"行,且下一页第一行结构与本页表头一致