文件预览

table_patterns.md

查看 pdf-fin-parse 技能包中的文件内容。

文件内容

references/table_patterns.md

# 常见财报表格模板

> 用于在抽取后做 schema 推断与异常检测(如行项数明显偏少时提示可能漏抽)。

## 模板 1:合并资产负债表(A 股标准格式)

| 项目 | 期末余额 | 期初余额 |
|------|---------|---------|
| **流动资产**         |   |   |
| 货币资金             |   |   |
| 交易性金融资产       |   |   |
| 应收账款             |   |   |
| 存货                 |   |   |
| 流动资产合计         |   |   |
| **非流动资产**       |   |   |
| 长期股权投资         |   |   |
| 固定资产             |   |   |
| 无形资产             |   |   |
| 非流动资产合计       |   |   |
| **资产总计**         |   |   |

**结构特征**:
- 两列数值(期末/期初);偶有四列(合并/母公司 × 期末/期初)
- 含 2 级层级(大类 + 行项)
- 必有"合计"行作为校验锚点(合计 = 子项之和)

## 模板 2:合并利润表

| 项目 | 本期金额 | 上期金额 |
|------|---------|---------|
| 一、营业收入 |   |   |
| 减:营业成本 |   |   |
| 营业税金及附加 |   |   |
| 销售费用 |   |   |
| 二、营业利润 |   |   |
| 加:营业外收入 |   |   |
| 三、利润总额 |   |   |
| 减:所得税费用 |   |   |
| 四、净利润 |   |   |

**结构特征**:
- 使用"一、二、三、四"作为段落标识
- "减:" / "加:" 前缀是符号信号
- 与负数识别相关(如 `(123)` 是减项)

## 模板 3:现金流量表

经营 / 投资 / 筹资三段固定结构。每段以"小计"结束,全表以"现金及现金等价物净增加额"收尾。

## 跨页表格识别启发式

- 续表关键词:`(续)` / `(续)` / `Continued` / 紧接的页码 + 表头重复
- 跨页判定:当前页末尾未出现"合计"行,且下一页第一行结构与本页表头一致