文件预览

configuration.md

查看 pdf-fin-parse 技能包中的文件内容。

文件内容

references/configuration.md

# 配置说明

## 依赖

`requirements.txt`(根目录):

```
PyMuPDF>=1.24.0     # 仅渲染 PDF→PNG,不抽内容
Pillow>=10.0.0
openai>=1.30.0      # OpenAI 兼容协议(ARK/Qwen/OpenAI/Ollama 均走这套)
```

安装:

```bash
cd skills/pdf-finance-parser
python3 -m venv .venv
.venv/bin/pip install -r ../../requirements.txt
```

## API Key

至少配置以下一组(按探测顺序):

| 优先级 | 环境变量组 | Provider |
|--------|------------|----------|
| 1 | `VLM_PROVIDER=ark` + `ARK_API_KEY` | ARK |
| 2(自动)| `ARK_API_KEY` | ARK |
| 3(自动)| `DASHSCOPE_API_KEY` | DashScope |
| 4(自动)| `OPENAI_API_KEY` | OpenAI |

详见 [env.sh.example](../env.sh.example)。

## env.sh 加载顺序

1. CLI `--env-file <path>`(**强制覆盖**已有 env)
2. skill 目录下的 `env.sh`(不覆盖)
3. 当前工作目录下的 `env.sh`(不覆盖)

把 `env.sh.example` 复制为 `env.sh`,填上 key 即可:

```bash
cp env.sh.example env.sh
$EDITOR env.sh
```

## 模型选择

| 场景 | 推荐 |
|------|------|
| 中文金融、A股年报 | `doubao-1.5-vision-pro`(ARK)|
| 中英文混合 / 港股 | `qwen-vl-max`(DashScope)|
| 英文 10-K | `gpt-4o`(OpenAI)|
| 离线 / 私有部署 | `qwen2.5-vl:7b`(Ollama)|

环境变量 `VLM_MODEL=...` 或 CLI `--model ...` 覆盖默认。

## DPI 选择

- `--dpi 150`:速度优先,文字版 PDF 够用
- `--dpi 200`(默认):平衡
- `--dpi 300`:扫描件 / 印章密集 / 小字号财报附注,建议升高

DPI 上调会增大 base64 图像,可能触及模型上下文上限——超过 300 dpi 前先小样验证。