文件预览

tool-assisted-search.md

查看 Article Image Research 技能包中的文件内容。

文件内容

references/tool-assisted-search.md

# 工具辅助找图规则

这个配图调研模块不绑定单一图片 API。只要当前环境提供合规能力,都可以用来发现候选图片。

## 可用能力

- LLM 内置网页搜索:适合快速发现官方页、报道页、图库页、报告 PDF 和 Wikimedia/Openverse 结果。
- 图片搜索:适合按视觉主题、人物、地点、产品、事件寻找候选。
- 浏览器:适合打开落地页,核验上下文、作者、授权、图注、图片尺寸和实际加载状态。
- 页面截图和视觉理解:适合判断图片主体、截图版本、图表内容、是否含人物、商标或敏感元素。
- DOM/网络资源检查:适合处理懒加载图片、`srcset`、CSS 背景图、轮播图和动态页面。
- AI 生图:适合在搜索不足或版权风险过高时生成概念化、抽象、非事实示意图。
- 本地脚本或 MCP/API:适合批量查询、统一字段、减少手工复制。

## 使用顺序

1. 先用搜索能力发现来源页面,而不是直接找孤立图片。
2. 打开高潜候选的落地页。
3. 记录页面标题、页面 URL、图片 URL、作者、授权、图注和附近正文。
4. 用视觉能力辅助判断主体和上下文是否匹配。
5. 对授权和事实做人工规则评分。
6. 搜索候选不足时,再评估是否需要 AI 生图。
7. 只把核验过的搜索图片或明确标记的 AI 生成图放入 `use` 或 `backup`。

## 浏览器核验清单

- 图片是否在页面中真实出现,而不是搜索引擎缓存或缩略图。
- 页面是否说明作者、来源、授权、发布日期或上下文。
- 图注或附近正文是否支持当前文章段落。
- 图片主体、时间、地点、人物、产品版本是否一致。
- 图片是否带水印、广告、logo、无关 UI 或误导性裁切。
- 图片直链是否稳定,是否有更合适的 `srcset` 大图。

## 视觉理解边界

视觉能力可以帮助判断:

- 图片里出现了什么主体。
- 是否是图表、截图、产品、人物、现场、文档或装饰图。
- 是否可能含敏感元素、商标、未成年人、医疗或事故画面。
- 截图中产品界面是否大致匹配正文描述。

视觉能力不能替代:

- 授权判断。
- 作者和来源确认。
- 新闻事件真实性核验。
- 图片拍摄时间、地点、人物身份的确定性判断。

## AI 生图边界

- 优先级低于搜索、官方来源、原文图片、开放授权图片和真实图库图片。
- 适合概念化封面、抽象场景、非事实示意图。
- 不适合事实证据、新闻现场、人物肖像、产品界面、报告图表、历史资料或争议事件。
- 输出时必须标记 `ai_generated: true`。
- 保留生成工具、提示词或生成说明,便于后续复核和重做。
- 图注不要暗示它是真实拍摄或真实事件现场。

## 搜索结果使用边界

- 搜索结果页、图片搜索缩略图和 CDN 直链只是发现入口。
- 推荐图必须回到原始落地页或可信来源页。
- 转载站、聚合站和无作者页面默认降权。
- 不能绕过登录、付费墙、反爬限制或站点条款。
- 全网搜索发现的图片没有明确授权时,默认只作为线索,不作为正文推荐图。

## 输出要求

使用任何工具找到图片后,仍然归一化为同一候选字段:

```json
{
  "provider": "browser | web_search | image_search | openverse | wikimedia | pexels | unsplash | brave | other",
  "discovery_method": "使用了什么工具或查询",
  "image_url": "图片 URL",
  "landing_url": "来源页 URL",
  "creator": "作者",
  "license": "授权",
  "ai_generated": false,
  "generation_prompt": null,
  "attribution": "归因或图注",
  "evidence_value": "支撑正文哪一段",
  "risk_flags": [],
  "decision": "use | backup | reject"
}
```