文件预览
QUICKSTART.md

查看 Huo15 Img Prompt 技能包中的文件内容。
返回技能详情下载技能包打开来源页
文件内容
QUICKSTART.md

# 快速上手 — 三层级

> 30 秒 / 5 分钟 / 30 分钟，按你想投入的时间往下读。

## 0. 首次安装后先跑这个

```bash
python3 scripts/doctor.py --quick
```

会告诉你：

- 14 个脚本是否都能 import + 版本是否一致
- 哪些 API key 已配 / 缺哪些（按需）
- Obsidian vault 检测到没
- 持久化资产盘点（characters / sessions / brand_kits / learned_presets）

如果看到 `✗ ANTHROPIC_API_KEY 未设置（必填）`，先：

```bash
export ANTHROPIC_API_KEY=sk-ant-xxx     # 把 sk-ant-xxx 换成你的真实 key
# 或写到 ~/.zshrc / ~/.bashrc
```

---

## 30 秒：第一条命令

```bash
scripts/enhance_prompt.py "一只赛博朋克的猫" -p 赛博朋克 -m Midjourney
```

复制 `✅ 正向提示词` 那段，粘贴到 Midjourney/Discord，回车出图。

完了，就这么简单。

---

## 5 分钟：基础工作流

### Step 1: 选预设（不知道选哪个 → 让 Claude 推荐）

```bash
scripts/enhance_prompt.py "温柔治愈感的画面" --suggest
```

Claude 会从 88 预设里挑 top 3，附评分 + 适合场景。

### Step 2: 出图

```bash
# 基础（自己挑预设）
scripts/enhance_prompt.py "咖啡馆窗边的少女" -p 胶片摄影 -m Midjourney

# 混合两种风格（v3.0 特性）
scripts/enhance_prompt.py "持剑女侠" -p "赛博朋克+水墨" --mix 0.6 -m SDXL

# A/B 测试出 4 个变体（同 seed，不同 mood/composition）
scripts/enhance_prompt.py "夜晚街景" -p 电影感 --variants 4 -j > /tmp/variants.json
```

### Step 3: 保存常用资产

```bash
# 角色卡（跨调用保持一致）
scripts/enhance_prompt.py "银发机甲少女, twin tails, glowing visor" \
    -p 动漫 --character-sheet --save-char silver_mecha

# 后续直接用
scripts/enhance_prompt.py "在霓虹街头" --char silver_mecha
scripts/enhance_prompt.py "在花海中" --char silver_mecha
# → 自动锁 seed，三张图角色一致
```

### Step 4: 看预设示例图

```bash
scripts/enhance_prompt.py --examples 敦煌壁画
# 输出 5 平台搜索 URL（Lexica / Civitai / Pinterest / Google / Unsplash）
```

---

## 30 分钟：完整工作流

### A. 端到端品牌 KV（食谱 1）

```bash
# 1. 导入示例品牌套件
cat examples/brand_kit-song_tea.json | scripts/brand_kit.py --import

# 2. 用品牌套件 + 智能润色 + 闭环迭代
scripts/auto_iterate.py "宋韵茶饮品牌主视觉，一杯热茶，远山轮廓" \
    -p "汉服写真+水墨" \
    --backend dalle \
    --target 7.5 \
    --max-rounds 3
# → Claude Vision 五维评审，分数 < 7.5 自动改 prompt 重出
```

### B. 学习自己喜欢的风格

```bash
# 给 N 张参考图（你自己拍的、收藏的）
scripts/style_learn.py --name 我的小清新 \
    refs/morning_cafe.jpg \
    refs/sunset.jpg \
    refs/quiet_corner.jpg \
    refs/film_kodak.jpg

# 后续用 @ 前缀调用
scripts/enhance_prompt.py "猫咪坐在窗台" -p "@我的小清新"
```

### C. 短片故事板（v3.0 杀手 feature）

```bash
# 输入剧本 → Claude 拆 6 关键帧 + 5 个转场
scripts/storyboard.py < examples/storyboard-cat_rainy_night.txt \
    -p 电影感 --scenes 6 \
    -m Midjourney --video-model Sora \
    --output ./renders/cat_rainy_night
```

输出（在 `./renders/cat_rainy_night/`）：

- `storyboard.json` 完整数据
- `scene-{01-06}-t2i.txt` 6 个关键帧 T2I prompt
- `transition-{xx-to-yy}-t2v.txt` 5 个转场 T2V prompt
- `README.md` 可读总览

把 6 个 scene prompt 喂 Midjourney，5 个 transition prompt 喂 Sora，剪辑串联即得 ~30 秒短片。

### D. 在 IDE 里直接用（Claude Code / Cursor）

注册到 `~/.claude/mcp.json`：

```json
{
  "mcpServers": {
    "huo15-img-prompt": {
      "command": "python3",
      "args": ["/path/to/huo15-img-prompt/scripts/mcp_server.py"]
    }
  }
}
```

然后在 Claude Code：

```
> @huo15-img-prompt 帮我给落地页做 hero 图，主题是"AI 编程助手"，要科技感但温暖
```

Claude Code 会自动调链路：suggest_presets → polish_prompt → enhance_prompt → review_image。

### E. 本地 Web UI

```bash
python3 scripts/web_ui.py
# 自动开浏览器到 http://127.0.0.1:7155
```

可视化 88 预设、实时 prompt 预览、一键复制。

### F. 把 recipe 沉淀到 Obsidian

```bash
scripts/enhance_prompt.py "..." --obsidian
# 自动写入 ~/knowledge/huo15/图集/ 或 OBSIDIAN_VAULT 指定位置
# 含完整 frontmatter + 复现命令
```

---

## 常见问题

### Q1: 我没有 ANTHROPIC_API_KEY，能用吗？

可以。**80% 功能不依赖 Claude**：
- ✅ enhance_prompt（88 预设 / 五锁 / 混合 / variants / compact）
- ✅ enhance_video（视频提示词）
- ✅ reverse_prompt（参考图反解，metadata 模式）
- ✅ render_prompt（10 后端直出，需要对应后端的 key）
- ✅ safety_lint（红线检测，纯本地词典）
- ✅ character / brand_kit（持久化）
- ✅ web_ui / mcp_server

需要 ANTHROPIC_API_KEY 的：
- ❌ claude_polish（智能润色）
- ❌ image_review（VLM 评审）
- ❌ auto_iterate（闭环迭代）
- ❌ storyboard（剧本拆分）
- ❌ style_learn（风格学习）
- ❌ --suggest 推荐预设

### Q2: 我能在 Anaconda 环境里用吗？

可以，纯标准库，没有第三方依赖。任何 Python 3.8+ 环境都行。

### Q3: 哪些后端最值得配？

- **入门**：DALL-E 3（OPENAI_API_KEY，质量稳定，文字渲染好）
- **省钱**：本地 ComfyUI / SD WebUI（一次性下载模型，永久免费）
- **国产场景**：字节即梦（ARK_API_KEY，中文场景效果好）
- **快速试**：Replicate flux-schnell（REPLICATE_API_TOKEN，4 步出图）

### Q4: 14 个脚本太多，我从哪 3 个开始？

1. `enhance_prompt.py` — 这是核心，所有路径都从它开始
2. `doctor.py` — 出问题先跑这个
3. `web_ui.py` — 不想敲命令的时候用

剩下的按需：要出图 → render_prompt；要短片 → storyboard；要做品牌一致 → brand_kit。

### Q5: 出来的 prompt 太长，SDXL 会截断怎么办？

```bash
scripts/enhance_prompt.py "..." -m SDXL --compact
# 自动压缩到 CLIP 77 token 内
```

### Q6: 我之前的图想改一改，prompt 丢了

```bash
scripts/reverse_prompt.py 你的图.png
# 自动从 PNG metadata 提取 A1111/ComfyUI/NovelAI 三种格式的 prompt
```

如果图没 metadata：

```bash
scripts/reverse_prompt.py 你的图.png --vlm
# 输出标准 VLM 模板，复制给 GPT-4o / Claude Sonnet 4.5 / Gemini 即可
```

---

## 下一步

- 完整 88 预设：`scripts/enhance_prompt.py -l --with-examples`
- 食谱书：[RECIPES.md](RECIPES.md)
- 完整 CLI：每个脚本都有 `-h` / `--help`

有问题先跑 `doctor.py`，再到 [https://clawhub.ai/skills/huo15-img-prompt](https://clawhub.ai/skills/huo15-img-prompt) 看 issue。