文件预览

QUICKSTART.md

查看 Huo15 Img Prompt 技能包中的文件内容。

文件内容

QUICKSTART.md

# 快速上手 — 三层级

> 30 秒 / 5 分钟 / 30 分钟,按你想投入的时间往下读。

## 0. 首次安装后先跑这个

```bash
python3 scripts/doctor.py --quick
```

会告诉你:

- 14 个脚本是否都能 import + 版本是否一致
- 哪些 API key 已配 / 缺哪些(按需)
- Obsidian vault 检测到没
- 持久化资产盘点(characters / sessions / brand_kits / learned_presets)

如果看到 `✗ ANTHROPIC_API_KEY 未设置(必填)`,先:

```bash
export ANTHROPIC_API_KEY=sk-ant-xxx     # 把 sk-ant-xxx 换成你的真实 key
# 或写到 ~/.zshrc / ~/.bashrc
```

---

## 30 秒:第一条命令

```bash
scripts/enhance_prompt.py "一只赛博朋克的猫" -p 赛博朋克 -m Midjourney
```

复制 `✅ 正向提示词` 那段,粘贴到 Midjourney/Discord,回车出图。

完了,就这么简单。

---

## 5 分钟:基础工作流

### Step 1: 选预设(不知道选哪个 → 让 Claude 推荐)

```bash
scripts/enhance_prompt.py "温柔治愈感的画面" --suggest
```

Claude 会从 88 预设里挑 top 3,附评分 + 适合场景。

### Step 2: 出图

```bash
# 基础(自己挑预设)
scripts/enhance_prompt.py "咖啡馆窗边的少女" -p 胶片摄影 -m Midjourney

# 混合两种风格(v3.0 特性)
scripts/enhance_prompt.py "持剑女侠" -p "赛博朋克+水墨" --mix 0.6 -m SDXL

# A/B 测试出 4 个变体(同 seed,不同 mood/composition)
scripts/enhance_prompt.py "夜晚街景" -p 电影感 --variants 4 -j > /tmp/variants.json
```

### Step 3: 保存常用资产

```bash
# 角色卡(跨调用保持一致)
scripts/enhance_prompt.py "银发机甲少女, twin tails, glowing visor" \
    -p 动漫 --character-sheet --save-char silver_mecha

# 后续直接用
scripts/enhance_prompt.py "在霓虹街头" --char silver_mecha
scripts/enhance_prompt.py "在花海中" --char silver_mecha
# → 自动锁 seed,三张图角色一致
```

### Step 4: 看预设示例图

```bash
scripts/enhance_prompt.py --examples 敦煌壁画
# 输出 5 平台搜索 URL(Lexica / Civitai / Pinterest / Google / Unsplash)
```

---

## 30 分钟:完整工作流

### A. 端到端品牌 KV(食谱 1)

```bash
# 1. 导入示例品牌套件
cat examples/brand_kit-song_tea.json | scripts/brand_kit.py --import

# 2. 用品牌套件 + 智能润色 + 闭环迭代
scripts/auto_iterate.py "宋韵茶饮品牌主视觉,一杯热茶,远山轮廓" \
    -p "汉服写真+水墨" \
    --backend dalle \
    --target 7.5 \
    --max-rounds 3
# → Claude Vision 五维评审,分数 < 7.5 自动改 prompt 重出
```

### B. 学习自己喜欢的风格

```bash
# 给 N 张参考图(你自己拍的、收藏的)
scripts/style_learn.py --name 我的小清新 \
    refs/morning_cafe.jpg \
    refs/sunset.jpg \
    refs/quiet_corner.jpg \
    refs/film_kodak.jpg

# 后续用 @ 前缀调用
scripts/enhance_prompt.py "猫咪坐在窗台" -p "@我的小清新"
```

### C. 短片故事板(v3.0 杀手 feature)

```bash
# 输入剧本 → Claude 拆 6 关键帧 + 5 个转场
scripts/storyboard.py < examples/storyboard-cat_rainy_night.txt \
    -p 电影感 --scenes 6 \
    -m Midjourney --video-model Sora \
    --output ./renders/cat_rainy_night
```

输出(在 `./renders/cat_rainy_night/`):

- `storyboard.json` 完整数据
- `scene-{01-06}-t2i.txt` 6 个关键帧 T2I prompt
- `transition-{xx-to-yy}-t2v.txt` 5 个转场 T2V prompt
- `README.md` 可读总览

把 6 个 scene prompt 喂 Midjourney,5 个 transition prompt 喂 Sora,剪辑串联即得 ~30 秒短片。

### D. 在 IDE 里直接用(Claude Code / Cursor)

注册到 `~/.claude/mcp.json`:

```json
{
  "mcpServers": {
    "huo15-img-prompt": {
      "command": "python3",
      "args": ["/path/to/huo15-img-prompt/scripts/mcp_server.py"]
    }
  }
}
```

然后在 Claude Code:

```
> @huo15-img-prompt 帮我给落地页做 hero 图,主题是"AI 编程助手",要科技感但温暖
```

Claude Code 会自动调链路:suggest_presets → polish_prompt → enhance_prompt → review_image。

### E. 本地 Web UI

```bash
python3 scripts/web_ui.py
# 自动开浏览器到 http://127.0.0.1:7155
```

可视化 88 预设、实时 prompt 预览、一键复制。

### F. 把 recipe 沉淀到 Obsidian

```bash
scripts/enhance_prompt.py "..." --obsidian
# 自动写入 ~/knowledge/huo15/图集/ 或 OBSIDIAN_VAULT 指定位置
# 含完整 frontmatter + 复现命令
```

---

## 常见问题

### Q1: 我没有 ANTHROPIC_API_KEY,能用吗?

可以。**80% 功能不依赖 Claude**:
- ✅ enhance_prompt(88 预设 / 五锁 / 混合 / variants / compact)
- ✅ enhance_video(视频提示词)
- ✅ reverse_prompt(参考图反解,metadata 模式)
- ✅ render_prompt(10 后端直出,需要对应后端的 key)
- ✅ safety_lint(红线检测,纯本地词典)
- ✅ character / brand_kit(持久化)
- ✅ web_ui / mcp_server

需要 ANTHROPIC_API_KEY 的:
- ❌ claude_polish(智能润色)
- ❌ image_review(VLM 评审)
- ❌ auto_iterate(闭环迭代)
- ❌ storyboard(剧本拆分)
- ❌ style_learn(风格学习)
- ❌ --suggest 推荐预设

### Q2: 我能在 Anaconda 环境里用吗?

可以,纯标准库,没有第三方依赖。任何 Python 3.8+ 环境都行。

### Q3: 哪些后端最值得配?

- **入门**:DALL-E 3(OPENAI_API_KEY,质量稳定,文字渲染好)
- **省钱**:本地 ComfyUI / SD WebUI(一次性下载模型,永久免费)
- **国产场景**:字节即梦(ARK_API_KEY,中文场景效果好)
- **快速试**:Replicate flux-schnell(REPLICATE_API_TOKEN,4 步出图)

### Q4: 14 个脚本太多,我从哪 3 个开始?

1. `enhance_prompt.py` — 这是核心,所有路径都从它开始
2. `doctor.py` — 出问题先跑这个
3. `web_ui.py` — 不想敲命令的时候用

剩下的按需:要出图 → render_prompt;要短片 → storyboard;要做品牌一致 → brand_kit。

### Q5: 出来的 prompt 太长,SDXL 会截断怎么办?

```bash
scripts/enhance_prompt.py "..." -m SDXL --compact
# 自动压缩到 CLIP 77 token 内
```

### Q6: 我之前的图想改一改,prompt 丢了

```bash
scripts/reverse_prompt.py 你的图.png
# 自动从 PNG metadata 提取 A1111/ComfyUI/NovelAI 三种格式的 prompt
```

如果图没 metadata:

```bash
scripts/reverse_prompt.py 你的图.png --vlm
# 输出标准 VLM 模板,复制给 GPT-4o / Claude Sonnet 4.5 / Gemini 即可
```

---

## 下一步

- 完整 88 预设:`scripts/enhance_prompt.py -l --with-examples`
- 食谱书:[RECIPES.md](RECIPES.md)
- 完整 CLI:每个脚本都有 `-h` / `--help`

有问题先跑 `doctor.py`,再到 [https://clawhub.ai/skills/huo15-img-prompt](https://clawhub.ai/skills/huo15-img-prompt) 看 issue。