文件预览

USAGE.md

查看 1688 Scraper 技能包中的文件内容。

文件内容

USAGE.md

# 1688 商品采集 - 快速使用指南

## 🚀 一句话使用

```
采集 1688 商品:https://detail.1688.com/offer/{商品 ID}.html
```

## 📦 输出内容

采集完成后,桌面会生成两个文件:

1. **图片文件夹** `1688-商品详情-{商品 ID}-图片/`
   - 所有商品原图(主图 + 详情图)
   - 按序号命名:01.webp, 02.webp, 03.jpg...

2. **JSON 数据包** `1688-商品详情-{商品 ID}.json`
   ```json
   {
     "商品 ID": "968110925640",
     "商品标题": "...",
     "本地图片路径": "/Users/xxx/Desktop/...",
     "图片总数": 24,
     "商品图片 URLs": [...],
     "店铺信息": {...},
     "价格信息": {...},
     "SKU 详情": {...}
   }
   ```

## ⚙️ 技术细节

### 采集流程
1. 打开商品页面
2. 深度滚动(30 步 × 1000px)触发懒加载
3. Performance API 捕获所有图片资源
4. 清理 URL 后缀获取原图
5. 批量下载图片
6. 采集商品信息
7. 保存 JSON 数据包

### 关键配置
- 滚动步数:30 步
- 每步等待:400ms
- 图片过滤:仅保留 `cbu01.alicdn.com/img/ibank` 域名

## 📊 采集内容清单

| 类别 | 内容 |
|------|------|
| 基本信息 | 商品 ID、标题、URL |
| 店铺信息 | 店铺名称、评分、回头率、发货率 |
| 价格信息 | 价格区间、起批量 |
| 销售数据 | 已售数量、评价数、收藏数 |
| SKU 信息 | 颜色、尺码、库存、价格 |
| 商品图片 | 主图、SKU 图、详情图(全部原图) |
| 商品属性 | 面料、材质、品牌、货号等 |
| 发货信息 | 发货地、快递、退货政策 |

## 🔧 故障排查

### 图片数量不够
- 原因:懒加载未完全触发
- 解决:增加滚动步数或等待时间

### 图片都是 2KB 缩略图
- 原因:URL 后缀未清理
- 解决:检查 `_sum.jpg` 替换逻辑

### 浏览器超时
- 原因:页面加载慢或网络问题
- 解决:重启网关后重试

## 📝 更新日志

- **v1.0** (2026-03-24)
  - 初始版本
  - 支持完整图片采集
  - Performance API 捕获所有资源
  - 自动清理 URL 后缀