文件内容
USAGE.md
# 1688 商品采集 - 快速使用指南
## 🚀 一句话使用
```
采集 1688 商品:https://detail.1688.com/offer/{商品 ID}.html
```
## 📦 输出内容
采集完成后,桌面会生成两个文件:
1. **图片文件夹** `1688-商品详情-{商品 ID}-图片/`
- 所有商品原图(主图 + 详情图)
- 按序号命名:01.webp, 02.webp, 03.jpg...
2. **JSON 数据包** `1688-商品详情-{商品 ID}.json`
```json
{
"商品 ID": "968110925640",
"商品标题": "...",
"本地图片路径": "/Users/xxx/Desktop/...",
"图片总数": 24,
"商品图片 URLs": [...],
"店铺信息": {...},
"价格信息": {...},
"SKU 详情": {...}
}
```
## ⚙️ 技术细节
### 采集流程
1. 打开商品页面
2. 深度滚动(30 步 × 1000px)触发懒加载
3. Performance API 捕获所有图片资源
4. 清理 URL 后缀获取原图
5. 批量下载图片
6. 采集商品信息
7. 保存 JSON 数据包
### 关键配置
- 滚动步数:30 步
- 每步等待:400ms
- 图片过滤:仅保留 `cbu01.alicdn.com/img/ibank` 域名
## 📊 采集内容清单
| 类别 | 内容 |
|------|------|
| 基本信息 | 商品 ID、标题、URL |
| 店铺信息 | 店铺名称、评分、回头率、发货率 |
| 价格信息 | 价格区间、起批量 |
| 销售数据 | 已售数量、评价数、收藏数 |
| SKU 信息 | 颜色、尺码、库存、价格 |
| 商品图片 | 主图、SKU 图、详情图(全部原图) |
| 商品属性 | 面料、材质、品牌、货号等 |
| 发货信息 | 发货地、快递、退货政策 |
## 🔧 故障排查
### 图片数量不够
- 原因:懒加载未完全触发
- 解决:增加滚动步数或等待时间
### 图片都是 2KB 缩略图
- 原因:URL 后缀未清理
- 解决:检查 `_sum.jpg` 替换逻辑
### 浏览器超时
- 原因:页面加载慢或网络问题
- 解决:重启网关后重试
## 📝 更新日志
- **v1.0** (2026-03-24)
- 初始版本
- 支持完整图片采集
- Performance API 捕获所有资源
- 自动清理 URL 后缀