文件内容
SKILL.md
---
name: english-assessment
version: "2.1.0"
description: >
交互式英语水平快速测评工具。大学英语水平(CEFR B1-C1),随机生成题卷(默认20-40题或快速18题,6-8种题型,总分100分),
逐题作答,全程静默判分,最后输出得分与弱项分析。支持错题集、错题重测、查看错题讲解。内容覆盖各专业领域。
触发词:开始英语测评 / 英语测试 / 测一下英语 / 英语水平测评 / 快速测评 / 错题重测 / 看错题 / 学习进度 / 进步曲线
NOT for:英语教学、英语聊天、翻译工具
---
# 英语测评
交互式英语水平快速测评。支持默认测评、快速测评、错题重测三种模式,全程静默判分,最后输出得分与弱项分析。
## 核心原则
1. **严格评分**:不给同情分,具体扣分标准见「评分规则」
2. **静默判分**:每题作答后只出下一题,不反馈对错、不显示得分、不解释知识点
3. **随机题卷**:每次测评开始时随机确定题数、题型组合、分值分配,总分固定100分
4. **测评隔离**:测评进行中,用户发非测评相关消息时,回复"当前正在英语测评中,如需退出请发送「退出测评」",不执行其他指令。想执行其他操作必须先退出测评
5. **可退出**:用户说"退出测评"/"结束测评"/"不做了"→ 立即按已完成题目生成报告
6. **错题持久化**:错题存入本地文件,支持错题重测和查看讲解
7. **成绩归档**:每次测评成绩存入本地文件,支持学习进度分析
## 错题集
### 存储
- **文件路径**:`/tmp/english-assessment-wrong.json`
- **格式**:
```json
{
"records": [
{
"id": "uuid",
"type": "英译中词汇",
"dimension": "词汇量",
"question": "implement",
"user_answer": "重要的",
"correct_answer": "实施/执行",
"explanation": "implement 作动词表示「实施、执行」,如 implement a policy(实施政策)",
"added_at": "2026-05-25T19:00:00+08:00",
"source": "default"
}
]
}
```
### 限制与清理
- **数量上限**:最多保留 200 条错题,超出时按时间淘汰最早的
- **时间上限**:超过 30 天的错题自动清理
- **每次测评结束时**:检查并清理超限数据
- **去重**:同一题目(question 字段相同)不重复添加,只更新最新一次的错误答案和时间
### 错题重测
用户说"错题重测"时:
1. 读取错题集文件
2. 如果错题数 < 5 → 提示"错题不足5道,暂不支持错题重测,先完成一次测评吧"
3. 如果错题数 ≥ 5 → 从错题集中随机抽取 10 道出题
4. 评分规则同正常测评,满分 100 分(每题 10 分)
5. **答对的题从错题集中移除**
6. 答错的题保留在错题集中
7. 如果中途错题集被清空(全部答对),提前结束并提示"恭喜,错题已全部掌握!🎉",输出测评报告
### 查看错题
用户说"看错题"时:
1. 读取错题集文件
2. 如果没有错题 → 提示"暂无错题记录"
3. 每次展示最多 10 条,格式:
```
📝 你的错题(第 1-10 条,共 X 条)
1. 【英译中词汇】implement
❌ 你的答案:重要的
✅ 正确答案:实施/执行
💡 implement 作动词表示「实施、执行」,如 implement a policy(实施政策)
2. ...
```
4. 如果还有更多 → 提示"发送「继续看错题」查看下一页"
5. 发送「继续看错题」→ 展示下 10 条
## 成绩归档
### 存储
- **文件路径**:`/tmp/english-assessment-history.json`
- **格式**:
```json
{
"records": [
{
"date": "2026-05-25T19:00:00+08:00",
"mode": "default",
"score": 76,
"duration_min": 18,
"weakness": ["词汇量", "语法"],
"breakdown": {
"词汇量": {"score": 12, "max": 35, "accuracy": "34%"},
"语法": {"score": 18, "max": 32, "accuracy": "56%"},
"翻译能力": {"score": 22, "max": 28, "accuracy": "79%"},
"商务表达": {"score": 15, "max": 28, "accuracy": "54%"},
"阅读理解": {"score": 9, "max": 10, "accuracy": "90%"}
}
}
]
}
```
### 规则
- **只保存**:日期、测评模式、得分、时长、弱项维度、各维度得分率
- **不保存**:具体题目、错题内容、改进措施、学习建议、题目数量
- **无上限**:长期保留,用于学习进度分析
- 每次测评结束后自动追加一条记录
### 学习进度分析
用户说"学习进度"或"进步曲线"时:
1. 读取成绩归档文件
2. 如果记录 < 2 → 提示"至少完成2次测评才能分析进度"
3. 输出分析报告:
```
📈 学习进度分析(共 X 次测评)
📊 得分趋势:
| 日期 | 模式 | 得分 | 时长 | 弱项 |
|---|---|---|---|---|
| 5/25 | 默认 | 76 | 18min | 词汇量、语法 |
| 5/28 | 快速 | 82 | 10min | 语法 |
| 6/01 | 默认 | 85 | 15min | 商务表达 |
✅ 进步:得分从 76 → 85(+9),时长从 18min → 15min(-3min)
⚠️ 持续弱项:语法连续3次为弱项,建议重点攻克
🔥 最好维度:阅读理解(稳定90%+)
```
## 测评流程
### 开始阶段
用户说"开始英语测评"时,按以下逻辑判断模式:
1. **读取错题集**,统计错题数量
2. 如果错题数 ≥ 20 → 先问用户:"你的错题集有 X 道错题,要清理错题集吗?(清理=清空全部 / 保留 / 先做错题重测)"
3. 等用户回复后,再进入模式选择
4. 输出模式选择:
```
🎯 请选择测评模式:
1️⃣ 默认测评 — 20-40 题,全面评估
2️⃣ 快速测评 — 约 18 题,快速出分
回复 1 或 2 开始
```
5. 如果错题数 ≥ 5,额外显示:`3️⃣ 错题重测 — 10 道错题专项练习`
6. 用户选择后开始出题
### 答题阶段
用户作答 → 静默记录得分 → 直接出下一题:
```
📝 第 X/X 题 【题型】(X分)
[题目内容]
```
**关键**:不作任何反馈,不显示"正确/错误",不显示累计分数,不解释知识点。
**得分记录**:每道题作答后,必须立即在后台维护得分记录,记录每题的题型、题目、用户答案、正确答案、得分、归属维度。测评结束时直接汇总,禁止凭记忆估算分数。
### 非答案回复处理
用户回复内容不是对题目的作答(如闲聊、提问、无关内容)→ 该题记0分,直接出下一题,不作额外提醒。
### 退出/完成
- 全部答完 → 输出测评报告 + 更新错题集
- 中途"退出测评" → 按已完成题目输出报告 + 更新已完成题目的错题集
- 用户说"跳过" → 该题记0分,出下一题
## 题卷生成规则
### 默认测评
1. **题数**:20-40题,随机确定
2. **题型**:从题型池中随机选6-8种,**每种选中的题型至少出1题**,句子改错最多出2题,情景对话补全最多出2题
3. **分值分配**:
- 主观题(英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写):单题5-10分
- 半主观题(语法填空、句子改错、介词搭配):单题3-5分
- 客观题(选择题、选词填空):单题2-4分
- **主观题总分占比30%-60%**
- 所有题目分值之和 = 100分
4. **分值校验**:生成题卷后检查分值总和,如不等于100分,调整最后一题的分值使其凑整
### 快速测评
1. **题数**:约18题,随机确定(16-20题范围)
2. **题型**:从题型池中随机选4-6种
3. **分值分配**:
- 客观题:单题3-5分
- 半主观题:单题5-7分
- 主观题:单题8-12分
- 所有题目分值之和 = 100分
4. 其余规则同默认测评
### 通用规则
1. **题目顺序**:先易后难,客观题在前,主观题在后
2. **内容范围**:
- 约30%专业领域词汇/场景(科技、医学、法律、金融、文学、工程、艺术等,随机混合)
- 约70%通用/学术基础词汇(日常表达、学术写作、基础语法)
- 中译英翻译题中商务场景占比约30%-40%
- 可通过联网搜索获取真实英语题目或专业术语
- **联网搜题失败时**:使用 AI 自身知识出题,不依赖外部搜索
3. **难度**:CEFR B1-C1,基础题约占30%,中高级题约占70%。词汇和语法考点偏向实际应用和专业场景,少出简单题
4. **不重复**:同一测评中不出现重复考点。尽量扩大题库,避免多次测评出现相同题目
5. **情景对话补全**:尽量设计成**选择题形式**(给出4个选项),减少需要用户手动输入长句的情况。基础单词仍需手动输入
### 题型池(12种)
| # | 题型 | 出题格式 | 评分方式 |
|---|------|---------|---------|
| 1 | 英译中词汇 | 给英文单词/短语,翻译成中文 | 主观 |
| 2 | 中译英词汇 | 给中文,翻译成英文 | 主观 |
| 3 | 语法填空 | 含空格的英文句子,填正确形式 | 半主观 |
| 4 | 选择题 | 四选一(语法/词汇/表达) | 客观 |
| 5 | 中译英翻译 | 翻译中文为英文(商务场景为主,兼顾其他场景) | 主观 |
| 6 | 阅读理解 | 短文+1-2个问题 | 客观/主观 |
| 7 | 句子改错 | 找出并改正语法错误 | 半主观 |
| 8 | 选词填空 | 词库+短文空格 | 客观 |
| 9 | 同义词替换 | 给词/短语,写近义表达 | 主观 |
| 10 | 情景对话补全 | 对话场景,四选一补全回应(优先选择题形式) | 客观/主观 |
| 11 | 介词搭配 | 选择/填写正确介词 | 客观/半主观 |
| 12 | 句子改写 | 用指定句型重写句子 | 主观 |
## 评分规则
### 客观题(选择题、选词填空、情景对话补全选择题)
- 正确 = 满分,错误 = 0分
### 半主观题(语法填空、句子改错、介词搭配)
- 完全正确 = 满分
- 词根对但形式错(如时态)= 扣1分
- 找到错误但改错 = 得一半分
### 主观题(英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写)
- 意思完全正确且表达地道 = 满分
- 意思对但表达不地道 = 扣1-2分
- 意思接近但不精确 = 扣2-3分
- 拼写错误但不影响理解 = 每处扣1分
- 语法错误 = 每处扣1分
- 遗漏关键信息 = 每处扣2分
- 意思完全不对 = 0分
**注意**:翻译题必须意思准确才算对。如 deadline 翻译成"大地"= 0分。
## 测评报告
全部完成或退出后输出:
```
## 🏅 XX 分 — [等级]
📊 答题:X/X 题 | ⏱ 测评时长:约XX分钟
---
📈 分项得分:
| 维度 | 得分 | 满分 | 正确率 | 评价 |
|---|---|---|---|---|
| 词汇量 | X | X | X% | 强/中/弱 |
| 语法 | X | X | X% | 强/中/弱 |
| 翻译能力 | X | X | X% | 强/中/弱 |
| 商务表达 | X | X | X% | 强/中/弱 |
| 阅读理解 | X | X | X% | 强/中/弱 |
等级说明:
- 90-100 ⭐ 优秀 — 英语能力扎实,可应对专业场景
- 75-89 ✅ 良好 — 基础扎实,部分领域需加强
- 60-74 ⚠️ 中等 — 有一定基础,需要系统提升
- 40-59 📖 及格 — 基础薄弱,建议从基础学起
- 0-39 💪 需加强 — 建议从零开始系统学习
🔍 弱项分析:
1. [最弱维度]:具体问题 + 改进建议
2. [次弱维度]:具体问题 + 改进建议
💡 学习建议:
- [针对弱项的具体学习方向]
- [推荐资源或方法]
📝 错题详情:
| # | 题型 | 题目 | 你的答案 | 正确答案 | 得分 |
|---|---|---|---|---|---|
| 1 | 英译中词汇 | deadline | 大地 | 截止日期 | 0/3 |
| ... |
(如需查看全部答题记录,请发送「查看全部答题」→ 收到后输出含所有题目的完整答题表格)
```
## 约束
- 测评期间**不反馈对错和得分**,只出下一题
- 测评期间**不处理其他指令**,必须先退出测评再执行其他操作。测评中说"看错题"按非答案回复处理(记0分出下一题),需退出后再查看
- 非答案回复 → 该题记0分,出下一题
- "跳过" → 记0分,出下一题
- "退出测评" → 立即按已完成题目生成报告
- 每道题只等一次回复,不追问
- 每次测评题目不同,不使用固定题库,尽量扩大题目多样性
- 测评进行中再次说"开始英语测评" → 提示先退出当前测评
- 情景对话补全优先用选择题形式,减少长句输入
- 错题集每道题必须附带简短讲解(explanation 字段)
- 成绩归档只存得分和弱项,不存具体题目和错题