name: ai-writing-risk-review
description: 评估文章、作业、公众号稿、报告、评论、邮件或任意文本的 AI 写作、AI 辅助润色、人机混写或模板化写作风险,并输出证据化、克制、非定罪式判断。适用于用户要求判断是不是 AI 写的、检测 AI 痕迹、AI 写稿评估、查 AI 味、分析文本是否由 ChatGPT 或大模型生成、给出 AI 检测报告,或需要区分人写、AI 写、人机混写和 AI 改写的场景。
AI 写作风险评估
核心原则
AI 写稿检测只能输出风险评估,不能输出定罪式结论。除非用户提供可靠来源证明、生成日志、水印检测结果或作者承认,否则不要说“这一定是 AI 写的”。
优先给出证据链和限制条件:
- 区分“AI 生成风险”“AI 辅助修改风险”“模板化写作风险”“证据不足”。
- 把文本长度、体裁、语言、改写痕迹、作者基线和可核验证据写进结论。
- 不把礼貌、流畅、没有错别字、非母语表达、学术腔或公文腔单独当成 AI 证据。
- 对文章、公众号稿、报告、评论等长文本,同时检查信噪比:识别啰嗦铺垫、重复结论、低信息段落、过度均衡的解释和“正确但没新增信息”的句子,并给出提高信息密度的修订方向。
- 不帮助用户绕过检测器。可以给出提升真实表达、补充来源、增加作者判断和修订记录的建议。
执行清单
开始评估后用这张清单跟踪进度:
- [ ] 明确文本用途、风险场景和是否涉及处分、雇佣、版权、法律或学术诚信。
- [ ] 判断样本长度、体裁、改写/翻译/多人协作等可靠性限制。
- [ ] 分段记录强、中、弱证据,同时记录反证或可替代解释。
- [ ] 给出风险等级和证据强度,不把分数说成真实概率。
- [ ] 输出补证建议;面向发布文本时同步输出信噪比修订方向。
默认口径
- 默认只评估用户提供的文本,不推断作者身份、动机或真实创作过程。
- 默认优先给证据强度和样本限制,再给风险等级。
- 默认把“AI 辅助润色”“模板化写作”“人机混写”作为可替代解释,不强行二分人写或 AI 写。
- 默认建议补充写作过程、版本记录、资料来源和作者历史文本,而不是建议规避检测。
工作流程
- 明确上下文:
- 文本用途:公众号、作业、论文、报告、评论、邮件、简历等。
- 是否有作者历史文本、写作过程、引用来源、文档修订记录、发布平台记录或 AI 工具使用说明。
- 是否需要严格审查。涉及处分、雇佣、版权、法律或学术诚信时,必须强调不能只靠 AI 检测结论。
- 判断样本可靠性:
- 少于 300 个中文字符或 150 个英文词:只做弱提示判断。
- 300 到 800 个中文字符或 150 到 400 个英文词:可给初步风险,但证据强度通常较低。
- 超过 800 个中文字符或 400 个英文词:可分段评估并比较整体一致性。
- 高度改写、翻译、多人协作、模板公文、SEO 稿、摘要稿会显著降低判断可靠性。
- 分段检查证据。按以下维度记录强、中、弱信号:
- 语言模型统计特征:过度平滑、低意外度、句式和连接词分布过整齐。
- 爆发度和节奏:段落长度、句长、信息密度、情绪和视角变化是否机械稳定。
- 结构模板:总分总、清单、小标题、转折、结尾召唤是否像通用提示词模板。
- 语义具体度:是否缺少可追问的细节、时间地点、真实约束、例外和取舍。
- 信噪比:是否存在过长开场、重复安全话术、同义改写堆叠、段落只承接不推进、标题承诺大于正文信息量、结尾只复述前文等低信号内容。
- 事实与引用:是否有看似严谨但无法核验的来源、空泛数据、伪引用或“正确但无出处”的判断。
- 作者基线:与作者既有文本的词汇、句法、口头禅、错别字、观点锋利度、材料来源是否明显偏离。
- 外部证据:水印、平台溯源、文档修订历史、聊天记录、草稿版本、工具检测结果。
- 形成风险等级:
证据不足:文本太短、体裁太模板化或缺少上下文。低风险:有自然作者痕迹,AI 信号零散且可由体裁解释。中风险:多项 AI 信号一致,但缺少外部证据或作者基线。高风险:长文本中多项强信号稳定出现,并有外部证据、作者基线偏离或水印/日志支持。
- 输出报告。需要详细模板时读取
references/evaluation-template.md。 - 如果用户问“算法有哪些”或需要解释方法依据,读取
references/ai-detection-methods.md。
评估口径
把风险分数当作启发式评分,不当作概率。推荐使用 0 到 100 分:
- 0 到 29:低风险
- 30 到 59:中风险
- 60 到 79:高风险
- 80 到 100:高风险且证据强
分数只在同一任务内部辅助比较,不要声称它代表真实概率。
输出要求
默认用中文输出,除非用户要求其他语言。
报告必须包含:
- 结论一句话
- 风险等级和证据强度
- 样本限制
- 主要证据,按强弱排序
- 反证或可替代解释
- 下一步补证建议
- 面向发布文本时,额外给出信噪比检查:指出最该压缩、合并或删除的内容类型,并要求提升有效信息密度。建议应服务清晰表达和读者价值,不要包装成规避检测技巧。
避免输出:
- “百分百 AI”“确定作弊”“绝对人写”
- 仅凭 AI 味、套话、流畅度作结论
- 鼓励规避检测器的改写技巧
常见误用
- 不要把 AI 检测报告当作纪律处分、雇佣筛选、版权归责或法律判断的唯一依据。
- 不要用单个句子、标题、摘要或机器翻译片段下强结论。
- 不要因为文本“流畅、工整、礼貌、没有错别字”就判定高风险。
- 不要输出“如何改到检测不出来”;把建议写成提高真实性、信息密度和可核验性的修订方向。
验证闭环
交付前自检:
- 结论是否是风险判断,而不是定罪。
- 每条主要证据是否能指向文本中的具体表现。
- 是否写明样本限制和反证解释。
- 是否避免把风险分数表述为真实概率。
- 是否没有提供规避检测器的操作建议。
参考资料
按需读取:
references/ai-detection-methods.md:常见 AI 写稿检测算法、适用场景和局限。references/evaluation-template.md:检测报告模板、证据表和快速检查清单。