用大模型写论文越来越常见了。但有一个问题始终让人不放心: ** 参考文献。 **
AI 非常擅长编造看起来很真的假文献——作者名、期刊名、年份、甚至 DOI 都像模像样,但去搜的时候发现根本不存在。这就是所谓的"文献幻觉"。
被导师发现一条假文献,比没写这篇论文还丢脸。被审稿人发现就更惨了。
** 所以,参考文献必须审计。但一条条手动去查,又太慢了。 **
今天开源一个 Skill: ** ai4scholar-文献审计助手 ** 。一句话触发,9 类审计任务自动跑,关键是——它能联网验证文献是否真实存在。
它能做什么
三个阶段,九类审计:
第一阶段:内部一致性
| 任务 | 说明 |
|---|---|
| 交叉引用匹配 | 正文里引了 Smith (2020),列表里有没有?列表里有但正文没引的,也标出来 |
| 格式一致性 | 你说用 APA 第 7 版,它就逐条检查标点、斜体、et al. 规则是否统一 |
| 作者姓名标准化 | "Smith, J." 和 "Smith, John" 不能混用——帮你找出来 |
第二阶段:元数据校验
| 任务 | 说明 |
|---|---|
| DOI/URL 验证 | 格式对不对? ** 能不能真正解析到论文? ** (联网验证) |
| 期刊名核查 | "Nature Communications" 和 "Nat. Commun." 不能在同一篇里混着用 |
| 年份与卷期逻辑 | 2025 年的论文出现在 Vol.50,但这本期刊 2025 年才到 Vol.48——逻辑矛盾 |
| 完整性检测 | 缺页码、缺出版社、缺年份——按文献类型检查必填字段 |
第三阶段:伦理与质量
| 任务 | 说明 |
|---|---|
| 重复检测 | 同一篇文献被列了两次(可能改投时合并出错) |
| 自引率分析 | 客观统计自引比例,提前发现审稿人可能质疑的问题 |
关键能力:联网验证文献真实性
跟其他"格式检查"类工具的最大区别是: ** 这个 Skill 可以联网验证文献是否真实存在。 **
它通过 ai4scholar API 调用 Semantic Scholar(覆盖 2 亿+ 论文)和 PubMed 数据库,拿到你给的 DOI 或论文标题,然后:
- 1. 验证 DOI 是否能解析到真实论文
- 2. 比对返回的标题、作者、年份和你列表中的是否匹配
- 3. 对比结果分三级:
✅ DOI 有效且信息匹配
⚠️ DOI 格式正确但无法验证(可能需要人工确认)
❌ DOI 无效 / 信息严重不匹配(疑似虚假文献)
** 这一步是纯文本审计做不到的。 ** 格式再标准,DOI 再好看,如果在数据库里查不到,那就是假的。
怎么用
在 OpenClaw / Hermes Agent 中
安装 Skill:
openclaw skills install ai4scholar/reference-check
然后在对话中:
@文献审计 帮我全面审计一下这篇论文的参考文献,格式是 APA 第 7 版
它会自动执行所有适用的审计任务,最后输出一份完整报告。
也可以只做某一项:
@文献审计 验证这些文献的 DOI 是否真实存在
@文献审计 检查正文引用和参考文献列表是否一一对应
@文献审计 统计一下自引率
@文献审计 帮我看看有没有重复的文献
在 MCP 客户端中(Cursor / Claude Code)
如果你配置了 ai4scholar MCP,直接跟 AI 说:
帮我审计一下这篇论文的参考文献,检查 DOI 是否真实
AI 会调用 search_semantic 或 get_semantic_paper_detail 来验证每一条文献的真实性。
输出长什么样
给一个完整审计的输出示例:
📋 参考文献审计报告
━━━ 交叉引用匹配 ━━━
正文引用:24 | 列表条目:26 | 匹配率:92%
❌ [15] Liu et al. (2022) 正文引用但列表中缺失
⚠️ [25] Brown et al. (2020) 列表中存在但正文未引用
⚠️ [26] Zhang (2021) 列表中存在但正文未引用
━━━ 格式一致性(APA 7) ━━━
❌ [7] et al. 误用:APA 7 要求前 20 位作者全部列出
❌ [12] 页码使用连字符 "-" 应改为 en dash "–"
⚠️ [19] DOI 缺少 https://doi.org/ 前缀
━━━ DOI 验证(联网) ━━━
已验证:26 条
✅ 有效:23 | ⚠️ 待确认:1 | ❌ 无效:2
❌ [9] doi:10.1234/fake-2022-001 → 无法解析,疑似虚假文献
❌ [21] doi:10.5678/nonexist → 无法解析,疑似虚假文献
━━━ 完整性检测 ━━━
⚠️ [3] 期刊论文缺少期号
⚠️ [18] 会议论文缺少页码
━━━ 审计摘要 ━━━
总条目:26
✅ 通过:20 | ❌ 严重问题:4 | ⚠️ 建议修改:5
重点关注:
→ [9] 和 [21] 的 DOI 无法验证,强烈建议人工核实原始来源
→ [15] 正文引用但列表缺失,需补充
联网验证需要什么
联网验证功能需要 ai4scholar API Key:
- 1. 注册
- 2. 获取 API Key
- 3. 在 Skill 设置中配置 Key,或在 MCP 配置中填入
离线审计(格式检查、交叉引用、重复检测等)不需要 Key,直接就能用。
开源地址
Skill 已开源
同仓库还有其他几个学术 Skill:
- • ** 排版助手 ** :参考文献格式化、三线表、摘要润色、换投适配
- • ** 审稿助手 ** :五位顶刊审稿人组成的预审委员会
- • ** 引言助手 ** :五步"逻辑漏斗"写引言
- • ** 全文搜索 ** :在 2 亿+ 论文正文中搜索
最后
AI 帮你写论文是好事。但 AI 编的假文献是定时炸弹。
** 写完论文,跑一遍文献审计,确认每一条都是真的。 ** 这不是可选步骤——是底线。
格式能不能过、DOI 对不对、有没有重复——交给 Skill 自动跑。你只需要处理它标出来的 ❌ 和 ⚠️。
_ 用 AI 写论文的同学,建议转给你的合作者。参考文献出问题,全组的人都不好看。 _