今天把我的全文搜索技能开源了

上周一个做 NLP 的同学问我："你知不知道哪篇论文用了 learning rate 1e-4 加 cosine annealing 来训练 BERT？"

我说你去 Google Scholar 搜啊。

他说："搜了。搜出来一堆标题里带 BERT 的论文，但我怎么知道他们用的什么 learning rate？标题和摘要里不会写这些。"

他说的是对的。Google Scholar 搜不到这些——因为它只搜标题和摘要。

这个问题困扰我很久了，所以我接了 Ai4Scholar 的全文搜索 API，做了一个 Hermes Agent 技能，能直接搜论文正文。用了一段时间觉得还不错，今天把它开源了。

如果你还在用 OpenClaw，这个 Skill 也完全兼容——Hermes Agent 本身就支持从 OpenClaw 无缝迁移。

标题和摘要里没有的东西

你平时搜论文，用的是 Google Scholar、Semantic Scholar、Connected Papers 这些工具。它们都很好用——但它们有一个共同的限制：

只能搜标题和摘要。

标题是论文的"招牌"，摘要是论文的"电梯演讲"。它们告诉你这篇论文做了什么，但不会告诉你怎么做的。

具体的实验参数、训练配置、模型架构细节、消融实验的设置、数据预处理的步骤——这些全都藏在论文正文里。

而正文，是传统搜索引擎看不到的。

所以你才会遇到这种情况：

你想找"谁用了 dropout 0.1 的 Transformer"——搜不到，因为没人把 dropout rate 写进标题
你想找"batch size 32 下的训练效果对比"——搜不到，因为这是 Experiments 章节的内容
你想找"某个方法在特定数据集上的具体指标"——搜不到，因为数字在 Results 表格旁边的正文里
你想找"有没有人用 XXX 方法处理 YYY 问题"——搜到了，但搜出来的论文得一篇篇打开看正文才知道相不相关

搜论文和搜到你需要的信息，是两件事。

先说说 Hermes Agent

在介绍这个技能之前，先说一下 Hermes Agent——因为很多人可能还没听过。

Hermes Agent 是 Nous Research（一家专注 AI 研究的实验室）最近开源的 AI Agent 平台。简单说，它是一个能自己学习、自己成长的 AI 助手——你用得越多，它越懂你。GitHub 上已经 7 万多 star、1 万多 fork，热度比之前的 OpenClaw 还高。

它跟 ChatGPT 这类对话工具的区别在于：

它有技能系统：你可以给它装各种 Skill，让它具备特定能力——比如搜论文、写代码、分析数据。用完之后它还会自动把复杂任务提炼成新的 Skill，下次直接用。
它支持 200+ 模型：OpenAI、Claude、开源模型，随便切换。不绑定某一家。
它有长期记忆：跨会话记住你的偏好、你的研究方向、你的写作风格。
它能部署在任何地方：你的笔记本、5 美元的云服务器、GPU 集群都行。还能通过 Telegram、微信跟它对话。

如果你之前用过 OpenClaw，Hermes Agent 就是它的"全面升级版"。而且内置了一键迁移工具（hermes claw migrate），之前在 OpenClaw 上的记忆、技能、配置都能直接搬过来。

我现在的 ai4scholar 系列 Skill 都在 Hermes Agent 上开发和测试。当然，OpenClaw 和 Workbuddy 也完全兼容。

全文搜索：搜正文

回到正题。这就是我做这个 Skill 的原因。

@ai4scholar-全文搜索 接入了 Ai4Scholar 的全文搜索 API，覆盖 2 亿+ 学术论文。它不只搜标题和摘要，它能搜进论文的正文——Methods、Experiments、Results、Discussion，所有章节都能搜。

而且它返回的不是论文列表，而是匹配的原文段落。

你说"搜 dropout rate 0.1 的 Transformer"，它会直接给你这样的结果：

Vaswani et al. (2017) 在 Methods 部分写道： "We apply dropout to the output of each sub-layer... We use a rate of P_drop = 0.1."

不用再一篇篇打开论文找了。它帮你精确定位到那一段话。

三个使用场景

场景一：搜方法细节

你在写论文，想确认某个方法的标准实现方式。

@ai4scholar-全文搜索搜索使用 dropout rate 0.1 的 Transformer 实现

它会返回多篇论文的正文片段，告诉你哪些作者在哪个章节具体描述了这个配置。

场景二：搜实验配置

你在复现别人的实验，想找类似的超参数设置。

@ai4scholar-全文搜索找 batch size 32, learning rate 1e-4 的训练设置，2022 年以后，CS 领域

它会精确匹配论文正文中包含这些参数的段落，还支持按年份、领域、期刊筛选。

场景三：搜跨领域应用

你想了解某个技术在另一个领域的落地情况。

@ai4scholar-全文搜索找 deep learning 在医学影像诊断中的应用，发在 Nature 上的

它不只告诉你有哪些论文，还直接摘出正文里描述具体应用方式的段落。

它和 Google Scholar 到底有什么不同

说得再直接一点。

Google Scholar：你搜"BERT sentiment analysis"，它给你一堆标题里带这几个词的论文。你得自己打开每篇论文，翻到 Methods 或 Experiments 部分，看看它到底怎么做的。

ai4scholar-全文搜索：你搜同样的词，它直接从 2 亿篇论文的正文里，找出提到"BERT"和"sentiment analysis"的原文段落。你不用打开论文，就能看到具体的方法描述和实验结果。

一个给你论文，一个给你信息。

支持的筛选条件

除了关键词，你还可以加筛选条件让结果更精准：

年份范围：比如"2022 年以后"
最低引用数：过滤低引用论文，比如"引用至少 100"
研究领域：Computer Science、Biology、Medicine 等 20+ 领域
期刊/会议：指定 Nature、Science、ICML、NeurIPS 等

这些条件可以自由组合。比如：

@ai4scholar-全文搜索搜索 protein folding 相关的方法，Biology 领域，2023 年以后，发在 Nature 或 Science 上的，引用至少 50

一条指令，精准定位。

怎么用

这个 Skill 需要调用 Ai4Scholar 的 API，所以使用前需要一个 API Key。

第一步：获取 API Key

访问 ai4scholar.net，注册账号，在个人中心获取你的 API Key。

第二步：安装 Skill

Hermes Agent 用户：把 SKILL.md 文件放到 ~/.hermes/skills/ 目录下，或者用 /skills 命令导入。

OpenClaw 用户同样兼容——上传 Skill 文件即可使用。

Workbuddy 用户：打开技能管理 → 上传技能，把 SKILL.md 文件拖进去。

然后配置你的 API Key，就可以开始了。

第三步：开始搜索

在任何对话中输入 @ai4scholar-全文搜索，加上你要搜的内容，就行了。

它能替代文献调研吗

不能。

全文搜索解决的是一个精确的问题：你知道你要找什么，但不知道它在哪篇论文里。

它不能帮你发现你不知道的东西。文献调研的核心是"发现"——发现新的方向、发现意想不到的关联、发现你从没想过的研究角度。这些需要你自己去读、去想。

但当你已经知道要找什么的时候——一个具体的方法、一个特定的参数、一段具体的描述——全文搜索能帮你省掉大量翻论文的时间。

从"搜论文"到"搜信息"，中间差的就是正文搜索这一步。

最后

回到开头那个同学的问题。

他后来用这个 Skill 搜了一下"learning rate 1e-4 cosine annealing BERT fine-tuning"，3 秒钟找到了 5 篇论文的具体训练配置段落。

以前他得在 Google Scholar 里搜出 50 篇论文，一篇篇打开翻到 Experiments 章节，花一个下午。

现在 3 秒。

论文还是那些论文，但找信息的方式变了。