上周一个做 NLP 的同学问我:"你知不知道哪篇论文用了 learning rate 1e-4 加 cosine annealing 来训练 BERT?"
我说你去 Google Scholar 搜啊。
他说:"搜了。搜出来一堆标题里带 BERT 的论文,但我怎么知道他们用的什么 learning rate?标题和摘要里不会写这些。"
他说的是对的。Google Scholar 搜不到这些——因为它只搜标题和摘要。
这个问题困扰我很久了,所以我接了 Ai4Scholar 的全文搜索 API,做了一个 Hermes Agent 技能,能直接搜论文正文。用了一段时间觉得还不错,今天把它开源了。
如果你还在用 OpenClaw,这个 Skill 也完全兼容——Hermes Agent 本身就支持从 OpenClaw 无缝迁移。
你平时搜论文,用的是 Google Scholar、Semantic Scholar、Connected Papers 这些工具。它们都很好用——但它们有一个共同的限制:
只能搜标题和摘要。
标题是论文的"招牌",摘要是论文的"电梯演讲"。它们告诉你这篇论文做了什么,但不会告诉你怎么做的。
具体的实验参数、训练配置、模型架构细节、消融实验的设置、数据预处理的步骤——这些全都藏在论文正文里。
而正文,是传统搜索引擎看不到的。
所以你才会遇到这种情况:
搜论文和搜到你需要的信息,是两件事。
在介绍这个技能之前,先说一下 Hermes Agent——因为很多人可能还没听过。
Hermes Agent 是 Nous Research(一家专注 AI 研究的实验室)最近开源的 AI Agent 平台。简单说,它是一个能自己学习、自己成长的 AI 助手——你用得越多,它越懂你。GitHub 上已经 7 万多 star、1 万多 fork,热度比之前的 OpenClaw 还高。
它跟 ChatGPT 这类对话工具的区别在于:
如果你之前用过 OpenClaw,Hermes Agent 就是它的"全面升级版"。而且内置了一键迁移工具(hermes claw migrate),之前在 OpenClaw 上的记忆、技能、配置都能直接搬过来。
我现在的 ai4scholar 系列 Skill 都在 Hermes Agent 上开发和测试。当然,OpenClaw 和 Workbuddy 也完全兼容。
回到正题。这就是我做这个 Skill 的原因。
@ai4scholar-全文搜索 接入了 Ai4Scholar 的全文搜索 API,覆盖 2 亿+ 学术论文。它不只搜标题和摘要,它能搜进论文的正文——Methods、Experiments、Results、Discussion,所有章节都能搜。
而且它返回的不是论文列表,而是匹配的原文段落。
你说"搜 dropout rate 0.1 的 Transformer",它会直接给你这样的结果:
Vaswani et al. (2017) 在 Methods 部分写道: "We apply dropout to the output of each sub-layer... We use a rate of P_drop = 0.1."
不用再一篇篇打开论文找了。它帮你精确定位到那一段话。
场景一:搜方法细节
你在写论文,想确认某个方法的标准实现方式。
@ai4scholar-全文搜索 搜索使用 dropout rate 0.1 的 Transformer 实现
它会返回多篇论文的正文片段,告诉你哪些作者在哪个章节具体描述了这个配置。
场景二:搜实验配置
你在复现别人的实验,想找类似的超参数设置。
@ai4scholar-全文搜索 找 batch size 32, learning rate 1e-4 的训练设置,2022 年以后,CS 领域
它会精确匹配论文正文中包含这些参数的段落,还支持按年份、领域、期刊筛选。
场景三:搜跨领域应用
你想了解某个技术在另一个领域的落地情况。
@ai4scholar-全文搜索 找 deep learning 在医学影像诊断中的应用,发在 Nature 上的
它不只告诉你有哪些论文,还直接摘出正文里描述具体应用方式的段落。
说得再直接一点。
Google Scholar:你搜"BERT sentiment analysis",它给你一堆标题里带这几个词的论文。你得自己打开每篇论文,翻到 Methods 或 Experiments 部分,看看它到底怎么做的。
ai4scholar-全文搜索:你搜同样的词,它直接从 2 亿篇论文的正文里,找出提到"BERT"和"sentiment analysis"的原文段落。你不用打开论文,就能看到具体的方法描述和实验结果。
一个给你论文,一个给你信息。
除了关键词,你还可以加筛选条件让结果更精准:
这些条件可以自由组合。比如:
@ai4scholar-全文搜索 搜索 protein folding 相关的方法,Biology 领域,2023 年以后,发在 Nature 或 Science 上的,引用至少 50
一条指令,精准定位。
这个 Skill 需要调用 Ai4Scholar 的 API,所以使用前需要一个 API Key。
第一步:获取 API Key
访问 ai4scholar.net,注册账号,在个人中心获取你的 API Key。
第二步:安装 Skill
Hermes Agent 用户:把 SKILL.md 文件放到 ~/.hermes/skills/ 目录下,或者用 /skills 命令导入。
OpenClaw 用户同样兼容——上传 Skill 文件即可使用。
Workbuddy 用户:打开技能管理 → 上传技能,把 SKILL.md 文件拖进去。
然后配置你的 API Key,就可以开始了。
第三步:开始搜索
在任何对话中输入 @ai4scholar-全文搜索,加上你要搜的内容,就行了。
不能。
全文搜索解决的是一个精确的问题:你知道你要找什么,但不知道它在哪篇论文里。
它不能帮你发现你不知道的东西。文献调研的核心是"发现"——发现新的方向、发现意想不到的关联、发现你从没想过的研究角度。这些需要你自己去读、去想。
但当你已经知道要找什么的时候——一个具体的方法、一个特定的参数、一段具体的描述——全文搜索能帮你省掉大量翻论文的时间。
从"搜论文"到"搜信息",中间差的就是正文搜索这一步。
回到开头那个同学的问题。
他后来用这个 Skill 搜了一下"learning rate 1e-4 cosine annealing BERT fine-tuning",3 秒钟找到了 5 篇论文的具体训练配置段落。
以前他得在 Google Scholar 里搜出 50 篇论文,一篇篇打开翻到 Experiments 章节,花一个下午。
现在 3 秒。
论文还是那些论文,但找信息的方式变了。