PDF 智能阅读
上传 PDF 论文自动解析结构化信息,AI 智能问答和跨论文对比
概述
PDF 智能阅读功能帮你快速理解论文内容。上传后 AI(基于 Grobid + 大语言模型)自动提取摘要、章节、引用列表等结构化信息,并支持基于全文的智能问答。
项目硬绑定
阅读页强绑定当前项目:
- 没选项目时整页显示"请先选择或新建项目"引导,阻止上传
- 上传 / 解析的 PDF 自动归属到当前项目
- "已解析"tab 只显示当前项目的论文
这样设计的原因:避免 PDF 上传后归属为 project_id=null 的孤儿——这种数据不会出现在任何项目的"已解析"列表里,等于丢了。
切换项目时,左侧的已解析 PDF 列表会自动刷新成新项目的内容。
核心功能

智能提取
上传完成后 AI 自动产出:
- 摘要提取 — 自动识别和提取论文摘要
- 关键词识别 — 提取论文核心关键词
- 方法论分析 — 识别研究方法和实验设计
- 结论总结 — 提炼论文主要发现和结论
- 结构化章节 — Introduction / Methods / Results / Discussion 分段索引
- 参考文献列表 — 解析出所有引用并尝试匹配 DOI
智能问答
上传论文后,在右侧对话面板向 AI 提问:
- "这篇论文的主要创新点是什么?"
- "实验用了什么数据集?样本量多少?"
- "与之前的方法相比有什么改进?"
- "这个方法有什么局限性?"
- "在第 3.2 节里他们用了什么算法?"
AI 答复时会引用原文位置,方便你跳转去核对。
跨论文对比
同时打开多篇 PDF(在同一项目下),AI 可以做对比分析:
- 方法论异同
- 实验结果对比
- 各自优劣势
- 引用关系(A 引用了 B 吗)
使用方法
- 顶栏选好当前项目
- 进入 阅读 页
- 拖拽 PDF 文件到上传区,或粘贴论文 URL
- 等待 AI 解析完成(10~30 秒,复杂论文更久)
- 解析后在左侧的"已解析"tab 找到这篇论文
- 点击打开,看结构化信息 + 用右侧对话框问 AI
上传 PDF 时支持的方式
- 本地文件:拖拽 / 选择,最大 50MB
- URL:粘贴论文 PDF 直链
- DOI / arXiv ID:自动定位并尝试下载
- 从搜索结果:搜索页点 PDF 标签可以一键发送到阅读页
支持格式
- PDF(主要格式)
- 文件大小限制:50MB
- 支持扫描件 OCR 识别(图片型 PDF 自动转文本)
已解析 PDF 的状态
每篇 PDF 在已解析 tab 里有几种状态:
- 🟢 已完成:可以问答、可以查看结构化信息
- 🟡 解析中:刚上传,等几十秒
- 🔴 失败:通常是 PDF 加密、图片 OCR 困难、文件损坏。可以重新上传或试试不同来源
最佳实践
- 每个项目最多 50~100 篇 PDF:超过这个数量,AI 问答上下文会被稀释,回答质量下降
- 关键论文精读、非关键论文略读:不是每篇都需要 AI 问答,看摘要 + 关键词通常就够
- 跨论文对比限定主题:明确告诉 AI 对比哪个维度("对比这两篇的实验数据集"),不要泛泛
- 复制问答内容到笔记:阅读页的对话历史会保留,但建议把关键洞察复制到写作页的笔记里、跟项目文档系统融合
数据持久化
PDF 文件和解析结果都永久保留(直到你删除项目或单独删除)。AI 问答历史按 PDF 维度保存,下次打开同一篇论文继续之前的对话。
常见踩坑
- 上传后看不到:检查项目是否切对了
- 解析失败:试试用浏览器打开 PDF URL 确认能直接下载;图片型扫描 PDF 可能需要先 OCR
- AI 回答不准:通常是 PDF 解析时漏了关键章节(如表格、公式较多)。可以贴章节原文给 AI 增强上下文