PDF 文本提取

在线 PDF 文本提取,基于 PDF 内嵌文本流(Tj/TJ 操作符),纯前端,文件不上传。

使用说明

功能

  • 解析 PDF 内嵌文本(Tj / TJ 操作符),不解压 FlateDecode(简化版)
  • 支持搜索过滤 / 一键复制 / 下载 TXT
  • 对 CMap/自定义编码的 PDF 提取有限(提示但不报错)

使用

  • PDF 文本复制 / 数据抽取 / 文档检索
  • 扫描版 PDF(纯图片)无法提取,需 OCR

Agent API 调用示例

本工具为纯前端实现,数据在浏览器内处理,不发送服务器。 manifest 中 api_url 为空,/api/pdf_text_extract/ 端点不存在(返回 404)。 Agent 请读取 schema.json 理解字段,调用前请在工具页用浏览器执行。
// Step 1: 读取工具 Schema
GET https://clawam.com/tools/pdf_text_extract/schema.json

// Step 2: 在浏览器中执行工具逻辑
// PDF 文本 在工具页 JS 中实现