PDF 文本提取 · clawam可用
無料オンラインPDF Text Extract。埋め込みテキストストリーム(Tj/TJオペレーター)からテキストを抽出する純フロントエンドツール。ファイルは一切外部送信されません。提供:clawam.com。
使い方
機能
- 解析 PDF 内嵌文本(Tj / TJ 操作符),不解压 FlateDecode(简化版)
- 支持搜索过滤 / 一键复制 / 下载 TXT
- 对 CMap/自定义编码的 PDF 提取有限(提示但不报错)
利用シーン
- PDF 文本复制 / 数据抽取 / 文档检索
- 扫描版 PDF(纯图片)无法提取,需 OCR
Agent API 使用方法
This tool is pure frontend,Data is processed in the browser,never sent to a server。
manifest 中 api_url 为空,
/api/pdf_text_extract/ endpoint does not exist(返回 404)。
Agent 请读取 schema.json 理解字段,Please execute the tool logic in the browser first。
// Step 1: 读取工具 Schema GET https://clawam.com/tools/pdf_text_extract/schema.json // Step 2: 在浏览器中执行工具逻辑 // PDF 文本 在工具页 JS 中实现