1. 什么是双层PDF?
双层PDF(又称作双层可搜PDF)是一种PDF文档,它由两层组成。第一层是图片层,第二层是 OCR 文字层,这意味着文件包含了一个被识别的文字副本。它可以在不改变图像的情况下搜索和选择文本,使它们易于编辑和转换。
2. 双层PDF的优势:
2.1识别文本
在一个双层PDF文件中,每一页PDF都包含了一个 OCR 文字副本。这使得文本可以被搜索、选择、编辑和启动文本扫描等操作。
2.2保留图像原有的属性
在创建一个双层PDF文件时,第一层中的图像原样保留,不受第二层的OCR文字层的影响。这能够补救无法关闭OCR并保留原始格式的情况。
2.3 可以方便地查看转换前和转换后的文本
双层PDF可以同时包含原始PDF文档和其对应的 OCR 文本,这是在查看转换前和转换后的文本非常方便的同时,还允许用户进行更高级的搜索、筛选和复制等操作。
3. 如何处理双层PDF?
3.1 修改文本
双层PDF的 OCR 文字层允许您修改文本,您可以使用编辑工具在其中添加、删除或格式化文本。
3.2 重新排版文本和图像
双层PDF的文本和图像可以在此类软件中重新排版、缩放和重新设置图像属性。
3.3 将PDF转换为其他格式
使用双层PDF,可以在不改变图片质量的情况下轻松地将 PDF 转换为 Word、 Excel或其他可编辑的文件格式。
4. 总结归纳
双层PDF是一种PDF文档,它由两层组成。第一层是图片层,第二层是 OCR文字层,它可以在不改变图像的情况下搜索和选择文本,使它们易于编辑和转换。双层PDF具有识别文本、保留图像原有属性和方便查看转换前后文本等优势。您可以使用双层PDF来修改文本、重新排版文本和图像以及将PDF转换为其他格式。