Documentize 引入了强大的插件架构重组,新的分组插件类使 PDF 操作变得更直观、更高效。
介绍
PDF 操作是许多现代应用程序的核心需求。无论您是在构建文档管理系统、自动化报告工具,还是内容转换管道,拥有一个可靠且高效的 PDF 处理库都是至关重要的。Documentize 在这个领域一直是一个值得信赖的解决方案,现在我们很高兴地推出我们重新组织的插件架构,带有分组插件类。
另一个重要的特点是,单个许可证将提供多个功能。之前的原则是一个许可证一个功能。产品计划在 2025 年冬季发布。
这种新组织使我们强大的 PDF 操作能力对开发人员而言变得更加易于访问和直观。在本文中,我们将探讨新的插件组,并演示它们如何在 .NET 应用程序中简化您的 PDF 操作。更多详细信息,请查看 Documentation pages。
新的插件架构
Documentize 已将其广泛的 PDF 功能重新组织成逻辑上、以任务为导向的组,使找到和使用合适工具变得更加直观。新的分组插件类包括:
- PDF Extractor - 从 PDF 文档中提取文本、图像和表单数据
- PDF Manager - 处理合并、拆分、页面调整大小、页面旋转、压缩文档、生成表格、生成目录和优化等核心 PDF 操作
- PDF Converter - 将 PDF 转换为 DOC、XLS/XLSX、HTML、PNG/JPG/TIFF、PDF/A 等
- PDF Security - 管理加密和数字签名
- PDF Form - 处理交互式 PDF 表单
让我们深入了解这些组,探索它们的功能并观察它们的实际应用。
PDF Extractor - 解锁 PDF 内容
PDF Extractor 组整合了与从 PDF 文档中提取内容(包括文本、图像和元数据)相关的所有功能。 该插件将于 2025 年 10 月发布。
// Create ExtractTextOptions object to set instructions
var options = new ExtractTextOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Perform the process
var results = PdfExtractor.ExtractText(options);
// Get the extracted text from the ResultContainer object
var textExtracted = results.ResultCollection[0].ToString();
// Create ExtractImagesOptions to set instructions
var options = new ExtractImagesOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output Directory path
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Perform the process
PdfExtractor.ExtractImages(options);
// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfExtractor.ExtractFormData(options);
这种简化的方法使得通过一个单一的直观界面访问所有与提取相关的功能变得容易。
PDF Manager - 核心文档操作
PDF Manager 组处理核心 PDF 操作,例如合并、拆分、生成表格、生成目录、调整页面大小、旋转页面、压缩文档和优化。 该插件将于 2025 年 10 月发布。
// Create MergeOptions object to set instructions
var options = new MergeOptions();
// Add input file paths
options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfManager.Merge(options);
// Create SplitOptions object to set instructions
var options = new SplitOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file paths
options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
// Perform the process
PdfManager.Split(options);
使用 PDF Manager,常见的文档管理任务变得简单明了,所需代码极少。
PDF Converter - 格式转换
PDF Converter 组专注于将 PDF 转换为各种格式,包括图像、Word/Excel 文档和 HTML。 该插件将于 2025 年 11 月发布。
// Create PdfToDocOptions object to set instructions
var options = new PdfToDocOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_file.doc"));
// Set Mode
options.Mode = DocConversionMode.Flow;
// Perform the process
PdfConverter.ConvertPdfToDoc(options);
// Create PdfToTiffOptions object to set instructions
var options = new PdfToTiffOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output Directory path
options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
// Perform the process
PdfConverter.ConvertPdfToTiff(options);
PDF Converter 使在保持保真度并应用自定义设置的同时,在格式之间转换文档变得简单。
PDF Security - 保护文档
PDF Security 组提供通过加密和数字签名保护 PDF 文档的工具。 该插件将于 2025 年 12 月发布。
// Create EncryptionOptions object to set instructions
var options = new EncryptionOptions("123456", "qwerty");
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfSecurity.Encrypt(options);
// Create SignOptions object to set instructions
var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfSecurity.Sign(options);
使用 PDF Security 组,实施文档保护和合规功能变得更加容易且一致。
PDF Form - 交互式文档管理
PDF Form 组专注于处理交互式 PDF 表单,包括导出、扁平化和编辑表单数据。
// Create FormFlattenerOptions object to set instructions
var options = new FormFlattenerOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Optional parameter for skip the field with name "Surname".
options.SkipFields.Add("Surname");
// Perform the process
PdfForm.Flatten (options);
//The example demonstrates how to Get Field Names from PDF file.
var fieldNames = PdfForm.GetFieldNames("path_to_your_pdf_file.pdf");
PDF Form 组简化了与交互式表单的工作,使将 PDF 集成到数据收集和处理工作流中变得更加容易。
新架构的好处
Documentize 插件的这些逻辑分组重组带来了几个关键好处:
- 改善可发现性 - 找到正确的功能变得更容易,逻辑分组的类更清晰
- 简化 API - 相关方法被整理在一起,创造了更直观的开发者体验
- 减少认知负担 - 开发人员可以一次专注于一个功能区域
- 更好的代码组织 - 使用专注的插件类时,应用程序代码变得更加清晰
- 经济实惠 - 购买组合插件的成本远低于单独购买多个产品的成本
结论
Documentize 新的组合插件类在使 PDF 操作对开发人员更易访问和更直观方面代表了一个重要步伐。通过将功能组织成逻辑上、以任务为导向的组,我们更加方便地发现和使用适合您 PDF 处理需求的正确工具。
无论您是在提取内容、转换格式、管理安全性还是处理表单,新插件架构提供了一个更清洁、更专注的 API,将帮助您更快速地编写更好的代码。
准备尝试新的分组插件类吗?访问 products.documentize.com 探索我们全面的文档和示例。