Documentize представляет мощную реорганизацию своей архитектуры плагинов с новыми сгруппированными классами плагинов, что делает манипуляции с PDF более интуитивными и эффективными, чем когда-либо прежде.

Введение

Манипуляции с PDF являются основным требованием для многих современных приложений. Независимо от того, создаете ли вы системы управления документами, инструменты для автоматизированной отчетности или конвейеры для преобразования контента, наличие надежной и эффективной библиотеки обработки PDF является необходимым. Documentize долгое время была надежным решением в этой области, и теперь мы рады представить нашу новую реорганизованную архитектуру плагинов с группированными классами плагинов.

Еще одной важной особенностью является то, что одна лицензия будет предоставлять несколько функций. Ранее принцип был таков: одна лицензия — одна функция. Выпуск продукта запланирован на зиму 2025 года.

Эта новая организация делает наши мощные возможности манипуляции с PDF еще более доступными и интуитивными для разработчиков. В этой статье мы изучим новые группы плагинов и продемонстрируем, как они могут упростить ваши операции с PDF в приложениях .NET. Для получения дополнительных сведений проверьте страницы документации.

Новая архитектура плагинов

Documentize реорганизовала свои обширные функции работы с PDF в логические группы, ориентированные на задачи, что делает их более интуитивными для поиска и использования. Новые сгруппированные классы плагинов включают в себя:

  • PDF Извлекатель - извлечение текста, изображений и данных формы из PDF-документов
  • PDF Менеджер - выполнение основных операций с PDF, таких как объединение, разделение, изменение размера страниц, поворот страниц, сжатие документов, генерация таблиц, генерация оглавления и оптимизация
  • PDF Конвертер - конвертация PDF в DOC, XLS/XLSX, HTML, PNG/JPG/TIFF, PDF/A и другие
  • PDF Безопасность - управление шифрованием и цифровыми подписями
  • PDF Форма - работа с интерактивными PDF-формами

Давайте углубимся в каждую из этих групп, чтобы изучить их возможности и увидеть их в действии.

PDF Извлекатель - Разблокировка содержимого PDF

Группа PDF Извлекателя консолидирует все функции, связанные с извлечением контента из PDF-документов, включая текст, изображения и метаданные. Этот плагин будет выпущен в октябре 2025 года.

// Создание объекта ExtractTextOptions для задания инструкций
var options = new ExtractTextOptions();
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Выполнение процесса
var results = PdfExtractor.ExtractText(options);
// Получение извлеченного текста из объекта ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
// Создание ExtractImagesOptions для задания инструкций
var options = new ExtractImagesOptions();
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходной директории
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Выполнение процесса
PdfExtractor.ExtractImages(options);
// Создание объекта ExtractFormDataToDsvOptions для задания инструкций
var options = new ExtractFormDataToDsvOptions(',', true);
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходному файлу
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Выполнение процесса
PdfExtractor.ExtractFormData(options);

Этот упрощенный подход позволяет легко получить доступ ко всей функциональности, связанной с извлечением, через один интуитивный интерфейс.

PDF Менеджер - Основные операции с документами

Группа PDF Менеджера обрабатывает основные операции с PDF, такие как объединение, разделение, генерация таблиц, генерация оглавления, изменение размера страниц, поворот страниц, сжатие документов и оптимизация. Этот плагин будет выпущен в октябре 2025 года.

// Создание объекта MergeOptions для задания инструкций
var options = new MergeOptions();
// Добавление путей к входным файлам
options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
// Установка пути к выходному файлу
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Выполнение процесса
PdfManager.Merge(options);
// Создание объекта SplitOptions для задания инструкций
var options = new SplitOptions();
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка путей к выходным файлам
options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
// Выполнение процесса
PdfManager.Split(options);

С помощью PDF Менеджера общие задачи управления документами становятся простыми и требуют минимального объема кода.

PDF Конвертер - Преобразование форматов

Группа PDF Конвертера специализируется на конвертации PDF в различные форматы, включая изображения, документы Word/Excel и HTML. Этот плагин будет выпущен в ноябре 2025 года.

// Создание объекта PdfToDocOptions для задания инструкций
var options = new PdfToDocOptions();
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходному файлу
options.AddOutput(new FileDataSource("path_to_result_file.doc"));
// Установка режима
options.Mode = DocConversionMode.Flow;
// Выполнение процесса
PdfConverter.ConvertPdfToDoc(options);
// Создание объекта PdfToTiffOptions для задания инструкций
var options = new PdfToTiffOptions();
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходной директории
options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
// Выполнение процесса
PdfConverter.ConvertPdfToTiff(options);

PDF Конвертер упрощает преобразование документов между форматами, сохраняя четкость и применяя настраиваемые параметры.

PDF Безопасность - Защита документов

Группа PDF Безопасности предоставляет инструменты для защиты PDF-документов с помощью шифрования и цифровых подписей. Этот плагин будет выпущен в декабре 2025 года.

// Создание объекта EncryptionOptions для задания инструкций
var options = new EncryptionOptions("123456", "qwerty");
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходному файлу
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Выполнение процесса
PdfSecurity.Encrypt(options);
// Создание объекта SignOptions для задания инструкций
var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходному файлу
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Выполнение процесса
PdfSecurity.Sign(options);

С помощью группы PDF Безопасности реализация функций защиты документов и соответствия становится более доступной и последовательной.

PDF Форма - Интерактивное управление документами

Группа PDF Форм специализируется на работе с интерактивными PDF-формами, включая экспорт, упрощение и редактирование данных формы.

// Создание объекта FormFlattenerOptions для задания инструкций
var options = new FormFlattenerOptions();
// Добавление пути к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установка пути к выходному файлу
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Необязательный параметр для пропуска поля с именем "Фамилия".
options.SkipFields.Add("Surname");
// Выполнение процесса
PdfForm.Flatten (options);

//Пример демонстрирует, как получить имена полей из PDF-файла.
var fieldNames = PdfForm.GetFieldNames("path_to_your_pdf_file.pdf");

Группа PDF Форм упрощает работу с интерактивными формами, что делает интеграцию PDF в ваши процессы сбора и обработки данных более легкой.

Преимущества новой архитектуры

Реорганизация плагинов Documentize в эти логические группы предоставляет несколько ключевых преимуществ:

  1. Улучшенная находчивость - Легче находить нужную функциональность благодаря логически сгруппированным классам
  2. Упрощенный API - Связанные методы организованы вместе, создавая более интуитивный опыт для разработчика
  3. Снижение когнитивной нагрузки - Разработчики могут сосредоточиться на одной области функциональности в одно время
  4. Лучшая организация кода - Код приложения становится более чистым при работе с сосредоточенными классами плагинов
  5. Экономически эффективно - покупки комбинированного плагина обходятся значительно дешевле, чем покупка нескольких продуктов по отдельности

Заключение

Новые классы комбинированных плагинов Documentize представляют собой значительный шаг вперед в упрощении манипуляций с PDF для разработчиков. Организуя функциональность в логические группы, ориентированные на задачи, мы сделали легче нахождение и использование правильных инструментов для ваших потребностей в обработке PDF.

Независимо от того, извлекаете ли вы контент, конвертируете форматы, управляете безопасностью или работаете с формами, новая архитектура плагинов предоставляет более чистый, сосредоточенный API, который поможет вам писать лучший код быстрее.

Готовы попробовать новые сгруппированные классы плагинов? Посетите products.documentize.com, чтобы ознакомиться с нашей подробной документацией и примерами.