Система конвертации данных формата PDF в текстовый формат. Актуальность программного продукта PDF toTEXT 1.0

Страницы работы

Содержание работы

Система конвертации данных формата PDF в текстовый формат

  • Автор квалификационной работы
  • Руководитель

Актуальность программного продукта PDFtoTEXT 1.0

  • Программа не только извлекает информацию из документа PDF, но и конвертирует ее в формат текстового документа, превращая конечный файл в настоящий переносимый и редактируемый документ;
  • Программа, предназначенная для подсчета количества страниц, а также другой статистики по файлу PDF, весьма удобна для получения полного представления об информационном объеме файла PDF;
  • Программа направлена на достижение максимального соответствия исходного и результирующего файла;
  • Программа является бесплатной, что позволяет немедленно ее выгрузить и начать использовать. Исходя из проблемы разной платежеспособности потенциальных пользователей, она актуальна для пользования учащимися школ и студентами ВУЗов.

Аналоги, их плюсы и минусы

  1. Solid Converter PDF 1.0
  2. Плюсы:
  3. Выбор и конвертирование только рисунков из PDF файла и их сохранение в виде графических файлов;
  4. Конвертирование выбранного диапазона страниц.
  5. Минусы:
  6. Программа условно-бесплатная;
  7. Не предусмотрена краткая информация о конвертируемом файле;
  8. Большой размер файла-установщика.

  1. PDF Transformer 1.0
  2. Плюсы:
  3. Преобразование PDF файлов любого типа;
  4. 4 формата сохранения;
  5. Программа корректно работает с PDF файлами на 37 языках;
  6. Минусы:
  7. Высокая стоимость продукта;
  8. Довольно жесткие системные требования;
  9. Низкая скорость извлечения информации для продукта такого класса (разработчик – компания ABBYY).

Направление и задачи исследований

  • Цель работы состоит в разработке и создании программного продукта, позволяющего извлекать текстовую информацию из файлов формата PDF и сохранять ее в файлы текстового формата. Для достижения этой цели были решены следующие задачи:
  • Исследование структуры файлов формата PDF;
  • Разработка алгоритма извлечения текста (проектирование и реализация);
  • Создание пользовательского интерфейса.

Схемы, необходимые для изучения формата PDF

Структура формата PDF

Структура файла формата PDF

Основные возможности программного продукта

Интерфейс

Информация о файле PDF

Основные возможности программного продукта

Предупреждение об ошибке

Визуальное подтверждение о выполненной работе

Примеры, отражающие результаты работы

Исходный файл PDF

Примеры, отражающие результаты работы

Файл TXT после конвертации

Результаты оценки программного продукта посторонними лицами

  • Параметры для оценки:
  • Удобство в использовании;
  • Легкость освоения программы в кратчайшие сроки;
  • Функциональные возможности.
  • Результаты:
  • Простой и оптимально функциональный интерфейс;
  • Наличие функции просмотра статистики по файлу PDF – несомненный плюс;
  • Размер программы всего 1,5 Мб, что удобно как для скачивания, так и для ее транспортировки.

Таблица экономического обоснования дипломного проекта

Система конвертации данных формата PDF в текстовый формат

  • Автор квалификационной работы
  • Руководитель

Похожие материалы

Информация о работе