Система конвертации данных формата PDF в текстовый формат
-
Автор квалификационной работы
-
-
Руководитель
-
Актуальность программного продукта PDFtoTEXT 1.0
-
Программа не только извлекает информацию из документа PDF, но и конвертирует ее в формат текстового документа, превращая конечный файл в настоящий переносимый и редактируемый документ;
-
Программа, предназначенная для подсчета количества страниц, а также другой статистики по файлу PDF, весьма удобна для получения полного представления об информационном объеме файла PDF;
-
Программа направлена на достижение максимального соответствия исходного и результирующего файла;
-
Программа является бесплатной, что позволяет немедленно ее выгрузить и начать использовать. Исходя из проблемы разной платежеспособности потенциальных пользователей, она актуальна для пользования учащимися школ и студентами ВУЗов.
Аналоги, их плюсы и минусы
-
Solid Converter PDF 1.0
-
Плюсы:
-
Выбор и конвертирование только рисунков из PDF файла и их сохранение в виде графических файлов;
-
Конвертирование выбранного диапазона страниц.
-
Минусы:
-
Программа условно-бесплатная;
-
Не предусмотрена краткая информация о конвертируемом файле;
-
Большой размер файла-установщика.
-
PDF Transformer 1.0
-
Плюсы:
-
Преобразование PDF файлов любого типа;
-
4 формата сохранения;
-
Программа корректно работает с PDF файлами на 37 языках;
-
Минусы:
-
Высокая стоимость продукта;
-
Довольно жесткие системные требования;
-
Низкая скорость извлечения информации для продукта такого класса (разработчик – компания ABBYY).
Направление и задачи исследований
-
Цель работы состоит в разработке и создании программного продукта, позволяющего извлекать текстовую информацию из файлов формата PDF и сохранять ее в файлы текстового формата. Для достижения этой цели были решены следующие задачи:
-
Исследование структуры файлов формата PDF;
-
Разработка алгоритма извлечения текста (проектирование и реализация);
-
Создание пользовательского интерфейса.
Схемы, необходимые для изучения формата PDF
Структура формата PDF
Структура файла формата PDF
Основные возможности программного продукта
Интерфейс
Информация о файле PDF
Основные возможности программного продукта
Предупреждение об ошибке
Визуальное подтверждение о выполненной работе
Примеры, отражающие результаты работы
Исходный файл PDF
Примеры, отражающие результаты работы
Файл TXT после конвертации
Результаты оценки программного продукта посторонними лицами
-
Параметры для оценки:
-
Удобство в использовании;
-
Легкость освоения программы в кратчайшие сроки;
-
Функциональные возможности.
-
Результаты:
-
Простой и оптимально функциональный интерфейс;
-
Наличие функции просмотра статистики по файлу PDF – несомненный плюс;
-
Размер программы всего 1,5 Мб, что удобно как для скачивания, так и для ее транспортировки.
Таблица экономического обоснования дипломного проекта
Система конвертации данных формата PDF в текстовый формат
-
Автор квалификационной работы
-
-
Руководитель
-