Djvulibre djview что это за программа

DjVuLibre 3.5.24 и DjView4 4.7

Тихо и незаметно 6 марта вышла обновлённая версия набора утилит для работы с файлами в формате DjVu — DjVuLibre 3.5.24, в том числе версия 4.7 просмотрщика файлов в формате DjVu — DjView4, целиком написанного на Qt4.

DjVuLibre это открытый проект по разработке компрессора изображений в формат DjVu, сборщика DjVu-файлов, ряда утилит для манипуляций с файлами данного формата, просмотрщика для X11, а также ряда конвертеров в другие открытые форматы. Кроме вышеперечисленного в состав DjVuLibre входит плагин для просмотра DjVu-файлов в браузерах Netscape-4.x, Netscape-6.x, Mozilla, Galeon, Konqueror и Opera.

Напомним, что DjVu — открытая технология и формат файла, предназначенный для сжатия с потерями чёрно-белых и цветных изображений с возможностью добавления в полученный документ текстового (OCR) слоя и ссылок. При сжатии используются алгоритм IW44, основанный на вейвлет-преобразовании, и алгоритм JB2, подобный JBIG2.

Технология, применяемая для сжатия изображений в DjVu, была разработана AT&T Labs в 1996, в данный момент права на технологию принадлежат компании Caminova.

Кошерный формат. Жаль, мало используется. Да и в основном для сканированного ворованного контента. А мог бы и jpeg потеснить сильно.

Что-то я чейнджлог нигде не вижу.

Для Ъ выкладываю, несмотря на то, что сию же минуту посыпятся голоса «минорщина»:

DjVuLibre
NEW IN VERSION 3.5.24
———————
— Set ddjvuapi_version to 20.
— Added ddjvuapi support for changing the white point.
— Added option «-u» in djvused.
— Added option «-o djvufile» in djvuxmlparser.
— Added support for tag in djvuxmlparser.
— Added print-xmp, set-xmp, remove-smp in djvused.

DjView4
NEW IN VERSION 4.7
———————
— Fix for crash on quick PgUp PgDn sequences.
— Fix scrollbars in continuous mode.
— Fix plugin for some webkit based browsers.

А у JavaDjVu никаких телодвижений нет. Печально

>А у JavaDjVu никаких телодвижений нет.Закономерно

Не понять мне, зачем использовать для текста алгоритм сжатия, который превращает его в нечитабельную рванину. Несколько раз сталкивался с литературой в djvu. После мучительных попыток это читать, я находил другие источники.

зачем использовать для текста алгоритм сжатия

Почитай на русской вики, если не на сайте проекта, хотя бы, что и как и зачем сжимается.

В отсканированном изображении текста изначально нет, его надо распознать и вручную добавить в OCR слой. Если, например, книга была отсканирована криво («горизонт» завален), то строки текста в OCR слое могут не всегда совпадать по местоположению с изображениями этих символов в «маске», которая и содержит изображение текста и прочие чёткие детали. Я молчу о том, насколько качественным может этот OCR слой быть.

Я знаю, что сжимается изображение, но формат предназначен для хранения отсканированного текста. С этих изображений предполагается именно читать текст. И делать это после сжатия в djvu становится крайне неприятно. Лично я, например, лучше буду хранить на диске 150 мегабайт несжатых чёрно-белых сканов, чем 15 мегабайт djvu.

xsane + scantailor + djvulibre дает отличные результаты. При хорошем качестве сканов степень сжатия достигает 100 раз, потери качества практически отсутвуют.

Источник

Операционные системы и программное обеспечение