science_and_life:archive_quality
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
science_and_life:to_sort_out [2006/07/18 08:44] – kibi | science_and_life:archive_quality [2008/12/11 13:01] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ===== Критерии качества архива " | ||
+ | ОСНОВНЫМ | ||
+ | является | ||
+ | виду следующее: | ||
+ | |||
+ | * Чёткий и ровный текст и иллюстрации (визуальная составляющая) | ||
+ | * Достоверная цветопередача, | ||
+ | * Отсутствие муара на фотографиях | ||
+ | * Одинаковый размер страниц и полей в журнале | ||
+ | * Масштаб страниц 100% соответствующий реальному размеру | ||
+ | * DJVU файлы с текстовым слоем (возможность поиска) | ||
+ | * Наличие интерактивного оглавления в каждом номере | ||
+ | * Отсутствие ошибок в оглавлениях | ||
+ | * Наличие глобального оглавления по всем номерам с удобной навигацией | ||
+ | * Наличие авторского указателя с удобной навигацией | ||
+ | * Наличие тематического рубрикатора с удобной навигацией | ||
+ | * Небольшой размер архива | ||
+ | * Быстрая работа электронного архива | ||
+ | * Удобство пользования архивом | ||
+ | |||
+ | Для меня НЕ ЯВЛЯЮТСЯ ЗНАЧИМЫМИ следующие факторы: | ||
+ | |||
+ | * Необходимость использовать уже наработанные материалы, | ||
+ | * Необходимость задействовать в работе всех сотрудников редакции вне зависимости от их квалификации в данной области | ||
+ | * Политические факторы, | ||
+ | * Плата за мою работу | ||
+ | |||
+ | ===== Примеры выбора способов создания архива ===== | ||
+ | |||
+ | В выборе | ||
+ | соображениями МИНИМИЗАЦИИ ВРЕМЕНИ и требуемой КВАЛИФИКАЦИИ работников: | ||
+ | в ряде | ||
+ | перерабатывать имеющиеся материалы. | ||
+ | |||
+ | Пример №1 | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | Пример №2 | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | В итоге, перевод номеров за 1998-2005 годы потребовал в разы больше | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | Пример №3 | ||
+ | |||
+ | | ||
+ | 1970 - 1997 года тяжелее, | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | в XLS формат - это профессиональные машинистки. | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | В результате машинистки вынуждены выполнять несвойственную им | ||
+ | | ||
+ | | ||
+ | |||
+ | Практически | ||
+ | чем проведение работы правильно "с нуля" | ||
+ | |||
+ | ===== Процесс создания электронного архива " | ||
+ | |||
+ | Исходя из требований качества, | ||
+ | требований | ||
+ | следующая схема процесса создания электронного архива: | ||
+ | |||
+ | 1) | ||
+ | ПОСЛЕДОВАТЕЛЬНЫЕ этапы обработки: | ||
+ | |||
+ | * Поступление номера на обработку | ||
+ | * Сканирование в TIFF (на сканере OpticBook - в ч/б, серые и цветные сканы, 300 dpi, правильное кадрирование) | ||
+ | * Проверка полученного материала на качество | ||
+ | * Выборочная цветокоррекция (страницы в градациях серого и цветные) | ||
+ | * Сохранение обработанных TIFF файлов на DVD (TIFF архив) | ||
+ | * Выборочное исправление наклона (шаг можно пропустить) | ||
+ | * Перевод TIFF -> DJVU | ||
+ | |||
+ | ^ далее два ПАРАЛЛЕЛЬНЫХ процесса | ||
+ | |Создание оглавления в XLS |Создание текстового слоя (OCR) | | ||
+ | |Проверка и вычитка оглавления | ||
+ | |Сборка оглавления XLS -> HTML | | | ||
+ | | слияние параллельных процессов | ||
+ | |||
+ | * Внедрение оглавления в DJVU файл | ||
+ | * Окончание обработки номера | ||
+ | |||
+ | 2) Параллельно с этим идёт процесс разработки программного обеспечения | ||
+ | для | ||
+ | тематического рубрикатора. | ||
+ | |||
+ | 3) Новые | ||
+ | ПОСЛЕДОВАТЕЛЬНУЮ технологическую цепочку: | ||
+ | |||
+ | * Поступление номера на обработку | ||
+ | * Перевод PDF -> DJVU | ||
+ | * Создание оглавления в XLS | ||
+ | * Проверка и вычитка оглавления | ||
+ | * Сборка оглавления XLS -> HTML | ||
+ | * Внедрение оглавления в DJVU файл | ||
+ | * Окончание обработки номера | ||
+ | |||
+ | ===== Критерии для PDF файлов ===== | ||
+ | |||
+ | PDF файлы должны удовлетворять следующим требованиям: | ||
+ | |||
+ | * Единый PDF Файл должен содержать все страницы журнала в правильном порядке | ||
+ | * Все шрифты целиком внедрены в PDF | ||
+ | * Кодировки внедрённых шрифтов не являются " | ||
+ | * PDF файл создан без ограничений на печать/ | ||
+ | * PDF содержит страницу "В номере" | ||
+ | * Иллюстрации должны быть сохранены в RGB, так чтобы цвета соответствовали отпечатанному журналу | ||
+ | * Внедрённые картинки должны быть сохранены со следующими параметрами: | ||
+ | - цветные и серые: 300 dpi, JPG, максимальное качество | ||
+ | - чёрно-белые в исходном разрешении (downsample off), CCITT G4 | ||
+ | |||
+ | ===== Качество DJVU ===== | ||
+ | |||
+ | По поводу специальных требований к страницам, | ||
+ | |||
+ | Я пропускал их через Кромсатор, | ||
+ | |||
+ | Была ещё одна тонкость - надо было принудительно добавлять поля снизу - special gap, дабы выравнивание текста на получающейся странице было такоеже, | ||
+ | |||
+ | Слушай, | ||
+ | |||
+ | И в номере 1992_02 фон как-то странно удалён - остался серый фон и видны границы страницы... | ||
+ | |||
+ | например 1992_02 стр 6, 19, 28, 30, 38.... Что-то тут не так. | ||
+ | |||
+ | стр 57 и так далее. | ||
+ | |||
+ | Ты чем в DJVU конвертировал? | ||
+ | |||
+ | Кстати, | ||
+ | |||
+ | Практически все номера сделаны с подобными глюками - чёрно белые страницы закодированы как полноцветные, | ||
+ | |||
+ | Объясни, | ||
+ | |||
+ | хм... | ||
+ | так как мы с тобой договаривались, | ||
+ | 1. проход бетчем фотошопа (цветокоррекция) | ||
+ | 2. ручной просмотр всех страниц, | ||
+ | 3. компрессия в дежавю с использованием твоего скрипта | ||
+ | где мог быть глюк...? | ||
+ | |||
+ | бетч из пункта 1 как базовый я брал твой с сайта | ||
+ | |||
+ | У тебя после прохода фотошопом должны были получиться TIFF ч/б страницы черно белыми (двуцветными, | ||
+ | |||
+ | На пункте 2 ты явно пропустил те страницы, | ||
+ | |||
+ | Скрипт для фотошопа требует настройки - там надо подстраивать один из этапов levels - я об этом писал. | ||
+ | |||
+ | Скорее всего ты на этапе фотошопа изменил цветовое кодирование в RGB для всех страниц. | ||
+ | |||
+ | И на счёт обложек - либо ты их подрезал наряду со всеми внутренними страницами, |
science_and_life/archive_quality.txt · Last modified: 2008/12/11 13:01 by 127.0.0.1