PCX
- Формат файла изображения (.PCX)
- Декодирование файлов в формате .PCX
- Описание информации о палитре
- Примеры программ на C
Формат файла изображений (.PCX)
Информация данного раздела будет полезна для вас, если вы хотите написать программу для чтения или записи PCX файлов. Если вы хотите написать программу для изображений строго определенного формата, вы должны быть в состоянии создать нечто такое, что будет работать вдвое быстрее, чем "Load from..." в PC Paintbrush. Файлы изображений, которые используются в продуктах семейства PC Paintbrush и FRIEZE (с расширениями .PCX) начинаются с заголовка длиной 128 байт. Обычно вы можете игнорировать этот заголовок, если все ваши изображения будут иметь одинаковое разрешение. Если же вы хотите обрабатывать изображения с различным разрешением и разным количеством цветов, вам следует корректно интерпретировать информацию, находящуюся в данном заголовке. Оставшаяся часть файла с изображением состоит из закодированных графических данных. При кодировании используется простой алгоритм, основанный на методе длинных серий. Мы оставляем за собой право изменять этот алгоритм с целью повышения эффективности упаковки данных. Если в файле запоминается несколько цветовых слоев, каждая строка изображения запоминается по цветовым слоям (в общем случае красному-R, зеленому-G, синему-B и слою интенсивности-I) по схеме, приведенной ниже:
Строка изображения 0: RRR... GGG... BBB... III... Строка изображения 1: RRR... GGG... BBB... III... (и т.д.)
Замечание переводчика
Здесь в исходном документе имеет место явная некорректность. Запоминание по слоям проводится, как правило, для 16-цветных изображений EGA. В этом случае сначала запоминается содержимое строки из нулевого слоя видео памяти, затем из первого и т.д. Нетрудно заметить, что даже при стандартной палитре EGA, которая устанавливается по умолчанию BIOS'ом, нулевой слой видео памяти содержит СИНЮЮ компоненту цвета, а не красную. Если же палитра отлична от стандартной, то говорить о том, что слои видео памяти соотносятся с компонентами цвета вообще затруднительно.
Метод кодирования состоит в следующем:
ДЛЯ каждого байта X, прочитанного из файла ЕСЛИ оба старших бита X равны 1, то <повторитель> = 6 младшим битам X <данные> = следующему байту за X ИНАЧЕ <повторитель> = 1 <данные> = X
Поскольку для насыщения данного алгоритма требуется в среднем 25% неповторяющихся данных и по меньшей мере наличие смещения между повторяющимися данными, то размер получаемого файла, как правило оказывается приемлемым. Формат заголовка файла приведен ниже.
Замечание переводчика
Под насыщением алгоритма авторы документа по всей видимости понимают ситуацию, когда размер получаемого файла оказывается больше, чем объем требуемой видео памяти для представления записанного изображения. Нужно отметить, что с этой точки зрения формат PCX, безусловно, не лучший. В частности, такое насыщение достаточно часто имеет место для цветных реалистичных изображений, особенно, если при их создании применялись методы полутонирования.
Формат заголовка PCX
class { char Manufacturer; // Постоянный флаг 10 = ZSoft .PCX char Version; // 0 = Версия 2.5 // 2 = Версия 2.8 с информацией о палитре // 3 = Версия 2.8 без информации о палитре // 5 = Версия 3.0 char Encoding; // 1 = .PCX кодирование длинными сериями char BitsPerLayer; // Число бит на пиксел в слое unsigned int Xmin; // Размеры изображения unsigned int Ymin; // Размеры изображения unsigned int Xmax; // Размеры изображения unsigned int Ymax; // Размеры изображения unsigned int HRes; // Горизонтальное разрешение создающего устройства unsigned int VRes; // Вертикальное разрешение создающего устройства char Colormap[48]; // Набор цветовой палитры (см. далее текст) char Reserved; char NPlanes; // Число цветовых слоев unsigned int BPL; // Число байт на строку в цветовом слое // (для PCX-файлов всегда должно быть четным) unsigned int Palette; // Как интерпретировать палитру: // 1 = цветная/черно-белая, // 2 = градации серого char Filler[58]; // Заполняется нулями до конца заголовка }
Замечание переводчика
Во избежание недоразумений: в поле Window последовательно располагаются 4 целых числа, которые соответствуют угловым координатам изображения Xmin, Ymin, Xmax, Ymax. Как правило, Xmin и Ymin = 0.
Декодирование файлов в формате PCX
Сначала определите размер изображения, вычислив
[XSIZE = Xmax - Xmin + 1] и [YSIZE = Ymax - Ymin + 1].
Затем вычислите, сколько байтов требуется для сохранения одной несжатой строки развертки изображения: TotalBytes = NPlanes * BytesPerLine Отметим, что поскольку всегда используется целое число байтов, возможно существование неиспользуемых данных в конце каждой строки развертки. TotalBytes показывает сколько памяти должно быть доступно для декодирования каждой строки развертки, включая неиспользуемую информацию на правом конце каждой строки.
Теперь вы можете начать декодирование первой строки развертки - прочитайте первый байт данных из файла. Если два старших бита этого байта равны 1, оставшиеся шесть битов показывают сколько раз следует повторить СЛЕДУЮЩИЙ байт из файла. Если это не так, то этот байт сам является данными с повторителем равным 1. Продолжайте декодирование до конца строки, ведя подсчет количества байтов, переданных в буфер вывода. В конце каждой строки развертки имеет место остановка алгоритма кодирования, но ее не существует при переходе от одного слоя к другому. Когда строка сформирована полностью, в конце каждого слоя внутри строки возможно наличие лишних данных. Для нахождения этого остатка используйте значения XSIZE и YSIZE. Если данные являются многослойными, то BytesPerLine показывает, где заканчивается каждый слой внутри строки развертки.
Продолжайте декодирование оставшихся строк. В файле возможно наличие лишних строк с округлением на 8 или 16 строк.
Замечание переводчика
Как следует из приведенного описания, в конце каждой строки развертки предусматривается остановка алгоритма кодирования, т.е предполагается, что каждая строка развертки кодируется независимо. Однако мое знакомство с файлами в формате PCX показывает, что это не всегда так (файлы в этом формате пишет не только ZSoft Corpration !). Поэтому я бы советовал пользователям не рассчитывать на то, что такая остановка обязательно будет иметь место. Конец каждой строки лучше все-таки фиксировать по заполнении ее буфера. Это, безусловно, чуть усложнит программу декодирования, но сделает ее более гибкой. (Кстати говоря, графический редактор PC Paintbrush прекрасно понимает PCX файлы, записанные без остановки алгоритма кодирования в конце каждой строки, хотя при порождении собственных файлов такую остановку делает).
Описание информации о палитре
Информация о 16-цветной палитре (EGA/VGA)
Информация о палитре запоминается в одном из двух различных форматов. В стандартном формате RGB (IBM EGA, IBM VGA) данные запоминаются в 16 тройках. Каждая тройка состоит из 3 байтов со значениями красного (Red), зеленого (Green) и синего (Blue) цветов. Значения могут находиться в диапазоне 0-255, и поэтому необходима их интерпретация в формат используемого оборудования. Например, на IBM EGA существуют 4 возможных уровня RGB для каждого цвета. Поскольку 256/4 = 64, то ниже приведен список соответствия цветовых значений и уровней:
Значение Уровень 0-63 0 64-127 1 128-192 2 193-254 3
Информация о 256-цветной палитре VGA
В настоящее время ZSoft добавил возможность хранения в файле изображения PCX палитры, превышающей 16 цветов. 256-цветная палитра форматируется и интерпретируется точно также, как 16-цветная, естественно, за исключением того, что она длиннее. Палитра (число цветов x 3 байта длины) добавляется в конец PCX файла и ей предшествует байт с десятичным значением 12. Для определения палитры VGA BIOS вам достаточно разделить прочитанные значения цветов на 4.
Для доступа к 256-цветной палитре следует:
- Прочитать в заголовке поле Version. Если оно равно 5, палитра должна быть.
- Прочитать конец файла и отсчитать назад 769 байт. Найденное вами значение должно равняться 12, что указывает на присутствие 256-цветной палитры.
Замечание переводчика
Два замечания по поводу 256-цветной палитры.
Во-первых, между пунктами 1 и 2 приведенной инструкции я добавил бы следующий: "Прочитать в заголовке поле Bits per pixel. Если оно равно 8, 256-цветная палитра должна быть.". Смысл очевиден.
Во-вторых, в настоящее время довольно широкое распро- странение получил пакет программ .PCX Programmer's Toolkit фирмы Genus Microprogramming. В этом пакете (по крайней мере в известных мне версиях) принят способ хранения 256-цветной палитры несколько отличный от того, что был описан выше. Отличие состоит в том, что палитре предшествует байт с десятичным значением 10 (вместо 12), а значения цветовых компонент занимают младшие 6 битов в каждом из байтов цветовой тройки (т.е. изменяются от 0 до 63, как это принято в VGA BIOS).
Информация о цветовой палитре CGA
Для стандартной платы IBM CGA битовый набор для определения палитры более сложен. Используется только первый байт тройки. Первая тройка содержит только первый байт с осмысленным значением, который определяет цвет фона. Чтобы определить цвет фона, нужно значение этого байта (беззнаковое) разделить на 16. В результате будет получено значение в диапазоне 0-15, которое и определяет цвет фона. Вторая тройка содержит осмысленное значение первого байта, которое определяет значение палитры для трех оставшихся цветов. PC Paintbrush поддерживает для этих цветов 8 возможных палитр CGA, и, поскольку значение байта может быть от 0 до 255, его следует разделить на 32 (см. схему, приведенную ниже).
Taблица цветов для CGA Байт #16 в заголовке Цвет фона определяется 4 старшими битами. Байт #19 в заголовке Используются только 3 старших бита, остальные 5 игнорируются. Первые три бита обозначаются как C, P, I. Их интерпретация: C: разрешение color burst - 0 = color; 1 = monochrome P: палитра - 0 = желтая; 1 = белая I: яркость - 0 = малая; 1 = повышенная.
Замечание переводчика
Как видите, исходный документ умалчивает о том, в каких случаях информацию в заголовке файла следует трактовать как палитру CGA. Не исключено, что ветвление следует вести по полю Version заголовка.
Примеры программ на C
Приведенный ниже набор программ на C предназначен для чтения из PCX файла.
/* Данная процедура читает из файла один блок закодированных данных из файла и запоминает повторитель count и байт данных data. Результат: 0 = данные прочитаны EOF = данных нет (вышли за пределы файла) */ encget(pbyt, pcnt, fid) int *pbyt; /* сюда писать байт данных */ int *pcnt; /* сюда писать повторитель */ FILE *fid; /* ссылка на файл изображения */ { int i; *pcnt = 1; if(EOF == (i = getc(fid))) return(EOF); if(0xc0 == (0xc0 & i)) { *pcnt = 0x3f&i; if(EOF == (i=getc(fid))) return(EOF); } *pbyt = i; return(0); } /* Это фрагмент программы, использующей encget. Она читает файл целиком и запоминает результат декодирования в (большом) буфере, на который ссылается переменная "bufr". "fp" - это ссылка на файл с изображением */ while (EOF != encget(&chr, &cnt, fp)) for (i = 0; i < cnt; i++, *bufr++ = chr) Приведенный ниже набор программ предназначен для записи в .PCX файл. /* Эта программа кодирует содержимое одной строки изображения и записывает его в файл */ encLine(inBuff, inLen, fp) unsigned char *inBuff; /* указатель на строку данных */ int inLen; /* длина строки в байтах */ FILE *fp; /* указатель на запис. файл */ { /* возвращает число байтов, запис. в файл, или 0, если имела место ошибка */ unsigned char this, last; int srcIndex, i; register int total; register unsigned char runCount; /* макс. значение равно 63 */ total = 0; last = *(inBuff); runCount = 1; for (srcIndex = 1; srcIndex < inLen; srcIndex++) { this = *(++inBuff); if (this == last) { runCount++; /* он кодируется */ if (runCount == 63) { if (!(i=encput(last, runCount, fp))) return(0); total += i; runCount = 0; } } else { /* this != last */ if (runCount) { if (!(i=encput(last, runCount, fp))) return(0); total += i; } last = this; runCount = 1; } } /* конец цикла */ if (runCount) { /* завершение */ if (!(i=encput(last, runCount, fp))) return(0); return(total + i); } return(total); } /* программа для записи закодированной пары байтов (или одиночного байта, если он не кодируется) в файл */ encput(byt, cnt, fid) /* возвращает число записанных байтов или 0, если имела место ошибка */ unsigned char byt, cnt; FILE *fid; { if(cnt) { if( (cnt==1) && (0xc0 != (0xc0&byt)) ) { if(EOF == putc((int)byt, fid)) return(0); /* ошибка при записи на диск */ return(1); } else { if(EOF == putc((int)0xC0 | cnt, fid)) return(0); /* ошибка при записи на диск */ if(EOF == putc((int)byt, fid)) return(0); /* ошибка при записи на диск */ return(2); } } return(0); }