BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。
先解释下数据存贮方式:
1、在windows中,颜色顺序是:B G R。
2、BMP的内存行顺序和图像显示的行顺序是上下颠倒的。即:BMP内存第0行,是真实图像下面的最后一行。
举例,假如图像为2*2大小,像素三颜色按照RGB的顺序, 我们看到的图像为:
1 2 3, 11 22 33
4 5 6, 44 55 66
内存表示如下:
6 5 4, 66 55 44 (0 0) -- 第0行
3 2 1, 33 22 11(0 0) -- 第1行
注意,通常内存是需要内存对齐的,所以每行后面可能会有对齐所产生的0.
最常见的就是24位图,所谓的24位图,就是说一个像素的颜色信息用24位来表示,也就是说,对于三原色BRG,每一个颜色都用以字节(8)位来表示。除了24位图,还有1位(单色),2位(4色,CGA),4位(16色,VGA),8位(256色),16位(增强色),24位(真彩色)和32位等
BMP文件的数据按照从文件头开始的先后顺序分为四个部分:
◆位图文件头(bmp file header):提供文件的格式、大小等信息 共14字节
◆位图信息头(bitmap information):提供图像数据的尺寸、位平面数、压缩方式、颜色索引等信息共40字节
◆调色板(color palette):可选,如使用索引来表示图像,调色板就是索引与其对应的颜色的映射表
◆位图数据(bitmap data):图像数据区
bmp文件头包含如下信息:
下图的数据就是bmp文件头:
一共14字节,下面逐个解释。
0-1:bfType,表示文件类型,BMP格式的文件这两个字节是0x4D42,10进制就是19778,字符显示就是‘BM’;
2-5:bfSize,表示文件的大小,这里的是0x0004B436,十进制是308278,也就是301kb,检查文件信息,验证正确;
6-7:bfReserved1,保留位,必须设置为0;
8-9:bfReserved2,保留位,必须设置为0;
a-d:bfOffBits,4字节的偏移,表示从文件头到位图数据的偏移,这里是0x00000436,十进制是1078,后面会做验证;
3、位图信息头(bitmap information)
位图信息头一共40字节,包含如下内容:
下图数据是位图信息头:
一共40字节,解释如下:
0e-11:4字节的biSize,这里是0x28,即十进制的40,验证正确;
12-15:4字节的biWidth,这里是0x00000280,即十进制的640,用像素表示图像的宽度,查看文件信息验证正确;
16-19:4字节的biHeight,这里是0x000001E0,即十进制的480,用像素表示图像的高度,查看文件信息验证正确;同时,这是一个正数,表示图像是倒立的,即图像数据是从左下角到右上角排列的;
1a-1b:2字节的biPlanes,值为0x0001;
1c-1d:2字节的biBitCount,值是0x0008,即8,表示每个像素用8位表示,一共有256个颜色;
1e-21:4字节的biCompression,值是0,即BI_RGB格式,不压缩;
22-25:4字节的biSizeImage,图像的大小,值是0x0004B000,十进制为307200,由上面的bfSize(文件大小)和bfOffBits(文件头到数据的偏移)分别是308278和1078可以得到,biSizeImage=bfSize-bfOffBits,即图像大小=文件大小-偏移量;
26-29:4字节的biXPelsPerMeter,水平分辨率,值是0x00000EC4,十进制3780;
2a-2d:4字节的biYPelsPerMeter,垂直分辨率,值是0x00000EC4,十进制3780;
2e-31:4字节的biClrUsed,使用的颜色索引数,值是0x00000100,十进制256,与1c-1d得到的结论一致;
32-35:4字节的biClrImportant,重要的颜色索引数,值是0x00000100,十进制256;
4、调色板(Color Palette)
调色板是可选的,不过这里的8位色图有调色板。那么接下来的数据就是调色板了。调色板就是一个颜色的索引,这里是8位色图,一共有256中颜色,由于每个颜色都有RGB三原色,也就是要3个字节表示,这样的话256个颜色就不能表示所有的颜色,所以就需要一个索引,用一个字节的索引指向4个字节表示的颜色(RGB加上Alpha值)。如果把这4个字节表示为一个Color类型,那么调色板就是Color的数组。由于Color类型也是一个数组,调色板就像一个二维数组palette[N][4],其中N是颜色的数量,这里就是256。因此,这个例子中的调色板的大小就是256x4=1024字节,在调色板之前,有14字节的bmp文件头,40字节的位图信息头,加上1024字节的调色板,一共1078字节,也就是说真正的图像数据前面有1078字节,这和bmp文件头中的bfOffBits相符,验证了我们的讨论。
有的图像没有调色板,比如下面的24位色图:
头部数据如下:
根据上面的讨论可以知道,biBitCount是24(0x18),bfOffBits是54(0x36),即没有调色板,位图信息头接下来就是图像数据了。
调色板中的数据每4字节一组,分别表示蓝、绿、红和Alpha值。按照第一个图像举例来说:
索引 | 蓝 | 绿 | 红 | Alpha |
---|---|---|---|---|
0 | 01 | 10 | 37 | 00 |
1 | 00 | 10 | 49 | 00 |
2 | 00 | 18 | 44 | 00 |
3 | 01 | 1D | 58 | 00 |
5、位图数据
接下来就是位图数据了。由于是8位色图,所以每个像素用1个字节表示,取出每个字节,显示到相应的设备上就可以了。
注意,这里的biHeight为正数,说明图像倒立,从左下角开始到右上角,以行为主序排列。
如果是24位色图,按照BGR的顺序排列,32位色图按照BGRAlpha排列。
位图数据排列还有一个规则,就是对齐。
Windows默认的扫描的最小单位是4字节,如果数据对齐满足这个值的话对于数据的获取速度等都是有很大的增益的。因此,BMP图像顺应了这个要求,要求每行的数据的长度必须是4的倍数,如果不够需要进行比特填充(以0填充),这样可以达到按行的快速存取。这样的话,位图数据的大小就不一定是宽x高x每像素字节数了,因为每行还可能有0填充。
填充后的每行数据如下:
其中,BPP是每像素的比特数(Bits Per Pixel),即biBitCount,Width是宽度,单位是像素即bfWidth。
对于我们这个例子,BPP是8,Width是480,正好是4的倍数,也就是没有填充。来计算一下:
RowSize=4*(8*480/32)=480字节,验证没有填充。
那么以上面第二个图片24位色图为例,按照数据可以得到:
按照没填充计算:454*83*3=113046 bytes,与真实值相差166字节。
按照填充公式,每行有数据4*(24*454/32)=1364 字节,真正的数据有454*3=1362字节,也就是说每行填充了2字节0,一共83行,共填充83*2=166字节,验证了我们的讨论。
代码展示:
C语言结构体定义:
struct bmp_file //BMP文件头结构
{
char type[2]; //位图文件的类型,必须为BM,我这里类型不对,所以显示有误。
unsigned int size; //位图文件的大小,以字节为单位
short rd1; // 位图文件保留字,必须为0
short rd2; // 位图文件保留字,必须为0
unsigned int offset; // 位图数据的起始位置,以相对于位图
};
struct bmp_info //图像信息区
{
unsigned int bsize; //本结构体所占用字节数,即40个字节
int width; // 位图的宽度,以像素为单位,像素数量是4字节对齐的
int height; // 位图的高度,以像素为单位
unsigned short planes; // 目标设备的级别,必须为1
unsigned short count; // 每个像素所需的位数,必须是1(双色)// 4(16色),8(256色)或24(真彩色)之一
unsigned int compression; // 位图压缩类型,必须是 0(不压缩),// 1(BI_RLE8压缩类型)或2(BI_RLE4压缩类型)之一
unsigned int sizeimage; // 位图的大小,以字节为单位
unsigned int xmeter; // 位图水平分辨率,每米像素数
unsigned int ymeter; // 位图垂直分辨率,每米像素数
unsigned int cused; // 位图实际使用的颜色表中的颜色数
unsigned int cimportant; // 位图显示过程中重要的颜色数
};
struct bmp_head {
struct bmp_file file;
struct bmp_info info;
};
struct bmp_attr {
struct bmp_head head;
int xsize, ysize,sizeimage;
int pixel_size;
int line_length;
unsigned int offset;
};
struct bmp_attr *bmp = (struct bmp_attr *)calloc(1, sizeof(struct bmp_attr));
//读取bmp的文件头
fread(bmp, sizeof(struct bmp_attr), 1, fp);
bmp->xsize = (bmp->head.info.width * 3 + 3) / 4 * 4; // 4字节补齐
bmp->ysize = bmp->head.info.height;
bmp->sizeimage = bmp->head.info.sizeimage;
bmp->offset = bmp->head.file.offset;
printf("bmp xsize = %d ysize = %d sizeimage = %d offset = %d\n",bmp->xsize,bmp->ysize,bmp->sizeimage,bmp->offset);
可以获取头文件的信息,打印出来验证。
下面关于图片数据信息的获取
for (ix = 0; ix < bmp->ysize; ++ix) {
//因为bmp文件的原点是左下角,所以bmp图片需要顺着y轴的反方向来读取
fseek(fp, bmp->head.file.offset + (bmp->ysize -1 - ix) * bmp->line_length+1, SEEK_SET); //最后一行开始读取
//读取一行像素数
fread(buf, 1, bmp->line_length, fp);
这样数据就可以读取完啦!
头都开好了,还不去试一下?