最近在弄硬件,买了一块彩屏,需要字库,所以就把很久以前会的知识拿出来温习了一遍,果然好多都记忆模糊了。
网上的很多代码我看过,很多都有问题,这里我帖出来的是我自己写的代码,应该没有问题。
HZK16字库是符合GB2312国家标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个,符号682个。 其中一级汉字有 3755个,按声序排列,二级汉字有3008个,按偏旁部首排列。
我们在一些应用场合根本用不到这么多汉字字模,所以在应用时就可以只提取部分字体作为己用。 HZK16字库里的16×16汉字一共需要256个点来显示,也就是说需要32个字节才能达到显示一个普通汉字的目的。
我们知道一个GB2312汉字是由两个字节编码的,范围为0xA1A1~0xFEFE。A1-A9为符号区,B0-F7为汉字区。 每一个区有94个字符(注意:这只是编码的许可范围,不一定都有字型对应,比如符号区就有很多编码空白区域)。
下面以汉字「我」为例,介绍如何在HZK16文件中找到它对应的32个字节的字模数据。
前面说到一个汉字占两个字节,这两个中前一个字节为该汉字的区号,后一个字节为该字的位号。 其中,每个区记录94个汉字,位号为该字在该区中的位置。所以要找到「我」在hzk16库中的位置就必须得到它的区码和位码。
这样我们就可以得到汉字在HZK16中的绝对偏移位置:offset = (94*(区码-1)+(位码-1))*32。
注解:
我画的图示:
所以,「我」在HZK16 16*16点阵字库的存放的序列为: (一行一行地保存,共16行,每行2个字节, 共32个字节)
- 04 80 0E A0 78 90 08 90 08 84 FF FE 08 80 08 90
- 0A 90 0C 60 18 40 68 A0 09 20 0A 14 28 14 10 0C
-
就像下面这样:
以下是我自己写的示例程序, 可以自己修改成其它的数据格式.(很简单, 所以没写注释)。
注意:作者当时写这段代码时的环境是 Windows 平台。Windows下从控制台输入的汉字默认是 cp936 代码页编码,此代码页编码出的汉字正好就是 GB2312 编码。
但是,如果是在类Linux环境下编译使用,则得不到正确的结果。因为类Linux系统默认编码是UTF-8。UTF-8编码的汉字是3个字节,和GB2312的2个字节并不一样。
所以,需要先将UTF-8编码转换成 cp936 编码,然后才能正确地索引字库中的汉字。
比如,现在有一个a.txt文件,内容是我(换行符\n(0x0A))请忽略。
- $ cat a.txt
- 我
- $ hexdump -C a.txt
- 00000000 e6 88 91 0a |....|
- 00000004
-
可以知道,我的UTF-8编码为:0xE6 0x88 0x91。
然后,用 iconv 转码:
- $ iconv -f utf-8 -t cp936 a.txt > b.txt
-
可以得到 GB2312/cp936 编码的中文:
- $ hexdump -C b.txt
- 00000000 ce d2 0a |...|
- 00000003
-
即,然后用0xCE 0xD2替换掉版本3中的word数组的值即可。
注:此代码由于编码问题,仅能在 Windows 上正确运行。如要在类Linux平台运行,请先转码。 版本1和版本2只能在Windows上正确运行,版本3能在Linux/Unix/macOS运行。
- #include <stdio.h>
-
- int main(void)
- {
- FILE* fphzk = NULL;
- int i, j, k, offset;
- int flag;
- unsigned char buffer[32];
- unsigned char word[3] = "我";
- unsigned char key[8] = {
- 0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01
- };
-
- fphzk = fopen("hzk16", "rb");
- if(fphzk == NULL){
- fprintf(stderr, "error hzk16\n");
- return 1;
- }
- offset = (94*(unsigned int)(word[0]-0xa0-1)+(word[1]-0xa0-1))*32;
- fseek(fphzk, offset, SEEK_SET);
- fread(buffer, 1, 32, fphzk);
- for(k=0; k<32; k++){
- printf("%02X ", buffer[k]);
- }
- for(k=0; k<16; k++){
- for(j=0; j<2; j++){
- for(i=0; i<8; i++){
- flag = buffer[k*2+j]&key[i];
- printf("%s", flag?"●":"○");
- }
- }
- printf("\n");
- }
- fclose(fphzk);
- fphzk = NULL;
- return 0;
- }
-
- #include <stdio.h>
- #include <stdlib.h>
-
- int main(void)
- {
- FILE* fphzk = NULL;
- int i, j, k, offset;
- int flag;
- unsigned char buffer[32];
- unsigned char word[5];
- unsigned char key[8] = {
- 0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01
- };
- fphzk = fopen("hzk16", "rb");
- if(fphzk == NULL){
- fprintf(stderr, "error hzk16\n");
- return 1;
- }
- while(1){
- printf("输入要生成字模的汉字(多个):");
- for(;;){
- fgets((char*)word, 3, stdin);
- if(*word == '\n')
- break;
- offset = (94*(unsigned int)(word[0]-0xa0-1)+(word[1]-0xa0-1))*32;
- fseek(fphzk, offset, SEEK_SET);
- fread(buffer, 1, 32, fphzk);
- for(k=0; k<16; k++){
- for(j=0; j<2; j++){
- for(i=0; i<8; i++){
- flag = buffer[k*2+j]&key[i];
- printf("%s", flag?"●":"○");
- }
- }
- printf("\n");
- }
- printf("uchar code key[32] = {");
- for(k=0; k<31; k++){
- printf("0x%02X,", buffer[k]);
- }
- printf("0x%02X};\n", buffer[31]);
- printf("\n");
- }
- }
- fclose(fphzk);
- fphzk = NULL;
- return 0;
- }
-
- #include <stdio.h>
- #include <stdlib.h>
-
- int main(void)
- {
- FILE* fphzk = NULL;
- int i, j, k, offset;
- int flag;
- unsigned char buffer[32];
- unsigned char word[2] = {0xCE, 0xD2}; // 改成你的转码后的汉字编码
- unsigned char key[8] = { 0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01 };
- fphzk = fopen("hzk16", "rb");
- if(fphzk == NULL){
- fprintf(stderr, "error hzk16\n");
- return 1;
- }
-
- offset = (94*(unsigned int)(word[0]-0xa0-1)+(word[1]-0xa0-1))*32;
- fseek(fphzk, offset, SEEK_SET);
- fread(buffer, 1, 32, fphzk);
- for(k=0; k<16; k++){
- for(j=0; j<2; j++){
- for(i=0; i<8; i++){
- flag = buffer[k*2+j]&key[i];
- printf("%s", flag?"●":"○");
- }
- }
- printf("\n");
- }
-
- for(k=0; k<31; k++){
- printf("0x%02X,", buffer[k]);
- }
-
- printf("\n");
-
- fclose(fphzk);
- fphzk = NULL;
- return 0;
- }
-
程序及源代码下载:mod.7z