您当前的位置:首页 > 计算机 > 文件格式与编码

英语音标和Unicode

时间:07-17来源:作者:点击数:

1 缘起

我本来是要整理一份英语音标的替换表。在cnbook中使用这个替换表可以把金山词霸的音标转换到音标对应的Unicode字符,就可以正确显示了。 在整理替换表的过程中,发现网上很多关于音标的文章还是图片形式,很多网友还在用特殊字体来输入和显示音标。

其实使用Unicode后,我们基本上可以像处理普通字符一样处理音标。于是我整理了这篇关于英语音标和Unicode的文章。 本文假设读者了解Unicode。如果您不熟悉Unicode,可以参考我以前的一些文章:

2 特殊字体

目前很多网友使用特殊字体来输入和显示音标。例如金山词霸的Ksphonet.ttf。这些字体把一些普通的ascii字符映射成英语音标。例如将A映射成æ。 用户输入的其实还是A。安装过这种字体的用户可以在Word里实验一下:输入字母A后,将其字体设置为“Kingsoft Phonetic Plain”后,它就被显示成æ。

我们把这样输入的音标复制到其它文本编辑器,其它编辑器按当前字体显示,就会显示出这些音标的原形,即普通的ascii字符。 例如我在一个网站上看到过如下的DJ音标介绍:

英语音标表(英语国际音标表,dj音标) 
单元音 短元音 [E] [O] [u] [V] [e] [Q] 
单元音 长元音 [i:] [E:] [O:] [u:] [A:] 
双元音 [ei] [ai] [Oi] [au] [Eu] [iE] [CE] [uE] 
清浊成对的辅音 清辅音 [p] [t] [k] [F] [T] [s] [ts] [S] [tS]  
清浊成对的辅音 浊辅音 [B] [d] [G] [v] [D] [z] [dz] [dr] [Z] [dZ] 
其它辅音 [H] [M] [n] [N] [l] [r] [J] [W] 

很容易猜到,编辑是将Word中正常显示的音标直接复制过来的。编辑在Word中使用了GWIPA字体把这些普通字符显示成音标。 但在网页上,浏览器没有用GWIPA字体显示这些字符,所以就看到了本来的ascii字符。GWIPA字体采用了以下映射关系:

我按照这个映射关系做一个替换表,将普通字符转换成对应音标的Unicode字符,就可以得到:

英语音标表(英语国际音标表,dj音标)
单元音 短元音 [ə] [ɔ] [u] [ʌ] [e] [æ]
单元音 长元音 [i:] [ə:] [ɔ:] [u:] [ɑ:]
双元音 [ei] [ai] [ɔi] [au] [əu] [iə] [ɛə] [uə]
清浊成对的辅音 清辅音 [p] [t] [k] [f] [θ] [s] [ts] [ʃ] [tʃ]
清浊成对的辅音 浊辅音 [b] [d] [g] [v] [ð] [z] [dz] [dr] [ʒ] [dʒ]
其它辅音 [h] [ŋ] [n] [N] [l] [r] [j] [w]

3 Unicode字符的显示

不是所有字体都能显示音标对应的Unicode字符。在Windows的默认字体中目前只有"Lucida Sans Unicode"支持这些音标字符。还有一些字符能很好地支持Unicode,例如"Arial Unicode MS"和网友开发的UniFonts。 不过这些字体需要用户单独安装。在设计网页时不能假设用户安装过这些字体。

因为Windows默认支持一些Unicode字体(例如"Lucida Sans Unicode"),所以与前面介绍的特殊字体相比,使用Unicode字符有更好的可移植性。更重要的是我们使用了统一的音标字符编码。

目前的浏览器在显示网页时,还不能自动选择支持音标字符的Unicode字体。所以网页设计者需要用css建议浏览器选择可以支持音标字符的字体。例如:

.IPA {
	FONT-FAMILY: "Charis SIL", "Doulos SIL", Gentium, GentiumAlt,
                 "DejaVu Sans", Code2000, "TITUS Cyberbit Basic",
                 "Arial Unicode MS", "Lucida Sans Unicode",
                 "Chrysanthi Unicode"
}

在不方便使用css的场合也可以用font标签,例如:

<font face="Lucida Sans Unicode" lang="EN-US">θ</font>

请注意参数: lang="EN-US"。如果没有这个参数,有些音标不能正确显示,例如重音符号ˈ和ˌ。 在应用css样式时也应该使用lang参数。

4 IPA符号

4.1 概述

这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。 根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。 有一个关于"The International Phonetic Alphabet in Unicode"的网页上面有IPA符号对应的Unicode字符的列表。 还有个网页提供了IPA字符输入功能。 只要点击网页上的字符,字符就会出现在下方的编辑框中。

关于英语语音有一本很著名的书:"English Pronouncing Dictionary",简称EPD。这本书的作者是Daniel JONES,现在经常看到的DJ音标的DJ就来自这位学者。 EPD的第一版是在1917年出版的,以后又陆续出版过很多版本。EPD的第14版首次在1977年出版。1988年,由AC Gimson和SM Ransaran修订过的EPD第14版又重新出版。 1988年的EPD版本的音标使用IPA符号取代了一些传统音标符号。以后英语字典的音标系统基本上都使用与EPD 1988版一致的IPA符号。后面会讨论音标符号的变化。

4.2 英语音标需要的特殊字符

因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。 那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。

音标符号 10进制Unicode编码 16进制Unicode编码
æ 230 00E6
ð 240 00F0
ŋ 331 014B
ɑ 593 0251
ɒ 594 0252
ɔ 596 0254
ə 601 0259
ɛ 603 025B
ɜ 604 025C
ɡ 609 0261
ɪ 618 026A
ʃ 643 0283
ʊ 650 028A
ʌ 652 028C
ʒ 658 0292
ˈ 712 02C8
ˌ 716 02CC
ː 720 02D0
θ 952 03B8

5 英语音标

5.1 概述

音标就是记录英语读音的符号系统。每个英语字典都会选择一套这样的符号系统。字典的编撰者有时会在标准的音标系统基础上增加自己的音标。 新增的音标通常也用IPA符号表示。例如最常见的音标有20个元音和24个辅音,Collins词典的音标系统有27个元音音标,28个辅音音标。 Collins增加了一些可以更好地表达“r化韵”和其它细节的音标,例如 ər, ə:r, ɔ:r, ɑ:r, ɪər, eər, ʊərən, əl, hw

网上有个48个标准音标的说法,就是在44个常见音标基础上增加了ts,tr,dz,dr这4个辅音。 我没有考证出这个标准究竟是哪个组织的“标准”,标准号是多少,就只能存疑了。

网上关于英语音标种类的说法有点混乱。一般而言,英语国际音标、IPA音标、DJ音标这3个提法比较接近,本文将其都称作IPA音标,而且只讨论其中的44个常见音标。 为方便起见,将采用IPA字符前的IPA音标称作IPA63,把采用IPA字符后的IPA音标称作IPA88。 还有一种出自美语发音字典的KK音标也比较常见,KK的缩写来自作者John S. Kenyon和Thomas A. Knott。KK音标的表示方法与IPA音标有一些差异。 下表显示了IPA63、IPA88和KK音标在符号上的差异。

单元音短元音 IPA63 i ə ɔ u ʌ e æ  
IPA88 ɪ ə ɒ ʊ ʌ e æ  
KK ɪ ə ɑ ʊ ʌ ɛ æ  
单元音长元音 IPA63 i: ə: ɔ: u: ɑ:      
IPA88 i: ɜ: ɔ: u: ɑ:      
KK i ɜ ɔ u ɑ      
双元音 IPA63 ei ai ɔi au əu ɛə
IPA88 ɔɪ əʊ ɪə ʊə
KK e ɔɪ o ɪr ɛr ʊr
清浊成对辅音 清辅音 p t k f θ s ʃ
浊辅音 b d ɡ v ð z ʒ
其它辅音 h m n ŋ l r j w

下面这张截图看上去可能更清晰一些:

讨论了使用IPA字符前后IPA音标的变化。

5.2 IPA63、IPA88、KK音标和Collins音标的例子

我比较习惯IPA63的音标,因为看惯了。不过我最近一直在用Collins词典。可以把Collins词典的音标看作IPA88的扩充。 除了增加了一些可以更好表达美式发音的音标外,Collins词典还把 əʊ 写成 oʊ。 oʊ可以更精确地表达美式发音, 但更多的英国词典使用əʊ。 。 关于英语音标有一个不错的网页。这个网页的音标和IPA88、Collins词典比较接近。

我整理了一张包括IPA63、IPA88、KK音标和Collins音标示例的表格。

  示例单词 IPA63 IPA63示例 IPA88 IPA88示例 KK KK示例 Collins Collins示例
单元音短元音 sit i [sit] ɪ [sɪt] ɪ [sɪt] ɪ /sɪt/
about ə [əˈbaut] ə [əˈbaʊt] ə [əˈbaʊt] ə /əbaʊt/
forget   [fəˈget]   [fəˈget]   [fəˈgɛt] ər /fərget/
hot ɔ [hɔt] ɒ [hɒt] ɑ [hɑt] ɒ /hɒt/
good u [gud] ʊ [gʊd] ʊ [gʊd] ʊ /gʊd/
luck ʌ [lʌk] ʌ [lʌk] ʌ [lʌk] ʌ /lʌk/
yes e [jes] e [jes] ɛ [jɛs] e /jes/
man æ [mæn] æ [mæn] æ [mæn] æ /mæn/
单元音长元音 week i: [wi:k] i: [wi:k] i [wik] i: /wi:k/
very   [ˈveri:]   [ˈveri:]   [ˈvɛri] i /veri/
turn ə: [tə:n] ɜ: [tɜ:n] ɜ [tɜn] ə:r /tə:rn/
claw ɔ: [klɔ:] ɔ: [klɔ:] ɔ [klɔ] ɔ: /klɔ:/
floor   [flɔ:r]   [flɔ:r]   [flɔr] ɔ:r /flɔ:r/
school u: [sku:l] u: [sku:l] u [skul] u: /sku:l/
actual   [ˈæktʃuəl]   [ˈæktʃʊəl]   [ˈæktʃuəl] u /æktʃuəl/
calm ɑ: [kɑ:m] ɑ: [kɑ:m] ɑ [kɑm] ɑ: /kɑ:m/
card   [kɑ:d]   [kɑ:d]   [kɑd] ɑ:r /kɑ:rd/
双元音 say ei [sei] [seɪ] e [se] /seɪ/
bike ai [baik] [baɪk] [baɪk] /baɪk/
boy ɔi [bɔi] ɔɪ [bɔɪ] ɔɪ [bɔɪ] ɔɪ /bɔɪ/
house au [haus] [haʊs] [haʊs] /haʊs/
coat əu [kəut] əʊ [kəʊt] o [kot] /koʊt/
dear [diə] ɪə [dɪə] ɪr [dɪr] ɪər /dɪər/
care ɛə [kɛər] [keər] ɛr [kɛr] r /keər/
tour [tuər] ʊə [tʊər] ʊr [tʊr] ʊər /tʊər/
清辅音 pay p [pei] p [peɪ] p [pe] p /pei/
talk t [tɔ:k] t [tɔ:k] t [tɔk] t /tɔ:k/
king k [kiŋ] k [kɪŋ] k [kɪŋ] k /kiŋ/
fit f [fit] f [fɪt] f [fɪt] f /fɪt/
thin θ [θin] θ [θɪn] θ [θɪn] θ /θɪn/
bus s [bʌs] s [bʌs] s [bʌs] s /bʌs/
ship ʃ [ʃip] ʃ [ʃɪp] ʃ [ʃɪp] ʃ /ʃɪp/
cheap [tʃi:p] [tʃi:p] [tʃip] /tʃi:p/
浊辅音 bed b [bed] b [bed] b [bɛd] b /bed/
done d [dʌn] d [dʌn] d [dʌn] d /dʌn/
dog ɡ [dɔɡ] ɡ [dɒɡ] ɡ [dɑɡ] ɡ /dɒɡ/
voice v [vɔis] v [vɔɪs] v [vɔɪs] v /vɔɪs/
then ð [ðen] ð [ðen] ð [ðɛn] ð /ðen/
buzz z [bʌz] z [bʌz] z [bʌz] z /bʌz/
measure ʒ [ˈmeʒə] ʒ [ˈmeʒə] ʒ [ˈmɛʒə] ʒ /meʒər/
bridge [bridʒ] [brɪdʒ] [brɪdʒ] /brɪdʒ/
其它辅音 home h [həum] h [həum] h [hom] h /houm/
mat m [mæt] m [mæt] m [mæt] m /mæt /
not n [nɔt] n [nɒt] n [nɑt] n /nɒt/
hidden   [ˈhidn]   [ˈhɪdn]   [ˈhɪdn] ən /hɪdən/
sing ŋ [siŋ] ŋ [sɪŋ] ŋ [sɪŋ] ŋ /sɪŋ/
late l [leit] l [leɪt] l [leɪt] l /leɪt/
handle   [ˈhændl]   [ˈhændl]   [ˈhændl] əl /hændəl/
run r [rʌn] r [rʌn] r [rʌn] r /rʌn/
you j [ju:] j [ju:] j [ju] j /ju:/
win w [win] w [wɪn] w [wɪn] w /wɪn/
why   [hwai]   [hwaɪ]   [hwaɪ] hw /hwaɪ/

6 音标符号的输入

在学习英语时,我更常做的是复制金山词霸里的音标,只要作个替换表将原来的普通字符映射到Unicode字符就可以了,通常不需要手工输入。输入音标,我想最简单的方法就是复制粘贴了。

在office软件中,可以用自动更正选项输入音标。例如设置将Yi更正为ɪ。 只要输入Yi、空格,软件就会自动将Yi更正为ɪ。 只要在office的一个软件里设置了自动更正,其它软件会共享这个设置。 不过office软件的自动更正是针对单词的,即Yi不能和其它字母连着。在输入后面一个空格时,office软件进行更正。 这一点不太方便,因为每次输入都要删除多余的空格。

熟悉输入法码表的朋友可以把这几个音标字符加到自定义的码表中。

仿照IPA的网页,本站提供了一个英语音标输入的网页。只要点击网页上的音标字符,该字符就会被插入到下方的编辑框中。有兴趣的朋友可以试试。

7 结束语

有很多网友使用特殊的音标字体输入和显示音标。不同的音标字体对普通字符和音标字符的映射关系通常是不同的。如果读者没有安装对应的字体就无法正确阅读。 使用音标的Unicode字符应该是解决音标输入和显示的标准做法。使用统一的信息编码,大家可以更好地交流。希望在网上看到更多用Unicode表示的音标。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门