我本来是要整理一份英语音标的替换表。在cnbook中使用这个替换表可以把金山词霸的音标转换到音标对应的Unicode字符,就可以正确显示了。 在整理替换表的过程中,发现网上很多关于音标的文章还是图片形式,很多网友还在用特殊字体来输入和显示音标。
其实使用Unicode后,我们基本上可以像处理普通字符一样处理音标。于是我整理了这篇关于英语音标和Unicode的文章。 本文假设读者了解Unicode。如果您不熟悉Unicode,可以参考我以前的一些文章:
目前很多网友使用特殊字体来输入和显示音标。例如金山词霸的Ksphonet.ttf。这些字体把一些普通的ascii字符映射成英语音标。例如将A映射成æ。 用户输入的其实还是A。安装过这种字体的用户可以在Word里实验一下:输入字母A后,将其字体设置为“Kingsoft Phonetic Plain”后,它就被显示成æ。
我们把这样输入的音标复制到其它文本编辑器,其它编辑器按当前字体显示,就会显示出这些音标的原形,即普通的ascii字符。 例如我在一个网站上看到过如下的DJ音标介绍:
很容易猜到,编辑是将Word中正常显示的音标直接复制过来的。编辑在Word中使用了GWIPA字体把这些普通字符显示成音标。 但在网页上,浏览器没有用GWIPA字体显示这些字符,所以就看到了本来的ascii字符。GWIPA字体采用了以下映射关系:
我按照这个映射关系做一个替换表,将普通字符转换成对应音标的Unicode字符,就可以得到:
不是所有字体都能显示音标对应的Unicode字符。在Windows的默认字体中目前只有"Lucida Sans Unicode"支持这些音标字符。还有一些字符能很好地支持Unicode,例如"Arial Unicode MS"和网友开发的UniFonts。 不过这些字体需要用户单独安装。在设计网页时不能假设用户安装过这些字体。
因为Windows默认支持一些Unicode字体(例如"Lucida Sans Unicode"),所以与前面介绍的特殊字体相比,使用Unicode字符有更好的可移植性。更重要的是我们使用了统一的音标字符编码。
目前的浏览器在显示网页时,还不能自动选择支持音标字符的Unicode字体。所以网页设计者需要用css建议浏览器选择可以支持音标字符的字体。例如:
.IPA {
FONT-FAMILY: "Charis SIL", "Doulos SIL", Gentium, GentiumAlt,
"DejaVu Sans", Code2000, "TITUS Cyberbit Basic",
"Arial Unicode MS", "Lucida Sans Unicode",
"Chrysanthi Unicode"
}
在不方便使用css的场合也可以用font标签,例如:
<font face="Lucida Sans Unicode" lang="EN-US">θ</font>
请注意参数: lang="EN-US"。如果没有这个参数,有些音标不能正确显示,例如重音符号ˈ和ˌ。 在应用css样式时也应该使用lang参数。
这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。 根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。 有一个关于"The International Phonetic Alphabet in Unicode"的网页上面有IPA符号对应的Unicode字符的列表。 还有个网页提供了IPA字符输入功能。 只要点击网页上的字符,字符就会出现在下方的编辑框中。
关于英语语音有一本很著名的书:"English Pronouncing Dictionary",简称EPD。这本书的作者是Daniel JONES,现在经常看到的DJ音标的DJ就来自这位学者。 EPD的第一版是在1917年出版的,以后又陆续出版过很多版本。EPD的第14版首次在1977年出版。1988年,由AC Gimson和SM Ransaran修订过的EPD第14版又重新出版。 1988年的EPD版本的音标使用IPA符号取代了一些传统音标符号。以后英语字典的音标系统基本上都使用与EPD 1988版一致的IPA符号。后面会讨论音标符号的变化。
因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。 那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。
音标符号 | 10进制Unicode编码 | 16进制Unicode编码 |
æ | 230 | 00E6 |
ð | 240 | 00F0 |
ŋ | 331 | 014B |
ɑ | 593 | 0251 |
ɒ | 594 | 0252 |
ɔ | 596 | 0254 |
ə | 601 | 0259 |
ɛ | 603 | 025B |
ɜ | 604 | 025C |
ɡ | 609 | 0261 |
ɪ | 618 | 026A |
ʃ | 643 | 0283 |
ʊ | 650 | 028A |
ʌ | 652 | 028C |
ʒ | 658 | 0292 |
ˈ | 712 | 02C8 |
ˌ | 716 | 02CC |
ː | 720 | 02D0 |
θ | 952 | 03B8 |
音标就是记录英语读音的符号系统。每个英语字典都会选择一套这样的符号系统。字典的编撰者有时会在标准的音标系统基础上增加自己的音标。 新增的音标通常也用IPA符号表示。例如最常见的音标有20个元音和24个辅音,Collins词典的音标系统有27个元音音标,28个辅音音标。 Collins增加了一些可以更好地表达“r化韵”和其它细节的音标,例如 ər, ə:r, ɔ:r, ɑ:r, ɪər, eər, ʊər, ən, əl, hw
网上有个48个标准音标的说法,就是在44个常见音标基础上增加了ts,tr,dz,dr这4个辅音。 我没有考证出这个标准究竟是哪个组织的“标准”,标准号是多少,就只能存疑了。
网上关于英语音标种类的说法有点混乱。一般而言,英语国际音标、IPA音标、DJ音标这3个提法比较接近,本文将其都称作IPA音标,而且只讨论其中的44个常见音标。 为方便起见,将采用IPA字符前的IPA音标称作IPA63,把采用IPA字符后的IPA音标称作IPA88。 还有一种出自美语发音字典的KK音标也比较常见,KK的缩写来自作者John S. Kenyon和Thomas A. Knott。KK音标的表示方法与IPA音标有一些差异。 下表显示了IPA63、IPA88和KK音标在符号上的差异。
单元音短元音 | IPA63 | i | ə | ɔ | u | ʌ | e | æ | |
---|---|---|---|---|---|---|---|---|---|
IPA88 | ɪ | ə | ɒ | ʊ | ʌ | e | æ | ||
KK | ɪ | ə | ɑ | ʊ | ʌ | ɛ | æ | ||
单元音长元音 | IPA63 | i: | ə: | ɔ: | u: | ɑ: | |||
IPA88 | i: | ɜ: | ɔ: | u: | ɑ: | ||||
KK | i | ɜ | ɔ | u | ɑ | ||||
双元音 | IPA63 | ei | ai | ɔi | au | əu | iə | ɛə | uə |
IPA88 | eɪ | aɪ | ɔɪ | aʊ | əʊ | ɪə | eə | ʊə | |
KK | e | aɪ | ɔɪ | aʊ | o | ɪr | ɛr | ʊr | |
清浊成对辅音 | 清辅音 | p | t | k | f | θ | s | ʃ | tʃ |
浊辅音 | b | d | ɡ | v | ð | z | ʒ | dʒ | |
其它辅音 | h | m | n | ŋ | l | r | j | w |
下面这张截图看上去可能更清晰一些:
讨论了使用IPA字符前后IPA音标的变化。
我比较习惯IPA63的音标,因为看惯了。不过我最近一直在用Collins词典。可以把Collins词典的音标看作IPA88的扩充。 除了增加了一些可以更好表达美式发音的音标外,Collins词典还把 əʊ 写成 oʊ。 oʊ可以更精确地表达美式发音, 但更多的英国词典使用əʊ。 。 关于英语音标有一个不错的网页。这个网页的音标和IPA88、Collins词典比较接近。
我整理了一张包括IPA63、IPA88、KK音标和Collins音标示例的表格。
示例单词 | IPA63 | IPA63示例 | IPA88 | IPA88示例 | KK | KK示例 | Collins | Collins示例 | |
单元音短元音 | sit | i | [sit] | ɪ | [sɪt] | ɪ | [sɪt] | ɪ | /sɪt/ |
---|---|---|---|---|---|---|---|---|---|
about | ə | [əˈbaut] | ə | [əˈbaʊt] | ə | [əˈbaʊt] | ə | /əbaʊt/ | |
forget | [fəˈget] | [fəˈget] | [fəˈgɛt] | ər | /fərget/ | ||||
hot | ɔ | [hɔt] | ɒ | [hɒt] | ɑ | [hɑt] | ɒ | /hɒt/ | |
good | u | [gud] | ʊ | [gʊd] | ʊ | [gʊd] | ʊ | /gʊd/ | |
luck | ʌ | [lʌk] | ʌ | [lʌk] | ʌ | [lʌk] | ʌ | /lʌk/ | |
yes | e | [jes] | e | [jes] | ɛ | [jɛs] | e | /jes/ | |
man | æ | [mæn] | æ | [mæn] | æ | [mæn] | æ | /mæn/ | |
单元音长元音 | week | i: | [wi:k] | i: | [wi:k] | i | [wik] | i: | /wi:k/ |
very | [ˈveri:] | [ˈveri:] | [ˈvɛri] | i | /veri/ | ||||
turn | ə: | [tə:n] | ɜ: | [tɜ:n] | ɜ | [tɜn] | ə:r | /tə:rn/ | |
claw | ɔ: | [klɔ:] | ɔ: | [klɔ:] | ɔ | [klɔ] | ɔ: | /klɔ:/ | |
floor | [flɔ:r] | [flɔ:r] | [flɔr] | ɔ:r | /flɔ:r/ | ||||
school | u: | [sku:l] | u: | [sku:l] | u | [skul] | u: | /sku:l/ | |
actual | [ˈæktʃuəl] | [ˈæktʃʊəl] | [ˈæktʃuəl] | u | /æktʃuəl/ | ||||
calm | ɑ: | [kɑ:m] | ɑ: | [kɑ:m] | ɑ | [kɑm] | ɑ: | /kɑ:m/ | |
card | [kɑ:d] | [kɑ:d] | [kɑd] | ɑ:r | /kɑ:rd/ | ||||
双元音 | say | ei | [sei] | eɪ | [seɪ] | e | [se] | eɪ | /seɪ/ |
bike | ai | [baik] | aɪ | [baɪk] | aɪ | [baɪk] | aɪ | /baɪk/ | |
boy | ɔi | [bɔi] | ɔɪ | [bɔɪ] | ɔɪ | [bɔɪ] | ɔɪ | /bɔɪ/ | |
house | au | [haus] | aʊ | [haʊs] | aʊ | [haʊs] | aʊ | /haʊs/ | |
coat | əu | [kəut] | əʊ | [kəʊt] | o | [kot] | oʊ | /koʊt/ | |
dear | iə | [diə] | ɪə | [dɪə] | ɪr | [dɪr] | ɪər | /dɪər/ | |
care | ɛə | [kɛər] | eə | [keər] | ɛr | [kɛr] | eər | /keər/ | |
tour | uə | [tuər] | ʊə | [tʊər] | ʊr | [tʊr] | ʊər | /tʊər/ | |
清辅音 | pay | p | [pei] | p | [peɪ] | p | [pe] | p | /pei/ |
talk | t | [tɔ:k] | t | [tɔ:k] | t | [tɔk] | t | /tɔ:k/ | |
king | k | [kiŋ] | k | [kɪŋ] | k | [kɪŋ] | k | /kiŋ/ | |
fit | f | [fit] | f | [fɪt] | f | [fɪt] | f | /fɪt/ | |
thin | θ | [θin] | θ | [θɪn] | θ | [θɪn] | θ | /θɪn/ | |
bus | s | [bʌs] | s | [bʌs] | s | [bʌs] | s | /bʌs/ | |
ship | ʃ | [ʃip] | ʃ | [ʃɪp] | ʃ | [ʃɪp] | ʃ | /ʃɪp/ | |
cheap | tʃ | [tʃi:p] | tʃ | [tʃi:p] | tʃ | [tʃip] | tʃ | /tʃi:p/ | |
浊辅音 | bed | b | [bed] | b | [bed] | b | [bɛd] | b | /bed/ |
done | d | [dʌn] | d | [dʌn] | d | [dʌn] | d | /dʌn/ | |
dog | ɡ | [dɔɡ] | ɡ | [dɒɡ] | ɡ | [dɑɡ] | ɡ | /dɒɡ/ | |
voice | v | [vɔis] | v | [vɔɪs] | v | [vɔɪs] | v | /vɔɪs/ | |
then | ð | [ðen] | ð | [ðen] | ð | [ðɛn] | ð | /ðen/ | |
buzz | z | [bʌz] | z | [bʌz] | z | [bʌz] | z | /bʌz/ | |
measure | ʒ | [ˈmeʒə] | ʒ | [ˈmeʒə] | ʒ | [ˈmɛʒə] | ʒ | /meʒər/ | |
bridge | dʒ | [bridʒ] | dʒ | [brɪdʒ] | dʒ | [brɪdʒ] | dʒ | /brɪdʒ/ | |
其它辅音 | home | h | [həum] | h | [həum] | h | [hom] | h | /houm/ |
mat | m | [mæt] | m | [mæt] | m | [mæt] | m | /mæt / | |
not | n | [nɔt] | n | [nɒt] | n | [nɑt] | n | /nɒt/ | |
hidden | [ˈhidn] | [ˈhɪdn] | [ˈhɪdn] | ən | /hɪdən/ | ||||
sing | ŋ | [siŋ] | ŋ | [sɪŋ] | ŋ | [sɪŋ] | ŋ | /sɪŋ/ | |
late | l | [leit] | l | [leɪt] | l | [leɪt] | l | /leɪt/ | |
handle | [ˈhændl] | [ˈhændl] | [ˈhændl] | əl | /hændəl/ | ||||
run | r | [rʌn] | r | [rʌn] | r | [rʌn] | r | /rʌn/ | |
you | j | [ju:] | j | [ju:] | j | [ju] | j | /ju:/ | |
win | w | [win] | w | [wɪn] | w | [wɪn] | w | /wɪn/ | |
why | [hwai] | [hwaɪ] | [hwaɪ] | hw | /hwaɪ/ |
在学习英语时,我更常做的是复制金山词霸里的音标,只要作个替换表将原来的普通字符映射到Unicode字符就可以了,通常不需要手工输入。输入音标,我想最简单的方法就是复制粘贴了。
在office软件中,可以用自动更正选项输入音标。例如设置将Yi更正为ɪ。 只要输入Yi、空格,软件就会自动将Yi更正为ɪ。 只要在office的一个软件里设置了自动更正,其它软件会共享这个设置。 不过office软件的自动更正是针对单词的,即Yi不能和其它字母连着。在输入后面一个空格时,office软件进行更正。 这一点不太方便,因为每次输入都要删除多余的空格。
熟悉输入法码表的朋友可以把这几个音标字符加到自定义的码表中。
仿照IPA的网页,本站提供了一个英语音标输入的网页。只要点击网页上的音标字符,该字符就会被插入到下方的编辑框中。有兴趣的朋友可以试试。
有很多网友使用特殊的音标字体输入和显示音标。不同的音标字体对普通字符和音标字符的映射关系通常是不同的。如果读者没有安装对应的字体就无法正确阅读。 使用音标的Unicode字符应该是解决音标输入和显示的标准做法。使用统一的信息编码,大家可以更好地交流。希望在网上看到更多用Unicode表示的音标。