int iswpunct (wint_t wc);
iswpunct() 函数用来检测一个宽字符是否是标点符号。
标点符号必须是图形字符(iswgraph() 返回“真”),但不能是字母,也不能是数字(iswalnum() 返回“假”)。
iswpunct() 是 ispunct()(位于<ctype.h>中)的宽字符版本:如果参数 wc 能够被 wctob() 转换为单个字节的形式,并且转换后的字符使用 ispunct() 检测返回“真”(非零值),那么 iswpunct() 也一定会将 wc 判定为标点符号。
返回值为非零(真)表示wc是标点符号,返回值为零(假)表示wc不是标点符号。
统计一个宽字符串中标点符号的个数。
#include <stdio.h>
#include <wchar.h>
#include <wctype.h>
int main ()
{
int i=0;
int cx=0;
wchar_t str[] = L"C,CPP,Java,Python!";
while (str[i])
{
if (iswpunct(str[i])) cx++;
i++;
}
wprintf (L"The sentence contains %d punctuation characters.\n", cx);
return 0;
}
运行结果:
一个宽字符是否是标点符号和程序的语言环境有关。C语言支持全球的语言系统,可以处理英文、中文、日文、韩文、德语、法语、拉丁文、希腊文等。
我们可以通过 setlocale() 函数进行地域设置,改变程序的语言环境,让程序使用 ASCII 以外的字符集,它们可能包含了更多的标点符号。
在默认的地域设置(默认为"C")中,C语言通常使用 ASCII 编码,此时,除了字母和十进制数字以外的所有图形字符都会被判定为标点符号;也就是说,是 iswgraph() 但不是 iswalnum() 的字符才是 ispunct() 的字符。
在其它地域设置中,程序可能会使用 GBK(简体中文)、BIG5(繁体中文)、Shift-JIS(日文)、Unicode(世界统一码) 等更加复杂的编码,它们包含了大量的标点符号,例如中文逗号,、句号。、省略号……等。但是,不管在哪种地域设置下,iswpunct() 都必须是 iswgraph(),但不能是 iswalnum()。
【实例】在简体中文环境下检测标点符号。
#include <wchar.h>
#include <wctype.h>
#include <locale.h>
int main ()
{
int i=0;
int cx=0;
wchar_t str[] = L"C、CPP、Java、Python、Golang!";
setlocale(LC_ALL, "zh_CN.UTF-8"); //设置为简体中文,使用 UTF-8 编码
//在 Windows 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "chs");
//在 Linux 下可以写作 setlocale(LC_ALL, ""); 或者 setlocale(LC_ALL, "zh_CN.UTF-8");
//在 Mac OS 下可以写作 setlocale(LC_ALL, "zh_CN"); 或者 setlocale(LC_ALL, "zh_CN.UTF-8");
while (str[i])
{
if (iswpunct(str[i])) cx++;
i++;
}
wprintf (L"The sentence contains %d punctuation characters.\n", cx);
return 0;
}
运行结果: