您当前的位置:首页 > 计算机 > 编程开发 > Python

Python使用正则表达式检查书稿中不应该出现的重复字

时间:12-29来源:作者:点击数:

问题描述:在编写书稿和反复修改书稿时,很容易有多字的情况,例如“用户的的资料”、“需要需要用户输入”,这些不小心的错误用肉眼很难完全发现。但是设定好规则之后,代码是可以非常忠实地完成这个任务的。首先使用代码发现可疑字词,然后再人工确认,可以大幅度提高工作效率。

技术要点:1)正则表达式中[]表示范围;2)正则表达式元字符\num表示序号为num的子模式,其中整个正则表达式序号为0,第一个子模式序号为1,以此类推;3)正则表达式元字符?表示前面的字符可以出现也可以不出现;4)常用汉字的Unicode编码范围为\u4e00-\u9fa5;5)Python扩展库python-docx用来读写Word文档。

参考代码:

运行结果:

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门