python去除所有html标签的方法
import re html='<a href="//www.cdsy.xyz">城东书院</a>,Python学习!' dr = re.compile(r'<[^>]+>',re.S) dd = dr.sub('',html) print(dd)
运行结果如下:
城东书院,Python学习!