您当前的位置:首页 > 计算机 > 编程开发 > Python

python去掉字符串中多余的空格

时间:08-24来源:作者:点击数:

python去掉字符串中多余的空格

# -*- coding:utf-8 -*-
import re


# 检验某个字符是否是中文字符
def is_chinese(char):
    if '\u4e00' <= char <= '\u9fa5':
        return True
    return False

# 检验某个字符是否是英文文字符或数字
def is_english_char(char):
    if 97<=ord(char)<=122 or 65<=ord(char)<=90 or char.isdigit():
        return True
    return False

# 去掉字符串之间多余的空格
def del_space(strs_v):
    strs_v = strs_v.strip()
    # 计算出字符串中空格的所有位置,如果没有空格返回出空list
    index_list = [i.start() for i in re.finditer(' ', strs_v)]  # i.span()
    remove_index=[]
    for index in index_list:
        # # 如果空格字符串前面和后面有一个中文,去掉空格
        # if is_chinese(strs_v[index-1]) or is_chinese(strs_v[index+1]):
        #     remove_index.append(index)
        # 去掉空格前面的一个空格,如果英文里边中间隔了两个空格,去掉空格后面的一个空格的话,英文会连在一起
        # elif strs_v[index - 1] == ' ':  # or strs_v[index + 1]==' '
        #     remove_index.append(index)
        #空格前面不是字母或数字
        if not(is_english_char(strs_v[index-1])):
            remove_index.append(index)
        #空格前面是字母或数字,空格后面不是字母和数字且后面不是空格
        elif is_english_char(strs_v[index-1]) and (not is_english_char(strs_v[index+1]) and strs_v[index + 1]!=' '):
            remove_index.append(index)
    if remove_index !=[]:
        strs_v = ''.join([strs_v[i] for i in range(len(strs_v)) if i not in remove_index])

    return strs_v


if __name__ == '__main__':
    a='ALWIN  VANGARD INVESTMENT  LTD.  '
    print(del_space(a))
    a='中融 a 1 ( 信托  ansnns fff  展博 Lindman 6 Global Growth PE Fund'
    print(del_space(a))
    print(del_space(del_space(a)))
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门
本栏推荐