Pythonre.split方法分割字符串的实现示例

2022-08-19 14:46:36
目录
re.split方法问题解决方案讨论

re.split方法

注:使用前需要引入包(import>

功能:split能够按照所能匹配的字串将字符串进行切分,返回切分后的字符串列表

形式:

re.split(pattern, string[, maxsplit=0, flags=0])
    pattern:匹配的字符串string:需要切分的字符串maxsplit:分隔次数,默认为0(即不限次数)flags:标志位,用于控制正则表达式的匹配方式,比如:是否区分大小写

    问题

    你需要将一个字符串分割为多个字段,但是分隔符(还有周围的空格)并不是固定的。

    解决方案

    string>

    >>> line = 'asdf fjdk; afed, fjek,asdf, foo'
    >>> import re
    >>> re.split(r'[;,\s]\s*', line)
    ['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
    

    讨论

    函数>

    当你使用 re.split() 函数时候,需要特别注意的是正则表达式中是否包含一个括号捕获分组。 如果使用了捕获分组,那么被匹配的文本也将出现在结果列表中。比如,观察一下这段代码运行后的结果:

    >>> fields = re.split(r'(;|,|\s)\s*', line)
    >>> fields
    ['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']
    >>>
    

    获取分割字符在某些情况下也是有用的。 比如,你可能想保留分割字符串,用来在后面重新构造一个新的输出字符串:

    >>> values = fields[::2]
    >>> delimiters = fields[1::2] + ['']
    >>> values
    ['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
    >>> delimiters
    [' ', ';', ',', ',', ',', '']
    >>> # Reform the line using the same delimiters
    >>> ''.join(v+d for v,d in zip(values, delimiters))
    'asdf fjdk;afed,fjek,asdf,foo'
    >>>
    

    如果你不想保留分割字符串到结果列表中去,但仍然需要使用到括号来分组正则表达式的话, 确保你的分组是非捕获分组,形如 (?:...) 。比如:

    >>> re.split(r'(?:,|;|\s)\s*', line)
    ['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
    >>>
    

    到此这篇关于Python re.split方法分割字符串的实现示例的文章就介绍到这了,更多相关Python re.split分割字符串内容请搜索易采站长站以前的文章或继续浏览下面的相关文章希望大家以后多多支持易采站长站!