有没有办法分割python字符串而不生成新字符串？

网友

1楼 · 编辑于 2024-06-01 11:02:34

在Python中，字符串是不可变的。这意味着任何更改字符串的操作都将创建一个新字符串。如果您担心内存（虽然这不是什么大问题，除非您处理的是巨大的字符串），您可以总是用新的、修改过的字符串覆盖旧字符串，替换它。在

不过，您描述的情况稍有不同，因为split的输入是一个字符串，而输出是一个字符串列表。他们是不同的类型。在本例中，我只需创建一个包含split输出的新变量，然后将旧字符串（即split函数的输入）设置为None，因为您可以保证它不会再次使用。在

代码：

split_str = input_string.split(delim)
input_string = None

网友

2楼 · 编辑于 2024-06-01 11:02:34

也许python的方法是使用迭代器？这样，新的子串一次只能在内存中出现一个。基于 Splitting a string into an iterator：

import re
string_long = "my_string " * 100000000 # takes some memory
# strings_split = string_long.split()  # takes too much memory
strings_reiter = re.finditer("(\S*)\s*", string_long) # takes no memory
for match in strings_reiter:
    print match.group()

这样可以很好地工作而不会导致内存问题。在

网友

3楼 · 编辑于 2024-06-01 11:02:34

唯一的选择是使用切片而不是split来访问子字符串。您可以使用str.find来查找每个分隔符的位置。然而，这将是缓慢和微妙的。如果您可以使用split并将原始字符串从作用域中删除，那么这样做是值得的。在

你说这个字符串是输入的，所以你可以考虑读更少的字符，这样你就可以处理更容易管理的块了。你真的需要所有的数据同时存储在内存中吗？在

相关问题更多 >

编程相关推荐

热门问题

热门文章