将gsub命令从R转换成Python

2024-10-01 02:36:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我想拆分这个mystring=“0G15^GAC0T60T4^AA0C0”,并使用python获得以下输出:

['0','G','15','^GAC','T','60','T','4','^AA','C']

可以使用R中的以下命令执行此操作:

^{pr2}$

如何将R脚本翻译成python?在

谢谢


Tags: 命令脚本aamystringpr2gacgac0t60t4aa0c0
2条回答

你可以试试这个:

mystring="0G15^GAC0T60T4^AA0C0" 
import re
new_data = re.findall('(?<!\^[GAC])\d+|(?<!\^)\w|\^[a-zA-Z]+', mystring)
final_data = [a for i, a in enumerate(new_data) if a != '0' or not new_data[i-1].startswith("^")][:-1]

输出:

^{pr2}$

可以使用Pythons^{}模块重用现有的正则表达式

import re

mystring = "0G15^GAC0T60T4^AA0C0"
l = re.sub("([\\^]*[ACGT]+)[0]*", " \\1 ", mystring).split()

l

^{pr2}$

相关问题 更多 >