我有一个pandas.DataFrame
,我需要根据两列中的值更新它,这些列中的值来自需要的列。我知道这是不好的做法。这只是一个例子。在
以下是我正在使用的示例:
import re
import pandas as pd
def anydigit(text):
find_digit = re.search(r'\d+', text)
if find_digit:
return find_digit.start()
else:
return 0
df = pd.DataFrame({'DPID': ['A1', 'A2'], 'NAME': ['John Doe', 'Jane Doe'],
'ADDR_1': ['123 MAIN ST', 'ATTN: JOHN DOE'], 'ADDR_2': ['', 'P O BOX 123456']})
df['addr_ad1'] = df['ADDR_1'].apply(anydigit)
df['addr_ad2'] = df['ADDR_2'].apply(anydigit)
df['AUX_ADDR_LINE'] = ''
这就是需要发生的事情。在
^{pr2}$我认为.apply()
会起作用,但不确定如何编写它。在
调整了一些变量名:
首先:
^{pr2}$定义一个函数,然后
^{3}$apply
到所有行:获得:
相关问题 更多 >
编程相关推荐