我有两个数据帧,包含110.000行和10列,另一个包含47.000个数据点和8列。我使用2数据帧来检查第一个数据帧的有效性。如果这个匹配,我将把这一行的第一个数据帧和第二个数据帧转换成新的数据帧。你知道吗
我检查的方法是在第二个数据帧中,我得到了一个keyword
in column关键字。然后我用第一个数据帧的列字符串检查它是否包含关键字。你知道吗
现在我用2 loops iterrows()
来检查它。但我要花很多时间去做。我想知道有没有更有效的方法来做这件事。
我的代码如下:
你知道吗
for index, ebayrow in ebaydata.iterrows():
make_match = [e_scrubrow for idx,e_scrubrow in etail_scrub_data.iterrows() if e_scrubrow['keyword'] in ebayrow['title']]
nummatch = len(make_match)
if nummatch == 0:
continue
else:
model_match = [e_scrubrow for e_scrubrow in make_match if e_scrubrow['keyword2'] in ebayrow['title']]
nummatch = len(model_match)
if nummatch == 0:
continue
else:
if nummatch == 1:
scrubrow = model_match[0]
ebaychecked.append(scrubrow['keyword'])
ebaychecked1.append(scrubrow['keyword2'])
ebaychecked2.append(scrubrow['keyword3'])
ebaychecked7.append(ebayrow['info'])
print(len(ebaychecked))
else:
year_match = [e_scrubrow for e_scrubrow in model_match if e_scrubrow['keyword3'] in ebayrow['title']]
nummatch = len(year_match)
if nummatch == 0:
scrubrow = model_match[0]
ebaychecked.append(scrubrow['keyword'])
ebaychecked1.append(scrubrow['keyword2'])
ebaychecked2.append(scrubrow['keyword3'])
ebaychecked7.append(ebayrow['info'])
print(len(ebaychecked))
目前没有回答
相关问题 更多 >
编程相关推荐