拆分多值列表并填充

2024-10-04 03:19:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我的原始数据来自Twitter。在csv中看起来是这样的:

@kevin, There's an important connection
@kevin, @EnvDefenseFund Launch Pad For Energy Innovations
@kevin, RT @HenriVerdier: hello @LesEchos
@chris, you're great @kevin

我尝试使用以下代码从数据中提取用户名(可能有更好的方法):

for tweet in tweets:
    print tweet[0], re.findall(r"(?<=@)\w+", str(tweet[1]))

结果如下:

@kevin []
@kevin ['EnvDefenseFund']
@kevin ['HenriVerdier', 'LesEchos']
@chris ['kevin']

最后,我希望数据的格式如下:

@kevin,
@kevin, @EnvDefenseFund
@kevin, @HenriVerdier
@kevin, @LesEchos    
@chris, @kevin

这样,我可以看到人与人之间的关系


Tags: csv数据rean原始数据twitterconnectiontweet