我可以拆分成python中的tweet数据吗?

2024-09-29 21:53:28 发布

您现在位置:Python中文网/ 问答频道 /正文

df1 = pd.read_json('1.json')

df = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12]) 
print(df)

我有数据框数据,我想用下面的代码拆分URL

def remove_url(txt):
 return " ".join(re.sub("([^0-9A-Za-z \t])|(\w+:\/\/\S+)", "", str(txt)).split())'''

我调用的数据不必在代码下指向URL

all_tweets_no_urls = [remove_url(tweets.content) for tweet in tweets] #tweets.content
all_tweets_no_urls[:10]

当这段代码在python中运行时,我有

['0 coronavirues coronavirus coronarovirus Ko1 Korona da isinler in 10 deprem korkusu bitti imdi de deli gibi corona100 inliler daha seni tanmadndan corona virs1000 akrabalk ba corona virs bundan daha az t 9995 60 yandaki korona hastas 155 gn sonra you9996 pastdelusion Yiaaa bakarm bakarm uan pek k9997 handelendi Maske takmyorumZaten salya smk9998 3 doktor arkadam 2 defa corona oldunCovid9999 feyzasays BulutGulcuN Kim diyor yokmu diye Name content Length 1072101 dtype object']

在这个答案中,所有推文只显示一个表。但我想这样回答

['Mardin Bykehir Belediyesi Kltr Turizm ve Sosyal ler Daire Bakanlna bal Mesleki Eitim Merkezinde MARM',
 'SosyalUyumveGenlikKatlm projesi ile genlik merkezimizde eitim ve faaliyetlere katlm salayan ensar ve muha',
 'Ahi Evren Gs Kalp ve Damar Cerrahisi Eitim ve Aratrma Hastanesi alan Fatih Aksuolu yakaland Covid19',
 'le Jandarma Komutanlmz ile Sahil Gvenlik Karakol Komutanlmz Gzelaml sahilinde Covid19 tedbirleri',
 'Mardin Bykehir Belediyesi Kltr Turizm ve Sosyal ler Daire Bakanlna bal Mesleki Eitim Merkezinde MARM']

我怎么能看到tweets像图中所示那样相互分割

['tweet1', 'tweet2'.....]

Tags: 数据代码txtjsonurldfvecontent

热门问题