仅拆分并保留存储在python dataframe列中的英文文本

2024-06-25 23:55:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据框“app_final”,其中一列“text_content”包含多种语言的文本。我只想保留该栏中的英文文本。你知道我该怎么做吗

我尝试使用以下python代码创建一个新的列“english_text”,方法是通过langdetect运行每个文本中的每个单词,只向新列添加英语单词。然而,我得到了一个错误“LangDetectException:文本中没有特性” 我还应该如何处理这个问题

for i in range(0,len(app_final['text_content'])):
    for x in range(0,len(app_final['text_content'][i].split())):
        english=[]
        language=detect(app_final['text_content'][i].split()[x])
        eng_text=np.where(language=='en',app_final['text_content'][i].split()[x],np.NaN)
        english.append(eng_text)
    app_final['english_text']=english

这是我试图仅提取英文文本的记录的一个示例:

print(app_final['text_content'][635])

线のプッシュメッセージのセグメント配信が可能です。 フィルターを使って、线公式アカウントでメッセージ配信可能なセグメント以外の独自セグメントへのメッセージ配信可能になります。メッセージ配信先を絞ることで、线公式アカウントのコストの節約も可能。 线で自由度の高いリッチメニューが作成できます。 线公式アカウント上に自由度の高いリッチメニューの作成が可能になります。线のデフォルトでは対応していない9分割・12分割などおすすめしたい商品・ウェブページへのリンクだけ大きく表示など変則的なデザインに対応。 线トーク上でコレクションの内商品の一括表示が可能 线トーク上に設定したコレクション情報の表示が可能になります。セール・おすすめなどの独自コレクションをユーザに一括でレコメンド可能です。 线公式アカウント経由の購買率アップ。ユーザーの属性にあわせた特別なリッチメニュー表示・プッシュメッセージ配信が可能 基辅は线を新たな販売チャネルとして活用できる欧共体マネジメントサービスです。线公式アカウントの友達をセグメント化してメッセージ配信が可能になります。また、自由度の高いリッチメニューの配信も可能になります。线では配信できない区分けのリッチメニューの配信が可能です。

所有している线公式アカウントを上手くマーケティングに活用できていない欧共体事業社様に最適な選択肢です。 基辅の主な機能 1.プッシュ通知(行メッセージ配信) 购物との連携により、例えば「特定の商品を買い替えそうなタイミングの方」「注文途中でサイトから離脱したカゴ落ちユーザ」といった様々なセグメントのユーザに対してマッチしたメッセージを一斉配信することが可能になります。

二,。リッチメニュー配信 画像の配置パターンやリンクエリアのカスタマイズ機能がある基辅を使えば、様々な画像配置を試すことができ、ボタンの設置等も可能となります。线公式アカウントでは対応していないリッチメニューのパターンも配信可能です。 例えばこんな使い方も… 1.カゴ落ちユーザに期間限定割引クーポンを送信…メールで送るより短時間でメッセージが認識されるため、1.時間限定クーポンも有効です。 2.购物化のフィルターと連携して、1.か月前に消耗品を買ったユーザにリピート促進メッセージを送信して、リピート購入を進める。 など細分化したユーザの需要に応じてメッセージ配信が可能になります。

ご質問、ご要望等お待ちしております。 使い方、カスタマイズのご依頼など、お気軽にお問い合わせください。

Kisuke是一种EC管理服务,可将LINE用作新的销售渠道。LINE官方帐户朋友可以细分以传递消息。此外,可以分发具有高度自由度的丰富菜单。可以分发不能使用LINE分发的丰富菜单

这是没有使用其官方账户进行营销的电子商务公司的最佳选择。 Kisuke的主要功能

推送通知(行消息传递) 通过与Shopify合作,可以向不同细分市场的用户广播匹配消息,例如“何时购买特定产品”或“订购时退出网站的用户”。 丰富的菜单交付 Kisuke具有图像布局模式和链接区域自定义功能,您可以尝试各种图像布局和设置按钮。还可以分发行官方帐户不支持的丰富菜单模式


Tags: text文本appfor官方englishline菜单
1条回答
网友
1楼 · 发布于 2024-06-25 23:55:46

由于您的文本被拆分为多个段落,您可以尝试检测一个段落是否为英语或是否使用多语言文字https://polyglot.readthedocs.io/en/latest/Installation.html

因为你的日语文本中有英语单词,你应该使用段落中最可能的语言。例如:

from polyglot.detect import Detector

text = u"""
2.リッチメニュー配信 画像の配置パターンやリンクエリアのカスタマイズ機能があるKisukeを使えば、様々な画像配置を試すことができ、ボタンの設置等も可能となります。LINE公式アカウントでは対応していないリッチメニューのパターンも配信可能です。 例えばこんな使い方も… 1.カゴ落ちユーザに期間限定割引クーポンを送信…メールで送るより短時間でメッセージが認識されるため、1時間限定クーポンも有効です。 2.Shopifyのフィルターと連携して、1か月前に消耗品を買ったユーザにリピート促進メッセージを送信して、リピート購入を進める。 など細分化したユーザの需要に応じてメッセージ配信が可能になります。
"""

if Detector(text).languages[0].name == 'Japanese':
    do nothing
elif Detector(text).languages[0].name == 'English':
    append into string

对每个段落重复此过程,然后将该单元格替换为仅保留英文段落的新单元格

相关问题 更多 >