按主题分组电子邮件的有效方法

index = 0 for i in range(df.shape[0]): count = 0 for x in range(bindf.shape[0]): if (df['Subject'][i] == bindf['Subject'][x]): bindf['emailID'][x].append(df['Message-ID'][i]) count = 1 if count == 0: bindf.iloc[index] = [df['Subject'][i],df['Message-ID'][i]] bindf['emailID'][index] = bindf['emailID'][index].split(' ', maxsplit = 0) index = index +1

1条回答

网友

1楼 · 发布于 2024-09-24 10:24:25

如果要按完全相同的主题分组，可以：

df.groupby('subject')['ID'].apply(list)

然而，最有可能的是，即使主题的语义不同，它们也会有所不同。因此，如果你这样做，你可能想先对主题应用一些变换（全部放低，删除空格、标点符号等…）

否则，您可以为主题设置过滤器，例如“包含X”。你知道吗

一个合理的方法是应用单词包或word2vec和聚类进行分组。你知道吗

希望有帮助

编程相关推荐

java如何比较同一方法的两个变量值
java如何获取web服务应用程序的“日志”路径？
使用类型_SCROLL u SENSITIVE时出现Java jdbc警告
将Java代码格式化为Word/RTF格式
java如何在安卓 WebView中隐藏HTML5播放按钮的视频播放器
线程“main”java中出现异常。lang.unsatifiedlinkerror:org。opencv。国际编码。国际编码。imread_0（Ljava/lang/String；I）J
java是一种更高效的瓷砖渲染方法
在Eclipse中显示带下划线的驼峰大小写单词的java
java OpenHelperManager：在OpenHelperManager或MLite 安卓中使用多个帮助器类时设置新的帮助器类
如何在Java后端服务器中编程使用安卓 APK Analyzer分析后端服务器中的APK文件

相关问题更多 >

编程相关推荐

热门问题

热门文章