我有一个包含两列的数据框架,即Word和Tag列。国防军:
Word Tag
0 Pada A
1 bakteri B
2 , C
3 ketumpangtindihan D
4 ini E
5 kemungkinan F
6 terlibat G
7 dalam H
8 regulasi I
9 transkripsi O
10 gen. O
我想用点分隔包含一个单词的行word+.
为两行。因此,输出应如下所示:
Word Tag
0 Pada A
1 bakteri B
2 , C
3 ketumpangtindihan D
4 ini E
5 kemungkinan F
6 terlibat G
7 dalam H
8 regulasi I
9 transkripsi O
10 gen O
11 . O
有什么想法吗?提前谢谢。如果我做了explode
,标点符号就丢失了
这是一个低效的答案
之前的输出:
输出:
尝试:
一些注意事项:
(?<=\w)
-匹配所有以前包含字母数字字符的内容\.
-匹配点所以本质上,你们将以点分隔,前面是字母数字。然后,您将在每秒钟前面手动添加点,然后在拆分字符串的后面添加元素
您案例中的输出:
相关问题 更多 >
编程相关推荐