擅长:python、mysql、java
<p>尝试:</p>
<pre class="lang-py prettyprint-override"><code>df['Word'] = df['Word'].str.split('(?<=\w)\.')
df = df.explode('Word')
map = df['Word'].groupby(level=0).cumcount().ge(1)
df.loc[map, 'Word'] = '.' + df.loc[map, 'Word']
df = df.reset_index(drop=True)
</code></pre>
<p>一些注意事项:</p>
<p><code>(?<=\w)</code>-匹配所有以前包含字母数字字符的内容</p>
<p><code>\.</code>-匹配点</p>
<p>所以本质上,你们将以点分隔,前面是字母数字。然后,您将在每秒钟前面手动添加点,然后在拆分字符串的后面添加元素</p>
<p>您案例中的输出:</p>
<pre class="lang-py prettyprint-override"><code> Word Tag
0 Pada A
1 bakteri B
2 , C
3 ketumpangtindihan D
4 ini E
5 kemungkinan F
6 terlibat G
7 dalam H
8 regulasi I
9 transkripsi O
10 gen O
11 . O
</code></pre>