擅长:python、mysql、java
<p>另一种方法是按<code>('.')</code>拆分</p>
<p>所以用和数据摔跤手一样的测试:</p>
<p><code>test = """This is a sentence. This is another sentence.
This is a third sentence. We want a separate row for each sentence."""</code></p>
<p>我们可以将行拆分为一个列表,并将其输入到数据帧中,如下所示:</p>
<p><code>df = pd.DataFrame({'docs': test.split('.'), 'category': 'winterland'})</code></p>
<p>结果的唯一区别是,您将在底部有一个空行,如果需要,您可以过滤掉它,或者,您可以在创建dataframe时使用list comprehension来排除如下空白行:</p>
<p><code>pd.DataFrame({'docs': [sentence for sentence in test.split('.') if sentence !=''], 'category': 'winterland'})</code></p>