古腾堡的Python文本

2024-06-13 23:28:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试为一个NLP任务解析100个Gutenberg项目文本,例如"H. G. Wells' War of the Worlds"。我正在尝试编写一个Python脚本,为每个文本输出一个句子列表。古腾堡怎么能忽略文本的页眉和页脚?在


Tags: ofthe项目文本脚本列表nlp句子