我有一个摘要,我用Python把它分成了几个句子。我想写两张桌子。一个包含以下列的文件:abstract id
(这是我从文档中提取的文件号)、sentence id
(自动生成)以及该摘要的每一个句子。
我想要一张这样的桌子
abstractID SentenceID Sentence
a9001755 0000001 Myxococcus xanthus development is regulated by(1st sentence)
a9001755 0000002 The C signal appears to be the polypeptide product (2nd sentence)
另一个表NSFClasses
,具有{sentenceId
如上所示?在
这是我的代码:
^{pr2}$
正如其他人所指出的,遵循你的代码是非常困难的。我认为这段代码将根据您的预期输出和我们可以看到的内容来实现您想要的功能。不过,我可能离得很远,因为我们看不到你正在处理的文件。你的代码中有一部分我看不到足够的内容来重构,但是我觉得很明显是错的。它标在下面。在
在标记的部分中,您将搜索文件中字符串“File”和“NSF Org”的最后一次出现(不管您是否有意,因为只要变量出现,循环就会一直覆盖它们),然后对该行前面的第15个字符执行操作。如果没有看到文件,就不可能说怎么做,但我可以告诉你有更好的方法。它可能涉及到将整个文件作为一个字符串(或者至少是它的第一部分,如果这是在其头中的话)而不是循环搜索整个文件。在
另外,请注意我是如何压缩代码的。你在变量中存储了很多你根本不用的东西,并收集了很多分散状态的垃圾。为了理解N行的作用,我必须继续向前看N+5行,然后回顾N-34到N-17行来检查变量。这会在一定距离内产生大量的动作,出于所列举的原因,最好避免这些动作。在较小的版本中,您可以看到我是如何在字符串文本中替换它们只使用一次的地方,并立即调用print语句,而不是将结果存储到以后。结果通常更简洁易懂。在
相关问题 更多 >
编程相关推荐