试图用python找到删除或显示类似引用的方法

2024-09-23 04:20:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我有个问题需要你的帮助。 我有一个word文件,其中包含许多引用,如:

[1]米-小时。韩,Y。李和C.-H。Hwang,“纳米MOSFET器件和电路中固有参数波动引起的高频特性的影响”,微电子可靠性,第50卷,第657-6612010页

[2]E。马里科和G。Gielen,“纳米CMOS可靠性的计算机辅助模拟电路设计”,电路和系统中的新兴和选定主题,IEEE Journal on,第1卷,第50-58页,2011年。 . . .

这些参考文献中的一些可能是相似的,但它们的编号是不同的。 你有没有办法用python删除或显示类似的引用? 谢谢


Tags: 文件参数系统特性电路wordcmos小时
1条回答
网友
1楼 · 发布于 2024-09-23 04:20:47

您可以将脚注文本拆分为一个数字和其余的引用:

>>> footnote = '[1] P. Wood, "Example Thesis," Some collection, pp 45-46, 2018'
>>> number, reference = footnote.split(' ', 1)
>>> reference
'P. Wood, "Example Thesis," Some collection, pp 45-46, 2018'

Python有一个^{}类,用于构建直方图

您可以将引用添加到Counter对象,然后在有多个对象时对其进行查询:

>>> from collections import Counter

>>> counter = Counter()
>>> counter[reference] += 1

您可以创建所有脚注的循环:

>>> for footnote in footnotes:
...     number, reference = footnote.split(' ', 1)
...     counter[reference] += 1

然后访问大于1的计数:

>>> duplicates = [item for item, count in counter.most_common()
...               if count > 1]

相关问题 更多 >