擅长:python、mysql、java
<p>尝试将它们存储在<a href="https://docs.python.org/3/library/stdtypes.html#set" rel="nofollow noreferrer">^{<cd1>}</a>中。可以将重复项附加到单个列表中,这可能会加快速度:</p>
<pre><code>seen = set()
dupes = []
for i, doi in enumerate(doiList):
if doi not in seen:
seen.add(doi)
else:
dupes.append(i)
</code></pre>
<p>此时,<code>seen</code>包含所有不同的doi值,而<code>dupes</code>包含重复值的所有第二、第三等索引。您可以在<code>doiList</code>中查找它们,以确定哪个索引对应于哪个值。在</p>
<p>要获得更好的性能,可以缓存以下方法:</p>
^{pr2}$