<p>我有大约200个出版物引用,我正试图将它们解析为具有不同标题的列。每个出版物大约有200个字符长,用逗号分隔需要分析的不同字段。字段包括:期刊、标题、主要作者和作者。你知道吗</p>
<p>以下是出版物参考示例:</p>
<p>J.Doe、B.Smith、G.J.Martin、Phillip Jones。示例出版物标题,示例期刊,v.1002010,第C12000页。你知道吗</p>
<p>最后应该放弃
</p><pre> Journal: Example Journal </pre>
<pre> Title: Example Publication Title </pre>
<pre> Lead Author: J. Doe </pre>
<pre> Authors: J. Doe, B. Smith, G.J Martin, Phillip Jones </pre>
<p>以下是20个例子:
<a href="https://docs.google.com/spreadsheets/d/1PRtIUobmjKxF7g9v5a9tzbfstec8P8JWhV7uyv_aMM0/edit?pref=2&pli=1#gid=0" rel="nofollow">https://docs.google.com/spreadsheets/d/1PRtIUobmjKxF7g9v5a9tzbfstec8P8JWhV7uyv_aMM0/edit?pref=2&pli=1#gid=0</a></p>
<p>我遇到的问题是,许多出版物的差异很小。有些人有三个正式的J.Doe,B.Smith,G.J.Martin。。。有些人只有两个作者的形式乔多伊,乔治乔马丁。所以有些作者可以用名字缩写,有时不用。你知道吗</p>
<p>我需要将上面提到的所有字段解析为具有各自标题的列。你知道吗</p>