擅长:python、mysql、java
<p>正如Mayur提到的,您可以使用regex来获取引号之间的所有内容</p>
<pre><code>list = re.findall("\".*?\"", string)
</code></pre>
<p>你会遇到的问题是,引号之间可能有大量的东西实际上不是引号。在</p>
<p>如果你在写学术文章,你可以在结束语后找一个数字来提取脚注编号。否则,对于非学术性的文章,您可以运行类似于:</p>
^{pr2}$
<p>可以更精确,但可能会丢失引号(例如块引号)(块引号无论如何都会导致问题,因为它们可以在结束引号之前包含新行)</p>
<p>也许除了用“网络”这个词,我想没什么用了。在</p>