回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我想在python中使用<code>StanfordNER</code>来检测命名实体。我该如何整理句子?在</p>
<p>例如,考虑</p>
<p><code>qry="In the UK, the class is relatively crowded with Zacc competing with Abc's Popol (market leader) and Xyz's Abcvd."</code></p>
<p>如果我这么做</p>
<pre><code>st = StanfordNERTagger('english.all.3class.distsim.crf.ser.gz')
print st.tag(qry.split())
</code></pre>
<p>我明白了</p>
^{pr2}$
<p>`</p>
<p>因此只检测到1个命名实体。但是,如果我清除了所有的字符,用一些特殊的空格替换</p>
<p><code>qry="In the UK the class is relatively crowded with Zacc competing with Abc s Popol market leader and Xyz s Abcvd"</code></p>
<p>我明白了</p>
<pre><code>[
(u'In', u'O'), (u'the', u'O'), (u'UK', u'LOCATION'), (u'the', u'O'),
(u'class', u'O'), (u'is', u'O'), (u'relatively', u'O'), (u'crowded', u'O'),
(u'with', u'O'), (u'Zacc', u'PERSON'), (u'competing', u'O'), (u'with', u'O'),
(u'Abc', u'ORGANIZATION'), (u's', u'O'), (u'Popol', u'PERSON'), (u'market', u'O'),
(u'leader', u'O'), (u'and', u'O'), (u'Xyz', u'ORGANIZATION'), (u's', u'O'), (u'Abcvd', u'PERSON')]
</code></pre>
<p>`</p>
<p>所以很明显,这更合适。关于如何清理<code>StanfordNER</code>的句子有什么一般规则吗?一开始我以为根本不需要清理!在</p>