擅长:python、mysql、java
<p>据我所知,你需要区分公司和人名。我猜您列表中的公司要么以<strong>LLC</strong>,<strong>INC</strong>结尾,要么包含一个<strong>-</strong>(连字符),因此我将这些单词<code>company_set</code>作为<code>{'LLC', 'INC', '-'}</code>,然后通过基函数<code>split()</code>将其拆分为代币。如果<code>company_set</code>和拆分标记的交集有任何共同点,那么它将不是空集,因此公司消息被打印,否则将打印人类的消息。代码如下:</p>
<pre><code>y = ['INOVATIA LABORATORIES LLC', 'PRULLAGE PHD JOSEPH B', 'S J SMITH CO INC', 'TEVA PHARMACEUTICALS USA INC', 'KENT NUTRITION GROUP INC', 'JOSEPH D WAGENKNECHT', 'ROBERTSON KEITH', 'LINCARE INC', 'AGCHOICE - BLUE MOUND']
company_set = {'LLC', 'INC', '-'}
for item in y:
tokens = set(item.split())
if company_set.intersection(tokens) != set():
print "{} is a company".format(item)
else:
print "{} is a human".format(item)
</code></pre>
<p>输出如下:</p>
^{pr2}$