<p>给定一个原始字符串输入</p>
<pre><code>1600 Divisadero St
San Francisco, CA 94115
b/t Post St & Sutter St
Lower Pacific Heights
</code></pre>
<p>我要提取</p>
<p>城市:<code>San Francisco</code><br/>
状态:<code>California</code>或{<cd3>}<br/>
国家:<code>USA</code></p>
<p>我将解析数百万个地址,使用付费API是不可行的</p>
<p>我计划使用一个<strong>命名实体识别器</strong>,但我无法找到大量的训练数据来理想地覆盖任何位置</p>
<p>有没有我可以使用的开源项目?在</p>