正则表达式+python挑战！争论数据那是阿尔莫斯特雷古

3条回答

网友

1楼 · 编辑于 2024-09-29 18:51:04

把Mike M的回答换成稍微不同的术语，如果你能建立一个可靠的非相关令牌列表，比如'Inc'、'Inc'和'LLC'，那么你就有了一种解析的方法。即使这样，您可能也不会得到像split（）这样的自动方法来为您工作。你可能得自己动手了。在

网友

2楼 · 编辑于 2024-09-29 18:51:04

如果知道的话，您可以将分割预防字符串添加到否定的lookahead中

r',\b(?!Inc\.)'

网友

3楼 · 编辑于 2024-09-29 18:51:04

我会在逗号上进行第一次拆分，以获得以下列表：

['IBP', 'Inc', 'Tyson Foods', 'Inc.']

然后对数据进行第二次传递，在这些数据中，极不可能的公司名称（如“Inc”、“Inc.”、“LLC”、“GmbH”等）与列表中的前一项相结合：

^{pr2}$

如果以后发现数据中有“Farmers Group，The”之类的条目，并将文章放在正确的位置，则此方法还可以让您进行更复杂的操作。在