我试图从客户的数字笔记本中提取联系人信息,该笔记本的条目如下:
'\r\nContact Imported:\r\nBusinessPhone : 9547711900 Line1 : 2440
East Commercial Blvd.\r\n City : Ft. Lauderdale\r\n State : FL\r\n PostalCode : 33308\r\n\r\nArt Womack recommends Steve Paul Dentist on Commercial Blvd area.\r\nA_womack@me.com>\r\nBond? Crowns? Veneer?\r\n\r\n\r\n'
拆分之后,我的目标是得到一个包含相关数据的元素列表(中间大部分包含“:”),以便稍后将其转换为python字典。你知道吗
我已经尝试过用'\r'和'\r'字符来分解字符串,但是一直缺少第1行:yadayada信息。你知道吗
我想要的是:
['BusinessPhone : 9547711900','BusinessPhone : 9547711900',
'Line1 : 2440 East Commercial Blvd.', 'City : Ft. Lauderdale',
'State : FL', 'PostalCode : 3330']
您可以尝试:
您可以尝试使用
pd.read_csv
阅读:根据@jezrael的建议,如有必要,将df转换为list:
或者
你是如何清理数据的?可以使用'\r\n'作为分隔符来分解您拥有的示例数据。您可以根据列表中的字符串是否为空来筛选拆分后的列表。这可以作为一个基本的数据清理过程来完成。你自己决定的与之相关的部分。你知道吗
清洁的基本代码可以是:
这将输出:
你仍然需要弄清楚什么是重要的。你知道吗
编辑:根据给定的字符串,您可以使用:
相关问题 更多 >
编程相关推荐