我正在使用一个数据集,其中公司名称与我要合并的数据集不太匹配。你知道吗
作为解决方案的一部分,我想在数据框的一列中编辑公司名称。假设我有一个公司名称列表,我想做的是:
diff = ['some list of tickers']
for security in df.query("tic in @diff").security.unique():
result = re.search(expression, security)[0].upper()
result = result.replace('CORPORATION', 'CORP')
result = result.replace('COMPANY', 'CO')
result = result.replace('OF','')
result = result.replace('F', '')
result = result.strip()
我认为甚至可能有一个优雅的解决方案,我可以运行一个自定义函数来修改单元格的值,但我对panda还不够熟悉,不知道如何做到这一点。你知道吗
我正在这样的loks上编辑的数据帧。你知道吗
caldt tic security curshrt
2672 1988-06-01 ITSCW Industrial Training Systems, 0
8007 1988-07-01 ITSCW Industrial Training Systems, 0
44772 1989-03-01 MMNT Momentum, Inc. 0
49865 1989-04-01 MMNT Momentum, Inc. 372
54925 1989-05-01 MMNT Momentum, Inc. 78
... ... ... ... ...
1077214 2007-06-01 ABBI Abraxis BioScience, Inc. - Common stock 4486255
1080530 2007-07-01 ABBI Abraxis BioScience, Inc. - Common stock 4659919
1083835 2007-08-01 ABBI Abraxis BioScience, Inc. - Common stock 4265095
1087148 2007-09-01 ABBI Abraxis BioScience, Inc. - Common stock 4018741
1090424 2007-10-01 ABBI Abraxis BioScience, Inc. - Common stock 4064510
我去掉了标点符号,改了一些缩写和单词
我想您的代码可能会修改如下:
注意:
expression
是您的搜索模式。你知道吗相关问题 更多 >
编程相关推荐