不匹配值的系列和Nan值问题的回答

不匹配值的系列和Nan值

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有这两本字典 <pre><code>dico = {'Name': ['Arthur','Henri','Lisiane','Patrice','Zadig','Sacha'], "Age": ["20","18","62","73",'21','20'], "Studies": ['Economics','Maths','Psychology','Medical','Cinema','CS'] } dico2 = {'Surname': ['Arthur1','Henri2','Lisiane3','Patrice4']} dico = pd.DataFrame.from_dict(dico) dico2 = pd.DataFrame.from_dict(dico2) </code></pre> 在其中，我想匹配，然后将姓氏列附加到Name列，最后将其附加到dico，以获得以下输出： <pre><code> Name Surname Age Studies 0 Arthur Arthur1 20 Economics 1 Henri Henri2 18 Maths 2 Lisiane Lisiane3 62 Psychology 3 Patrice Nan 73 Medical 4 Zadig Nan 21 Cinema 5 Sacha Nan 20 CS </code></pre> 并最终删除姓氏为<code>Nan</code>的行 <pre><code> Name Surname Age Studies 0 Arthur Arthur1 20 Economics 1 Henri Henri2 18 Maths 2 Lisiane Lisiane3 62 Psychology </code></pre> <pre><code>map_list = [] for name in dico['Name']: best_ratio = None for idx, surname in enumerate(dico2['Surname']): if best_ratio == None: best_ratio = fuzz.ratio(name, surname) best_idx = 0 else: ratio = fuzz.ratio(name, surname) if ratio > best_ratio: best_ratio = ratio best_idx = idx map_list.append(dico2['Surname'][best_idx]) # obtain surname dico['Surname'] = pd.Series(map_list) # add column dico = dico[["Name", "Surname", "Age", "Studies"]] # reorder columns #if the surname is not a great match, print "Nan" dico = dico.drop(dico[dico.Surname == "NaN"].index) </code></pre> 但是当I<code>print(dico)</code>时，输出如下： <pre><code> Name Surname Age Studies 0 Arthur Arthur1 20 Economics 1 Henri Henri2 18 Maths 2 Lisiane Lisiane3 62 Psychology 3 Patrice Patrice4 73 Medical 4 Zadig Patrice4 21 Cinema 5 Sacha Patrice4 20 CS </code></pre> 我不明白为什么在Patrice争吵之后会出现不匹配，而我希望它是“Nan”

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

不匹配值的系列和Nan值

1 个回答

相关Python问题