python中针对不同对的匹配键问题的回答

python中针对不同对的匹配键

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

<p>如果需要，还可以使用<code>pandas</code>以这种方式解决大型数据集的这个问题。你知道吗</p> <blockquote> get_references_and_colors.py </blockquote> <pre><code>import pandas as pd import re import json def get_references_and_colors(lookups, attrs): responses = [] refs = pd.Series(re.split(r"\|", lookups[0][0])) colors = pd.Series(re.split(r"\|", lookups[1][0])) d = {"ref": refs, "color": colors} df = pd.DataFrame(d).fillna('') # To drop NaN entries, in case if refs # & colors are not of same length # ref color # 0 Reference Color # 1 Referenz color # 2 Referenz-Nr tinta # 3 Referenznummer farbe # 4 Farbe for key, value in attrs: response = {} response["for_attr"] = key df2 = df.loc[df["ref"] == key]; # find in 'ref' column if not df2.empty: response["ref"] = value else: df3 = df.loc[df["color"] == key]; # find in 'color' column if not df3.empty: response["color"] = value else: response["color"] = None # Not Available response["ref"] = None responses.append(response) return responses if __name__ == "__main__": LOOKUPS = [ ('Reference|Referenz|Referenz-Nr|Referenznummer', 'a'), ('Color|color|tinta|farbe|Farbe', 'b'), ] ATTR = [ ('Referenz', 'Ref-Val'), ('color', 'red'), ('color2', 'orange'), # improper ('tinta', 'Tinta-col') ] responses = get_references_and_colors(LOOKUPS, ATTR) # dictionary pretty_response = json.dumps(responses, indent=4) # for pretty printing print(pretty_response) </code></pre> <blockquote> Output </blockquote> <pre><code>[ { "for_attr": "Referenz", "ref": "Ref-Val" }, { "for_attr": "color", "color": "red" }, { "for_attr": "color2", "color": null, "ref": null }, { "for_attr": "tinta", "color": "Tinta-col" } ] </code></pre>

python中针对不同对的匹配键

1 个回答

相关Python问题