回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有两个.csv文件,文件1的第一行是:</p>
<pre><code>MPID,Title,Description,Model,Category ID,Category Description,Subcategory ID,Subcategory Description,Manufacturer ID,Manufacturer Description,URL,Manufacturer (Brand) URL,Image URL,AR Price,Price,Ship Price,Stock,Condition
</code></pre>
<p>文件2的第一行:</p>
<pre><code>Regular Price,Sale Price,Manufacturer Name,Model Number,Retailer Category,Buy URL,Product Name,Availability,Shipping Cost,Condition,MPID,Image URL,UPC,Description
</code></pre>
<p>然后每个文件的其余部分都充满了信息。</p>
<p>如您所见,两个文件都有一个名为MPID的公共字段(文件1:col 1,文件2:col 9,其中第一个col是col1)。</p>
<p>我想创建一个新文件,通过查看此列将这两个文件组合在一起(如中所示:如果两个文件中都有MPID,则在新文件中,该MPID将显示为来自文件1的行和来自文件2的行)。如果一个MPID只出现在一个文件中,那么它也应该进入这个组合文件。</p>
<p>文件没有以任何方式排序。</p>
<p>如何在一个带有shell脚本或python的debian机器上执行此操作?</p>
<p>谢谢。</p>
<p>编辑:除了分隔字段的文件外,两个文件都没有逗号。</p>