python从fi读取行块问题的回答

python从fi读取行块

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

从CARI/201412文件中获取输出（在CARI/201I中也有输出） <pre><code>--------------------------------------------- TM 05120970.01: Processing... TM 05120970: Processing... TM 05120970: current status Open TM 05120970: Owner_Info.User_ref = crossi14 TM 05120970: Owner_Info.Email = Criss.Rossi@gmail.com TM 05120970: CarModel = Nissan Micra ---------------------------------------------- TM 05157414.06: Processing... TM 05157414: Processing... TM 05157414: current status Open TM 05157414: Owner_Info.User_ref = yumiao12 TM 05157414: Owner_Info.Email = Yu.Miao@gmail.com TM 05157414: CarModel = Toyota Avensis ---------------------------------------------- </code></pre> 我用过：<code>exec_cmd('cat ' + f1 + '| grep -e "CarModel = " -e "Owner_Info.User_ref = "')</code> 但我还需要块的第一行（实际上是第二行） ^{pr2}$ 我尝试/需要做的是，解析并获取每个块的变量中的值： <pre><code>TM 05120970.01 -> car_number = 05120970.01 Owner_Info.User_ref = crossi14 -> owner_user = crossi14 CarModel = Nissan Micra -> car_model = Nissan Micra </code></pre> 根据这些信息，我将添加一些默认内容，如： <pre><code>priority = Unknown </code></pre> 我需要将这些变量作为另一个名为insert\u owner的脚本的输入_汽车.pl在 <pre><code> insert_owner_car.pl -id 05120970.01 -o owner_user="crossi14",car_model="Nissan Micra",priority="Unknown" </code></pre> 到目前为止，这是我设法做到的，但它不可用，因为我不能得到提到的价值 <pre><code>#!/usr/bin/python import itertools, commands, datetime, os, re, sys, time inFile = open("/tmp/20141202.194812_carStatus") outFile = open("result.txt", "w") keepCurrentSet = False for line in inFile: if line.startswith("----------------------------------------------"): keepCurrentSet = False if keepCurrentSet: parts = line.split(" = ")[1:] part=','.join(parts) print part #outFile.write(parts) if line.startswith("----------------------------------------------"): keepCurrentSet = True inFile.close() outFile.close() </code></pre> 我不知道怎么得到：05120970.01 以及如何将一个块中的所有变量都用作另一个脚本的输入 PS：我有Python2.5.1

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

可以使用<a href="https://stackoverflow.com/a/17508761/190597">utility function ^{<cd1>}</a>分块处理文件： <pre><code>import re import subprocess def open_chunk(readfunc, delimiter, chunksize=1024): """ readfunc(chunksize) should return a string. """ remainder = '' for chunk in iter(lambda: readfunc(chunksize), ''): pieces = re.split(delimiter, remainder + chunk) for piece in pieces[:-1]: yield piece remainder = pieces[-1] if remainder: yield remainder f = open(filename, 'r') for chunk in open_chunk(f.read, delimiter=r'-{45,}'): chunk = chunk.strip() if chunk: lines = chunk.splitlines() firstline = lines[0] car_number = firstline.split()[1][:-1] for line in lines[1:]: if 'Owner_Info.User_ref = ' in line: owner_user = line.split(" = ")[1] elif 'CarModel = ' in line: car_model = line.split(" = ")[1] cmd = ['insert_owner_car.pl' , '-id' , car_number , '-o' , 'owner_user="%s"' % (owner_user, ) , 'car_model="%s"' % (car_model, ) , 'priority="Unknown"'] print(' '.join(cmd)) # subprocess.call(cmd) f.close() </code></pre> 印刷品 ^{pr2}$ <hr/> 如果数据文件很小，则可以将整个文件分成一个字符串，然后使用<code>re.split</code>将其拆分为多个块： <pre><code>In [37]: import re In [38]: re.split(r'-{45,}', open('data').read()) Out[38]: ['\n\n', '\nTM 05120970.01: Processing...\nTM 05120970: Processing...\nTM 05120970: current status Open\nTM 05120970: Owner_Info.User_ref = crossi14\nTM 05120970: Owner_Info.Email = Criss.Rossi@gmail.com\nTM 05120970: CarModel = Nissan Micra\n', '\nTM 05157414.06: Processing...\nTM 05157414: Processing...\nTM 05157414: current status Open\nTM 05157414: Owner_Info.User_ref = yumiao12\nTM 05157414: Owner_Info.Email = Yu.Miao@gmail.com\nTM 05157414: CarModel = Toyota Avensis\n', '\n'] </code></pre> 这可以代替上面的<code>open_chunk</code>。使用<code>open_chunk</code>的优点是可以在非常大的文件上使用，因为将整个文件分成一个字符串并将其拆分为一个列表需要太多内存。在

python从fi读取行块

1 个回答

相关Python问题