使用Python拆分ps的输出

2024-05-18 10:09:30 发布

您现在位置:Python中文网/ 问答频道 /正文

在Linux上,命令ps aux为每个stat输出一个进程列表,其中包含多个列

USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
...
postfix  22611  0.0  0.2  54136  2544 ?        S    15:26   0:00 pickup -l -t fifo -u
apache   22920  0.0  1.5 198340 16588 ?        S    09:58   0:05 /usr/sbin/httpd

我希望能够在使用Python中阅读这篇文章,并将每一行和每一列分开,以便它们可以用作值。

在很大程度上,这不是问题:

ps = subprocess.Popen(['ps', 'aux'], stdout=subprocess.PIPE).communicate()[0]
processes = ps.split('\n')

我现在可以循环遍历进程以获取每一行并按空格将其拆分,例如

sep = re.compile('[\s]+')
for row in processes:
    print sep.split(row)

但是,问题是最后一列命令中有时有空格。在上面的例子中,可以在命令中看到

pickup -l -t fifo -u

会被分成

['postfix', '22611', '0.0', '0.2', '54136', '2544', '?', 'S', '15:26', '0:00', 'pickup', '-l', '-t', 'fifo', '-u']

但我真的希望是:

['postfix', '22611', '0.0', '0.2', '54136', '2544', '?', 'S', '15:26', '0:00', 'pickup -l -t fifo -u']

所以我的问题是,我如何拆分列,但是当涉及到命令列时,将整个字符串作为一个列表元素,而不是按空格拆分?


Tags: 命令列表进程linuxpostfixseprowps
3条回答

为什么不用PSI代替呢?PSI提供有关Linux和其他Unix变体的进程信息。

import psi.process
for p in psi.process.ProcessTable().values(): …

查看python.psutils包。

psutil.process_iter返回一个生成器,您可以使用它来遍历所有进程。 p.cmdline是每个进程对象的命令行参数的列表,按所需方式分隔。

您可以创建一个pids vs(pid,cmdline,path)字典,只需一行,然后就可以随心所欲地使用它。

pid_dict = dict([(p.pid, dict([('pid',p.pid), ('cmdline',p.cmdline), ('path',p.path)]))
                 for p in psutil.process_iter()]))

使用第二个参数split,它指定要将字符串拆分为的最大字段数。我想你可以通过计算第一行的字段数(即列标题)来找到这个数字。

ps = subprocess.Popen(['ps', 'aux'], stdout=subprocess.PIPE).communicate()[0]
processes = ps.split('\n')
# this specifies the number of splits, so the splitted lines
# will have (nfields+1) elements
nfields = len(processes[0].split()) - 1
for row in processes[1:]:
    print row.split(None, nfields)

相关问题 更多 >