Python中列名及其对应行的对齐

Columns: VMName;"Cluster";"time";"AvgValue";"MinValue";"MaxValue";"MetricId";"MemoryMB";"CpuMHz";"NumCpu" Rows: ITLT4301;1;"1-5-2018";976439;35059255;53842;6545371441;3235864;95200029;"MemActive";"4096";"0";"0"

VMName;"Cluster";"time";"AvgValue";"MinValue";"MaxValue";"MetricId";"MemoryMB";"CpuMHz";"NumCpu",,, ITLT4301;1;"1-5-2018";976439,35059255 53842,6545371441 3235864,"95200029 MemActive"" 4096"" 0"" 0"""

1条回答

网友

1楼 · 发布于 2024-09-20 05:37:36

您的输入数据文件不是标准的csv文件。正确的方法是修复前面的步骤，以获得一个普通的csv文件，而不是一堆双引号，这会妨碍任何像样的csv解析器正确地提取数据。在

作为一种解决方法，可以删除起始双引号和终止双引号，删除任何双引号，并在忽略任何剩余双引号的情况下拆分半列上的每一行。可选的是，您也可以尝试删除任何双引号并将“；”上的行拆分。这取决于你期望什么样的价值观。在

可能的代码可能是：

def split_line(line):
    '''split a line on ; after stripping white spaces, the initial and terminating "
       doubles double quotes are also removed'''
    return line.strip()[1:-1].replace('""', '').split(';')

with open('file.dat') as fd:
    cols = split_line(next(fd))                # extract column names from header line
    data = [split_line(line) for line in fd]   # process data lines
    df = pd.DataFrame(data, columns=cols)      # build a dataframe from that

有了这个输入：

^{pr2}$

它提供：

     VMName Cluster      time           AvgValue          MinValue  \
0  ITLT4301       1  1-5-2018   976439" 35059255  53842 6545371441   
1  ITLT4301       1  1-5-2018  98" 9443749608104  29 3435452286154   

            MaxValue     MetricId MemoryMB CpuMHz NumCpu  
0  3235864 "95200029    MemActive     4096      0      0  
1  673 "067568681366  CpuUsageMHz        0   5600      2

相关问题更多 >

编程相关推荐

热门问题

热门文章