“Python文本处理”中的Schwartzian排序示例

for n in range(len(lines)): # Create the transform lst = string.split(lines[n]) if len(lst) >= 4: # Tuple w/ sort info first lines[n] = (lst[4], lines[n]) else: # Short lines to end lines[n] = (['\377'], lines[n]) lines.sort() # Native sort for n in range(len(lines)): # Restore original lines lines[n] = lines[n][1] open('tmp.schwartzian','w').writelines(lines)

3条回答

网友
1楼 · 编辑于 2024-09-30 16:22:02

与这个问题没有直接关系，但是请注意，在python的最新版本中（我想是从2.3或2.4开始），转换和取消转换可以使用sort()或sorted()的参数自动执行。例如：
def key_func(line): lst = string.split(line) if len(lst) >= 4: return lst[4] else: return '\377' lines.sort(key=key_func)

网友
2楼 · 编辑于 2024-09-30 16:22:02

我不知道问题出在哪里，所以我试着用一般的方法来澄清。在
该算法通过获取第四个字段并将其放在行的前面来对行进行排序。然后内置的sort()将使用此字段进行排序。之后，原始行被恢复。在
空行或少于5个字段属于此结构的else部分：
if len(lst) >= 4: # Tuple w/ sort info first lines[n] = (lst[4], lines[n]) else: # Short lines to end lines[n] = (['\377'], lines[n])
它将一个['\377']添加到要排序的列表的第一个字段中。该算法这样做是希望“\377”（ascii表中的最后一个字符）将比第5个字段中找到的任何字符串都大。所以在进行排序时，原始行应该位于底部。在
我希望这能澄清问题。如果没有，也许你应该说明你想知道什么。在
同一算法的更好的通用版本：
^{pr2}$
您提供的算法与此算法等效。在

网友
3楼 · 编辑于 2024-09-30 16:22:02

空行不能通过测试

if len(lst) >= 4:

因此它将使用['\377']作为其排序键，而不是数据的第5列，即lst[4]（lst[0]是第一列）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章