我正在计算tsv文件中路径的平均长度。路径中的项目用“;”分隔。 tsvfile看起来像这样。在
格式:[hashedIpAddress][timestamp][durationInSec][path][rating]
6a3701d319fc3754 1297740409 166 14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade NULL
3824310e536af032 1344753412 88 14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade 3
415612e93584d30e 1349298640 138 14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade NULL
我的代码是这样的:
^{pr2}$如何计算文件中的“;”?在
您可以使用
split
方法:这将计算行中
;
个字符的数目。如果要计算按;
拆分的元素,请删除-1
部分不使用单独的索引来获取列:
拆分
';'
上的特定列文本可以得到一个元素列表;len()
告诉您有多少个元素。在或者,计算
^{pr2}$;
个字符,添加一个:但是也许你也想对路径元素本身做些什么。在
要得到所有路径的平均长度,我只需使用
.count()
:在这种情况下,您甚至不必使用
csv
模块;您根本不需要将行拆分为行,其他列中没有;
分号,因此更简单的解决方案是只循环文件行:我只使用
;
作为分隔符,如果您的唯一目标是计算分号,则使用len(row) - 1
。在即
相关问题 更多 >
编程相关推荐