基于计数的用户和ip地址

USER_ID,IP_ADDRESS XXXXXX24,10.12.6.54 XXXXXX24,10.12.6.54 XXXXXX24,10.12.6.54 XXXXXX24,10.12.6.54 XXXXXX24,10.12.6.54 XXXXXX25,10.12.6.55 XXXXXX25,10.12.6.55 XXXXXX25,10.12.6.55 XXXXXX25,10.12.6.55 XXXXXX25,10.12.6.55 XXXXXX21,10.12.6.51 XXXXXX21,10.12.6.51 XXXXXX21,10.12.6.51 XXXXXX21,10.12.6.51

#!/bin/python3.6 import csv import collections datafile=open('conn.csv','r') usefuldata=[] for line in datafile: usefuldata.append(line) from collections import Counter outfile1=Counter(usefuldata) print(outfile1)

2条回答

网友

1楼 · 编辑于 2024-10-02 20:43:07

#!/bin/python3.6

import csv
import collections
datafile=open('conn.csv','r')
usefuldata=[]
for line in datafile:
   usefuldata.append(line)
from collections import Counter
outfile1=Counter(usefuldata)
#print(outfile1.most_common())
for value,count in outfile1.most_common():
  print(value,count)

我能够通过上面的代码实现我想要的

[root@lhqsb1db2db01 Scripts]# ./conn.py
XXXXXX24,10.12.6.54
 5
XXXXXX25,10.12.6.55
 5
XXXXXX21,10.12.6.51
 4
XXXXXX24,10.12.6.56
 3

网友

2楼 · 编辑于 2024-10-02 20:43:07

您还可以使用pandas和collections.Counter

例如：

import collections

import pandas as pd
from tabulate import tabulate

with open("data_file.csv") as file:
    next(file, None)  # skip the header
    counter = collections.Counter([line.strip() for line in file])

output = collections.defaultdict(dict)
for user_and_ip, ip_to_user_count in counter.items():
    user, ip = user_and_ip.split(",")
    output[ip].update({user: ip_to_user_count})

df = pd.DataFrame(output).fillna("")
print(tabulate(df, headers="keys"))
df.to_csv("user_to_ip.csv")

输出：

          10.12.6.54    10.12.6.55    10.12.6.51
                            
XXXXXX24  5.0
XXXXXX25                5.0
XXXXXX21                              4.0

以及.csv文件：

相关问题更多 >

编程相关推荐

热门问题

热门文章