从SQLite数据库中检索和绘制有序的二维热图数据

| ID | SourceID | TargetID | Parameter | Values | | 1 | 21 | 34 | 23.46513 | 0.12654 | | 2 | 21 | 34 | 23.46513 | 0.25478 | | 3 | 21 | 46 | 23.46513 | 0.43564 | | 4 | 21 | 46 | 23.46513 | 1.02487 | | 5 | 34 | 21 | 14.56319 | 0.01476 | | 6 | 34 | 21 | 14.56319 | 0.87265 | | 7 | 34 | 46 | 14.56319 | 0.46478 | | 8 | 34 | 46 | 14.56319 | 0.13665 | | 9 | 46 | 21 | 7.99581 | 0.04189 | | 10 | 46 | 21 | 7.99581 | 0.91754 | | 11 | 46 | 34 | 7.99581 | 0.73688 | | 12 | 46 | 34 | 7.99581 | 0.24299 |

| ID | SourceID | TargetID | SourceSort | Values | | 1 | 21 | 34 | 23.46513 | 0.12654 | | 3 | 21 | 46 | 23.46513 | 0.43564 | | 5 | 34 | 21 | 14.56319 | 0.01476 | | 8 | 34 | 46 | 14.56319 | 0.13665 | | 9 | 46 | 21 | 7.99581 | 0.04189 | | 12 | 46 | 34 | 7.99581 | 0.24299 |

| ID | SourceID | TargetID | Values | | 12 | 46 | 34 | 0.24299 | | 9 | 46 | 21 | 0.04189 | | 8 | 34 | 46 | 0.13665 | | 5 | 34 | 21 | 0.01476 | | 3 | 21 | 46 | 0.43564 | | 1 | 21 | 34 | 0.12654 |

(TargetID ordered by `Parameter ASC`) ^ | | ---------------------------------- 21 | 0.04189 | 0.01476 | 0 | ---------------------------------- 34 | 0.24299 | 0 | 0.12654 | ---------------------------------- 46 | 0 | 0.13665 | 0.43564 | ---------------------------------- | 46 | 34 | 21 --> (SourceID ordered by `Parameter ASC`)

2条回答

网友

1楼 · 编辑于 2024-10-02 02:45:06

将sqlite表转换为Matplotlib的pcolor绘制热图所需的格式的最简单方法（我明白了）是使用Pandas DataFrame的pivot方法。由于这个pivot将对列和行进行重新排序，因此不需要对SQL查询生成的顺序大惊小怪。相反，在熊猫身上更容易确定顺序：

import io
import sqlite3
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

text = '''\
| ID | SourceID | TargetID | Parameter | Values  |
| 1  |    21    |    34    | 23.46513  | 0.12654 |
| 2  |    21    |    34    | 23.46513  | 0.25478 |
| 3  |    21    |    46    | 23.46513  | 0.43564 |
| 4  |    21    |    46    | 23.46513  | 1.02487 |
| 5  |    34    |    21    | 14.56319  | 0.01476 |
| 6  |    34    |    21    | 14.56319  | 0.87265 |
| 7  |    34    |    46    | 14.56319  | 0.46478 |
| 8  |    34    |    46    | 14.56319  | 0.13665 |
| 9  |    46    |    21    | 7.99581   | 0.04189 |
| 10 |    46    |    21    | 7.99581   | 0.91754 |
| 11 |    46    |    34    | 7.99581   | 0.73688 |
| 12 |    46    |    34    | 7.99581   | 0.24299 |'''

def make_table(filename):
    # make sqlite table
    with sqlite3.connect(filename) as con:
        df = pd.read_table(io.BytesIO(text), sep=r'\s*[|]\s*').iloc[:, 1:-1]
        df.to_sql('dataset', con=con, if_exists='replace')

filename = '/tmp/data.sqlite'
make_table(filename)

with sqlite3.connect(filename) as con:
    sql = '''
        SELECT SourceID, TargetID, min(`Values`) as min_value
          FROM dataset 
          GROUP BY SourceID, TargetID
    '''
    df = pd.read_sql(sql, con)
    table = df.pivot(index='SourceID', columns='TargetID', values='min_value')

    sql = 'SELECT DISTINCT SourceID FROM dataset ORDER BY Parameter ASC'
    order = pd.read_sql(sql, con)['SourceID']
    table = table.reindex(index=order, columns=order)

    fig, ax = plt.subplots()
    ax.pcolor(table.values, cmap=plt.get_cmap('jet'), 
              vmin=df['min_value'].min(), vmax=df['min_value'].max())
    ax.set_xticks(np.arange(table.shape[1] + 1)+0.5, minor=False)
    ax.set_xticklabels(table.columns, minor=False)
    ax.set_yticks(np.arange(table.shape[0] + 1)+0.5, minor=False)
    ax.set_yticklabels(table.index, minor=False)
    ax.set_xlim(0, table.shape[1])
    ax.set_ylim(0, table.shape[0])
    plt.show()

收益率

enter image description here

网友

2楼 · 编辑于 2024-10-02 02:45:06

sqlite表的格式不正确，因为参数值只反映参数与SourceID的关联，但不与TargetID关联。在

最好有两张桌子：

id参数：

id  parameter
21   23.46513
34   14.56319
46    7.99581

数据集注意这里没有参数列：

^{pr2}$

然后，您可以使用联接在两者之间形成所需的关联参数/SourceID:

    SELECT d.SourceID, d.TargetID, min(d.`Values`) as min_value
      FROM dataset d
      JOIN id_param as ip1
      ON d.SourceID = ip1.id
      JOIN id_param as ip2
      ON d.TargetID = ip2.id
      GROUP BY SourceID, TargetID
      ORDER BY ip1.parameter ASC, ip2.parameter ASC

例如

import io
import sqlite3
import pandas as pd
import matplotlib.pyplot as plt

text = '''\
| ID | SourceID | TargetID | Parameter | Values  |
| 1  |    21    |    34    | 23.46513  | 0.12654 |
| 2  |    21    |    34    | 23.46513  | 0.25478 |
| 3  |    21    |    46    | 23.46513  | 0.43564 |
| 4  |    21    |    46    | 23.46513  | 1.02487 |
| 5  |    34    |    21    | 14.56319  | 0.01476 |
| 6  |    34    |    21    | 14.56319  | 0.87265 |
| 7  |    34    |    46    | 14.56319  | 0.46478 |
| 8  |    34    |    46    | 14.56319  | 0.13665 |
| 9  |    46    |    21    | 7.99581   | 0.04189 |
| 10 |    46    |    21    | 7.99581   | 0.91754 |
| 11 |    46    |    34    | 7.99581   | 0.73688 |
| 12 |    46    |    34    | 7.99581   | 0.24299 |'''

def make_table(filename):
    # make sqlite table
    with sqlite3.connect(filename) as con:
        df = pd.read_table(io.BytesIO(text), sep=r'\s*[|]\s*').iloc[:, 1:-1]
        df.to_sql('dataset', con=con, if_exists='replace')


filename = '/tmp/data.sqlite'
make_table(filename)

with sqlite3.connect(filename) as con:
    con.execute('DROP TABLE id_param')

    sql = '''CREATE TABLE id_param 
             (id INTEGER PRIMARY KEY, parameter INTEGER)'''
    con.execute(sql)

    sql = '''INSERT INTO id_param
             SELECT SourceID, Parameter
             FROM dataset
             GROUP BY SourceID'''
    con.execute(sql)

    sql = '''
        SELECT d.SourceID, d.TargetID, min(d.`Values`) as min_value
          FROM dataset d
          JOIN id_param as ip1
          ON d.SourceID = ip1.id
          JOIN id_param as ip2
          ON d.TargetID = ip2.id
          GROUP BY SourceID, TargetID
          ORDER BY ip1.parameter ASC, ip2.parameter ASC
    '''
    df = pd.read_sql(sql, con)
    print(df)

收益率

   SourceID  TargetID  min_value
0        46        34    0.24299
1        46        21    0.04189
2        34        46    0.13665
3        34        21    0.01476
4        21        46    0.43564
5        21        34    0.12654

相关问题更多 >

编程相关推荐

热门问题

热门文章