擅长:python、mysql、java
<p>下面是一个使用<a href="https://github.com/biocore-ntnu/ncls" rel="nofollow noreferrer">NCLS</a>库的答案。它不进行拆分,而是回答标题中的问题,而且速度非常快。在</p>
<p>设置:</p>
<pre><code>from ncls import NCLS
contents = """Start End
100 200
300 450
500 700"""
import pandas as pd
from io import StringIO
df = pd.read_table(StringIO(contents), sep="\s+")
contents2 = """Start End Value
0 400 0
401 499 -1
500 1000 1
1001 1698 1"""
df2 = pd.read_table(StringIO(contents2), sep="\s+")
</code></pre>
<p>执行:</p>
^{pr2}$