擅长:python、mysql、java
<p>您可以使用HTTP<code>Range:</code>头(<a href="https://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.35" rel="nofollow noreferrer">see RFC 2616</a>),它接受字节范围参数。s3api对此有一个规定,这将帮助您不必读取/下载整个S3文件。在</p>
<p>样本代码:</p>
<pre><code>import boto3
obj = boto3.resource('s3').Object('bucket101', 'my.csv')
record_stream = obj.get(Range='bytes=0-1000')['Body']
print(record_stream.read())
</code></pre>
<p>这将只返回头中提供的byte_range_数据。在</p>
<p>但是您需要修改它来将字符串转换为<code>Dataframe</code>。对于来自<code>.csv</code>文件的字符串中的<code>\t</code>和{<cd5>},可能是{<cd3>}</p>