Python中文
首页
教程
问答
标签
搜索
登录
注册
如何读取空格分隔的数据、两行类型、没有固定宽度和大量缺少的值?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>如果数据是固定宽度</em>,那么有很多关于如何读取缺少值的空格分隔数据的好信息</p> <ul> <li><a href="http://jonathansoma.com/lede/foundations-2017/pandas/opening-fixed-width-files/" rel="nofollow noreferrer">http://jonathansoma.com/lede/foundations-2017/pandas/opening-fixed-width-files/</a></li> <li><a href="https://stackoverflow.com/questions/17997634/reading-space-delimited-file-in-python-pandas-with-missing-values">Reading space delimited file in Python/Pandas with missing values</a></li> <li><a href="https://stackoverflow.com/questions/44472392/ascii-table-with-consecutive-white-spaces-as-separators-and-missing-data-python">ASCII table with consecutive white-spaces as separators and missing data python pandas</a></li> </ul> <p>我目前正试图阅读日本气象局的台风历史数据,该数据应该有<a href="https://www.jma.go.jp/jma/jma-eng/jma-center/rsmc-hp-pub-eg/Besttracks/e_format_bst.html" rel="nofollow noreferrer">this format</a>,但实际上没有:</p> <pre><code># Header rows: 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 ::::+::::|::::+::::|::::+::::|::::+::::|::::+::::|::::+::::|::::+::::|::::+::::| AAAAA BBBB CCC DDDD EEEE F G HHHHHHHHHHHHHHHHHHHH IIIIIIII # Data rows: 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 ::::+::::|::::+::::|::::+::::|::::+::::|::::+::::|::::+::::|::::+::::|::::+::::| AAAAAAAA BBB C DDD EEEE FFFF GGG HIIII JJJJ KLLLL MMMM P </code></pre> <p>它与美国国家海洋和大气管理局的飓风最佳路径数据非常相似,只是它用逗号分隔,缺少的值是-999或NaN,这简化了数据的读取。此外,日本的数据实际上并不遵循广告的格式。例如,数据行中的列<code>FFFF</code>并不总是具有宽度4。有时它的宽度为3</p> <p>我必须说,我完全不知道如何将这些数据处理成数据帧。我研究了<code>pd.read_fwf</code>方法,最初它看起来很有希望,直到我发现格式错误的列和两种不同的行类型</p> <h3>我的问题:</h3> <p><strong>我如何清理这些数据并将其放入数据框?</strong>我只想找到一个不同的数据集,但老实说,我在其他地方找不到任何全面的台风数据</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>有人可能有同样的问题,并为此创建了一个库,您可以在此处查看: <a href="https://github.com/miniufo/besttracks" rel="nofollow noreferrer">https://github.com/miniufo/besttracks</a></p> <p>它还包括一个快速启动笔记本,可以加载相同的数据集</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
9 回答
尽管python中的表达式为false,但循环仍在运行
3 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
5 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
2 回答
尽管python字典包含了大量的条目,但它并没有增长
9 回答
尽管python说模块存在,为什么我会得到这个消息?
10 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
3 回答
尽管stdout和stderr重定向,但未捕获错误消息
3 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
8 回答
尽管tkinter上的变量已更改,但显示未更改
6 回答
尽管try/except使用Python进行单元测试时出现断言错误
8 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
6 回答
尽管url有效,Pandas仍读取url的\u csv错误
8 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
2 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
7 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
9 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
2 回答
尽管下载了i,但找不到型号“fr”
4 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
4 回答
尽管为所有行指定了权重,网格(0)仍不起作用
9 回答