爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 32878|回复: 23

[源代码] Python读取html表格并存为excel

[复制链接]

新浪微博达人勋

发表于 2019-3-20 22:53:15 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
本帖最后由 young89 于 2019-3-29 11:25 编辑

已解决!
感谢clarmy给出的代码。

求助!
现在我有html表格,想将html表格转为excel。
用python中的pandas包,pd.read_html(),读出来的数据类型是list
我该怎么将list转为DataFrame格式从而存为excel呢?

或者有什么简便方法可以直接实现将html表格转为excel呢?

求大神解答,谢谢!

这是我要读取的html表格

这是我要读取的html表格

本帖被以下淘专辑推荐:

密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-21 11:02:27 | 显示全部楼层
不好意思,这个是我要读取的html表格,我发上来

getSurfAwst4Prov_20140528000000.html

2.37 MB, 下载次数: 9, 下载积分: 金钱 -5

这个是要读取的html表格

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-21 13:18:21 | 显示全部楼层
给你写了个脚本,你在脚本里修改文件路径运行就行。出来的是csv文件,可以用Excel打开。

parse.py

832 Bytes, 下载次数: 37, 下载积分: 金钱 -5

解析脚本

密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

发表于 2019-3-21 10:07:59 | 显示全部楼层

回帖奖励 +10 金钱

把HTML文件传上来,或者把你读出来的list的格式发出来
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-21 10:09:27 | 显示全部楼层

回帖奖励 +10 金钱

你上传个文件别人可以试试,单独给个图片也不知道具体的格式
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-21 10:51:09 | 显示全部楼层

回帖奖励 +10 金钱

既然数据保存为了HTML文件,最简单快捷的方法就是:
1.打开HTML文件,全选复制
2.打开EXCEL,粘贴就行啦
Snipaste_2019-03-21_10-49-58.png
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-21 10:59:40 | 显示全部楼层
835479131 发表于 2019-3-21 10:51
既然数据保存为了HTML文件,最简单快捷的方法就是:
1.打开HTML文件,全选复制
2.打开EXCEL,粘贴就行啦
...

因为问我要存的表格比较多,一步一步粘贴太耗时间了
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-21 11:04:31 | 显示全部楼层
clarmy 发表于 2019-3-21 10:07
把HTML文件传上来,或者把你读出来的list的格式发出来

谢谢提醒,我发上来了
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-21 11:35:09 | 显示全部楼层
chongzika 发表于 2019-3-21 10:09
你上传个文件别人可以试试,单独给个图片也不知道具体的格式

我发上来了,谢谢提醒
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-21 12:20:17 | 显示全部楼层
你是用IDEAClient下载的文件吧,直接把dataformat设置为csv就行了啊
Snipaste_2019-03-21_12-19-40.png
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表