爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
楼主: young89

[源代码] Python读取html表格并存为excel

[复制链接]

新浪微博达人勋

发表于 2019-3-21 13:20:30 | 显示全部楼层
如果你有Python基础,把脚本稍微修改一下做个循环,就可以批量解析了。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-21 14:02:01 | 显示全部楼层
clarmy 发表于 2019-3-21 13:18
给你写了个脚本,你在脚本里修改文件路径运行就行。出来的是csv文件,可以用Excel打开。

哇,谢谢大神,我试了一下可以了
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-21 23:30:02 | 显示全部楼层

回帖奖励 +10 金钱

楼主这是直接从CIMISS后面的Oracle直接读数据?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-22 10:10:08 | 显示全部楼层
QCD 发表于 2019-3-21 23:30
楼主这是直接从CIMISS后面的Oracle直接读数据?

这个是同学师姐直接给的一些下好的html表格
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2019-3-22 10:14:41 | 显示全部楼层
clarmy 发表于 2019-3-21 13:18
给你写了个脚本,你在脚本里修改文件路径运行就行。出来的是csv文件,可以用Excel打开。

我还想请教一下,脚本里面那个pattern,正则表达式是根据表格的内容写的么?可以参照什么来写呢?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-22 10:16:28 | 显示全部楼层

回帖奖励 +10 金钱

Beautiful Soup取出一个带爬取的URL,传递给网页下载器,网页下载器将URL指定的网页下载下来,存储成一个字符串,传递给网页解析器,解析器解析出需要爬取的数据,存储爬取的数据存为csv。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2019-3-25 13:49:07 | 显示全部楼层
young89 发表于 2019-3-22 10:14
我还想请教一下,脚本里面那个pattern,正则表达式是根据表格的内容写的么?可以参照什么来写呢?

对,是根据html代码写的,你可以去查一查正则表达式的语法。
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2019-3-25 14:29:49 | 显示全部楼层
clarmy 发表于 2019-3-25 13:49
对,是根据html代码写的,你可以去查一查正则表达式的语法。

好的,谢谢!
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

发表于 2019-3-26 08:45:22 | 显示全部楼层
pandas是优秀的数据表处理库,支持很多类型的数据通过转换为dataframe类型来处理。楼主只需要看一下pandas的写入功能,如何把list写入dataframe即可,dataframe转excel也有对应的方法。我在百度搜的一些线索:https://blog.csdn.net/nageaixiaodenanhai/article/details/79828895
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2019-3-26 08:58:11 | 显示全部楼层
方自之 发表于 2019-3-26 08:45
pandas是优秀的数据表处理库,支持很多类型的数据通过转换为dataframe类型来处理。楼主只需要看一下pandas ...

谢谢!!!
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表