爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 19|回复: 0

[经验总结] 数值模式 | python 也能运行 wrf,我怎么会做这样的梦

[复制链接]
发表于 昨天 16:19 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 tosaka 于 2026-2-18 16:26 编辑

数值模式 | python 也能运行 wrf,我怎么会做这样的梦
个人信息
公众号:气 python 风雨
关注我获取更多气象/Python 学习资料,第一时间收到我的技术分享,也可获取我的联系方式沟通合作

前言
朋友说这位是今年的春晚总导演,我说你这游戏也太老了,现在的小朋友知道嘛

                               
登录/注册后可看大图
最近在气象家园论坛闲逛时,看到一位作者正在宣传他开发的一个开源项目——wrfrun。作为一个经常和 WRF(Weather Research and Forecasting)模型打交道的气象人,我觉得可以了解一下。
说实话,跑 WRF 对很多初学者来说是个"噩梦":
  • WPS 预处理流程繁琐,geogrid、ungrib、metgrid、real 一步步来,容易出错
  • namelist 配置复杂,参数众多,一不小心就报错
  • 作业提交、日志管理、数据整理都是体力活
  • 换台机器跑同样的实验,环境配置让人头大
而 wrfrun 这个项目的口号:_"Designed for researchers who want to focus on science — not on the details of model execution."_(为那些想专注于科学而非模型执行细节的研究者而设计)
这句话好耳熟啊,好像很多项目都这么讲

项目简介
wrfrun 是一个现代化的数值模型运行管理框架,用 Python 编写。它的核心目标是:
自动化模型执行中的繁琐环节——准备输入数据、处理 namelist 配置、组织日志、提交作业——让你把时间花在研究上,而不是管理模型运行。
简单来说,它把 WRF 的整套流程封装成了 Python 函数,你只需要写几行代码,就能完成从前处理到模式运行的全部工作。

核心特性详解1️⃣ 统一接口架构
wrfrun 为所有数值模型提供了统一的接口规范。每个模型接口都继承自提供的基类,确保不同模型之间有一致的结构和行为。
这意味着什么?任何支持的模型都可以通过调用 Python 函数或类方法来启动,wrfrun 会自动在后台处理数据准备、配置文件管理等任务。
from wrfrun import WRFRun
from wrfrun.model.wrf import geogrid, metgrid, real, ungrib, wrf

# wrfrun will prepare input data, generate namelist file,
# save outputs and logs automatically.
with WRFRun("./config.toml", init_workspace=True) as wrf_run:
    geogrid()
    ungrib()
    metgrid()
    real()
    wrf()
看到没?原本需要手动一步步执行的 WPS 流程,现在变成了几行 Python 代码!

2️⃣ 记录与回放(Record & Replay)
每次模拟都可以被完整记录,之后可以通过单个.replay 文件在不同目录或不同机器上重现——确保完全可重复性。
from wrfrun import WRFRun
from wrfrun.model.wrf import geogrid, ungrib, metgrid, real, wrf

# 1. 记录模拟
with WRFRun("./config.toml", init_workspace=True) as wrf_run:
    wrf_run.record_simulation(output_path="./outputs/example.replay")
    geogrid()
    ungrib()
    metgrid()
    real()
    wrf()

# 2. 在不同目录或机器上回放模拟
with WRFRun("./config.toml", init_workspace=True) as wrf_run:
    wrf_run.replay_simulation("./example.replay")
这对做敏感性实验、分享实验配置、保证结果可复现都非常有用

3️⃣ 简化配置(TOML 格式)
告别繁琐的 namelist!wrfrun 使用TOML 格式来管理配置,更加直观易读。
主配置文件 config.toml:
work_dir = "./.wrfrun"
input_data_path = ""
output_path = "./outputs"
log_path = "./logs"
server_host = "localhost"
server_port = 54321
core_num = 36

[job_scheduler]
job_scheduler = "pbs"
queue_name = ""
node_num = 1

[model]
[model.wrf]
use = false
include = "./configs/wrf.toml"
WRF 模型配置 wrf.toml:
wps_path = '/path/to/your/WPS/folder'
wrf_path = '/path/to/your/WRF/folder'
geog_data_path = '/path/to/your/geog/data'

[time]
start_date = 2021-03-24T12:00:00Z
end_date = 2021-03-26T00:00:00Z
input_data_interval = 10800
output_data_interval = 180

[domain]
domain_num = 3
dx = 9000
dy = 9000
当然,如果你习惯了传统的 namelist,wrfrun 也兼容,只需在配置中指定 namelist 文件路径即可。

4️⃣ 作业调度集成
支持主流的作业调度系统:PBS、Slurm、LSF
只需设置 submit_job=True,wrfrun 就会自动处理资源请求和队列管理:
from wrfrun import WRFRun
from wrfrun.model.wrf import geogrid, metgrid, real, ungrib, wrf

# just set submit_job=True
with WRFRun("./config.toml", init_workspace=True, submit_job=True) as wrf_run:
    geogrid()
    ungrib()
    metgrid()
    real()
    wrf()
再也不用写复杂的提交脚本了!

5️⃣ 实时监控
wrfrun 可以解析模型日志文件,并启动轻量级 socket 服务器来报告模拟进度。
from wrfrun import WRFRun
from wrfrun.model.wrf import geogrid, metgrid, real, ungrib, wrf

# just set start_server=True
with WRFRun("./config.toml", init_workspace=True, start_server=True) as wrf_run:
    geogrid()
    ungrib()
    metgrid()
    real()
    wrf()
这样你就可以实时查看模式运行到哪一步了,不用一直去翻日志文件。

快速安装
安装非常简单,一行命令搞定:
pip install wrfrun

快速入门实战:以飓风 Matthew 为例
官方文档提供了一个完整的入门案例——模拟飓风 Matthew(单域)。让我们一步步来看 wrfrun 是如何简化 WRF 运行的。
准备工作
环境要求:
  • 已安装 WRF(可以用 WRF-Install-Script 在 Ubuntu 上一键安装)
  • 已安装 wrfrun:pip install wrfrun
  • 下载 Matthew 案例数据并解压到 data/matthew/bg 目录
第一步:生成配置文件
wrfrun 有个很贴心的设计:如果配置文件不存在,它会自动复制模板配置文件并提示你需要修改哪些参数
from wrfrun import WRFRun

with WRFRun("config.toml") as server:
    pass
运行后会看到错误提示:
ERROR wrfrun :: Config file doesn't exist, copy template config to /path/to/config.toml
ERROR wrfrun :: Please modify it. You need to change following settings:
- input_data_path: 数据路径,应为 data/matthew/bg
- output_path: WRF输出目录
- core_num: 使用的核心数
- wps_path: WPS安装目录
- wrf_path: WRF安装目录
- geog_data_path: 地理数据目录
第二步:修改配置参数
根据数据修改时间和域配置:
[model.wrf.time]
start_date = 2016-10-06T00:00:00Z
end_date = 2016-10-08T00:00:00Z
input_data_interval = 21600  # 6小时,单位秒
domain_num = 1  # 单域模拟
第三步:运行 WPS 预处理from wrfrun import WRFRun
from wrfrun.model.wrf import ungrib, VtableFiles

with WRFRun("config.toml") as server:
    # 指定使用GFS的Vtable文件
    ungrib(vtable_file=VtableFiles.GFS)
运行后 wrfrun 会:
  • 自动执行 link_grib.csh 链接 GRIB 数据
  • 运行 ungrib.exe 解码数据
  • 将输出文件自动整理到 outputs/ungrib 目录
更棒的是:wrfrun 内置了域检验功能!再次运行脚本时,它会用 NCL 绘制模拟域图像:
INFO wrfrun :: The image of domain area has been saved to outputs/wps_show_dom.png
WARNING wrfrun :: Check the domain image, is it right? [y/N]:
如果域设置不对,直接按回车退出修改;确认无误输入 y 继续。这个功能对检查嵌套域设置特别有用!
第四步:完整 WPS 流程from wrfrun import WRFRun
from wrfrun.model import geogrid, ungrib, metgrid

with WRFRun("./config.toml") as server:
    geogrid()   # 生成静态地理数据
    ungrib()    # 解码气象数据
    metgrid()   # 水平插值到模式网格
所有日志和输出都会自动分类保存到 outputs 目录下的子文件夹中。
第五步:运行 WRFfrom wrfrun import WRFRun
from wrfrun.model import real, wrf

with WRFRun("./config.toml") as server:
    real()  # 垂直插值,生成边界和初始场
    wrf()   # 运行WRF模式
至此,完整的 WRF 流程就跑完了!是不是比传统方式简单太多了?

配置文件深度解析
wrfrun 的配置文件分为两大块:**wrf 块** 和 wrfrun 块
wrf 块:模式核心配置
路径设置(必须修改):
[model.wrf]
wps_path = '/path/to/your/WPS/folder'      # WPS安装目录
wrf_path = '/path/to/your/WRF/folder'      # WRF安装目录
wrfda_path = ''                            # WRFDA路径(可选)
geog_data_path = '/path/to/your/geog/data' # 地理数据目录
时间配置:
[model.wrf.time]
start_date = 2021-03-24T12:00:00Z    # 模拟开始时间
end_date = 2021-03-26T00:00:00Z      # 模拟结束时间
input_data_interval = 10800          # 输入数据时间间隔(秒)
output_data_interval = 180           # 输出时间间隔(分钟)
time_step = 120                      # 积分时间步长(秒)
parent_time_step_ratio = [1, 3, 4]   # 各域相对于d01的时间步长比例
restart_interval = -1                # 重启文件输出间隔(分钟,-1表示与output相同)
域配置:
[model.wrf.domain]
domain_num = 3                       # 嵌套域数量
parent_grid_ratio = [1, 3, 9]        # 分辨率比例
i_parent_start = [1, 17, 72]         # 各域在父域中的起始i索引
j_parent_start = [1, 17, 36]         # 各域在父域中的起始j索引
e_we = [120, 250, 1198]              # 各域东西向格点数
e_sn = [120, 220, 1297]              # 各域南北向格点数
dx = 9000                            # d01东西向分辨率(米)
dy = 9000                            # d01南北向分辨率(米)

[model.wrf.domain.map_proj]
name = 'lambert'                     # 投影类型:lambert/polar/mercator/lat-lon
truelat1 = 34.0                      # 标准纬度1(Lambert投影)
truelat2 = 40.0                      # 标准纬度2(Lambert投影)
ref_lat = 37.0                       # 中心纬度
ref_lon = 120.5                      # 中心经度
stand_lon = 120.5                    # 标准经度
物理方案配置(用名称代替数字,更直观!):
wrfrun 的一大亮点是用易记的名称代替 WRF 中容易混淆的数字选项:
[model.wrf.scheme]
# 长波辐射方案
# 可选:"off", "rrtm", "cam", "rrtmg", "new-goddard", "flg", "rrtmg-k", "held-suarez", "gfdl"
long_wave_scheme = { name = "rrtm", option = {} }

# 短波辐射方案
# 可选:"off", "dudhia", "goddard", "cam", "rrtmg", "new-goddard", "flg", "rrtmg-k", "gfdl"
short_wave_scheme = { name = "rrtmg", option = {} }

# 积云对流方案
# 可选:"off", "kf", "bmj", "gf", "old-sas", "grell-3", "tiedtke", "zmf"...
cumulus_scheme = { name = "kf", option = {} }

# 边界层方案
# 可选:"off", "ysu", "myj", "qe", "mynn2", "acm2", "boulac", "uw"...
pbl_scheme = { name = "ysu", option = { ysu_topdown_pblmix = 1 } }

# 陆面过程方案
# 可选:"off", "slab", "noah", "ruc", "noah-mp", "clm4", "px", "ssib"
land_surface_scheme = { name = "noah", option = {} }

# 近地面层方案
# 可选:"off", "mm5", "mo", "qnse", "mynn", "px", "temf", "old-mm5"
surface_layer_scheme = { name = "mm5", option = {} }
每个方案都有 name 和 option 两个字段。option 可以用来设置该方案特有的参数,比如上面的 ysu_topdown_pblmix。
wrfrun 块:运行环境配置work_dir = "./.wrfrun"           # 工作目录
input_data_path = "./data/bg"    # 输入数据路径
output_path = "./outputs"        # 输出保存路径
log_path = "./logs"              # 日志保存路径

server_host = "localhost"        # 监控服务器地址
server_port = 54321              # 监控服务器端口
core_num = 36                    # 使用核心数

[job_scheduler]
job_scheduler = "pbs"            # 作业调度系统:pbs/slurm/lsf
queue_name = ""                  # 队列名称
node_num = 1                     # 使用节点数
env_settings = {}                # 自定义环境变量
python_interpreter = "/usr/bin/python3"  # Python解释器路径
自定义 namelist(高级用法)
虽然 wrfrun 已经覆盖了大部分常用参数,但 WRF 的 namelist 选项实在太多。wrfrun 允许你提供自定义 namelist 文件来覆盖默认设置:
[model.wrf]
user_wps_namelist = './namelist/custom_wps_namelist'
user_real_namelist = './namelist/custom_real_namelist'
user_wrf_namelist = './namelist/custom_wrf_namelist'
自定义 namelist 不需要写完整的文件,只需要包含你想修改的参数:
&share
    io_form_geogrid = 3  # 修改geogrid输出格式为GRIB1
/
wrfrun 会在生成最终 namelist 时,用你的设置覆盖默认值。

更多实用功能自动下载 ERA5 数据
wrfrun 支持用 cdsapi 自动下载 ERA5 再分析数据:
from wrfrun import WRFRun

# data area: 90°E - 180°E, 10°N - 70°N
with WRFRun("./config.toml",
            prepare_wps_data=True,           # 自动下载数据
            wps_data_area=(90, 180, 10, 70)  # 数据区域:西经、东经、北纬、南纬
           ) as server:
    pass
注意:需要提前配置好 cdsapi 的认证信息(~/.cdsapirc文件)。
查看生成的 namelist
想检查 wrfrun 生成的 namelist 是否正确?可以用 write_namelist 函数:
from wrfrun import WRFRun, write_namelist

with WRFRun("./config.toml") as server:
    write_namelist("./test_namelist", "wps")  # 输出WPS的namelist

当前能力与路线图
已实现功能:
  • ✅ 自动 ERA5 数据下载(需要 cdsapi 认证)
  • ✅ 通过 socket 接口实时报告模拟进度
  • ✅ WRF 部分支持:WPS 完整支持、real 和 wrf 的包装执行
  • ✅ PBS、Slurm、LSF 作业提交
  • ✅ 符合规范的接口支持记录/回放可重复性
待开发功能:
  • 🔄 完整的 WRF 模型集成
  • 🔄 扩展更多模式支持
  • 🔄 增强的进度可视化仪表板

小结
wrfrun 这个项目的工作流很不错——用现代化的 Python 工具链来改造传统的气象模式工作流。它解决了 WRF 运行中的几个痛点:
  • 流程繁琐 → Python 化封装,几行代码搞定
  • 配置复杂 → TOML 格式,清晰直观
  • 可重复性差 → Record/Replay 机制,确保实验可复现
  • 作业管理麻烦 → 内置调度系统集成可以看出作者是熟练使用wrf并将自己的方法论融入到这个仓库中。
对于经常需要批量跑 WRF 实验的研究者来说,这个工具能节省大量时间。项目还在积极开发中,期待作者后续能支持更多模式(比如 CESM、WRF-Chem 等)
当然也可以支持更多格式的初始场下载,例如gfs、cfs、fnl等等
如果你是小白最好还是自行手动跑一遍wrf对于整体流程有了解后再玩玩这个新玩具。
如果你也在用 WRF 做研究,不妨去 GitHub 上点个 star,或者试用一下给作者反馈~

参考
本文介绍了 wrfrun 这一 WRF 运行管理框架,希望能帮助到有需要的同学。如果觉得有用,欢迎点赞、在看、转发三连!
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表