爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 406|回复: 6

./wrf.exe并行核数应该怎么选择

[复制链接]

新浪微博达人勋

发表于 2024-5-26 14:20:05 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
我在学校大型机上跑WRF,根据实验需求设计了三层嵌套网格,不同于简单的三层嵌套,我的最内层的网格有五个,师兄说只要子区域范围没有重叠就可以,我设计了25km、5km、1km的网格,模拟时间24小时。我知道并行运算的核数不是越多越好,但是我在服务器上提交的作业已经高达160个核,./wrf.exe还是会报段错误,为了避免cfl问题,我的步长已经是25s了。想请教一下除了继续增加核数,还有其他办法吗?下面是我的namelist.input文件
&time_control
run_days                            = 0,
run_hours                           = 23,
run_minutes                         = 0,
run_seconds                         = 0,
start_year                          = 1979, 1979, 1979, 1979, 1979, 1979, 1979,
start_month                         = 06,   06,   06,   06,   06,   06,   06,
start_day                           = 01,   01,   01,   01,   01,   01,   01,
start_hour                          = 00,   00,   00,   00,   00,   01,   01,
end_year                            = 1979, 1979, 1979, 1979, 1979, 1979, 1979,
end_month                           = 06,   06,   06,   06,   06,   06,   06,
end_day                             = 01,   01,   01,   01,   01,   01,   01,
end_hour                            = 23,   23,   23,   23,   23,   23,   23,
interval_seconds                    = 3600,
input_from_file                     = .true.,.true.,.true.,
history_interval                    = 60,   60,   60,   60,   60,   60,   60,
frames_per_outfile                  = 1,    1,    1,    1,    1,    1,    1,
restart                             = .false.,
restart_interval                    = 7200,
io_form_history                     = 2,
io_form_restart                     = 2,
io_form_input                       = 2,
io_form_boundary                    = 2,
/

&domains
time_step                           = 25,
time_step_fract_num                 = 0,
time_step_fract_den                 = 1,
max_dom                             = 7,
e_we                                = 344, 786, 241, 576, 236, 326, 321,
e_sn                                = 269, 556, 256, 261, 261, 376, 306,
e_vert                              = 40,    40,   40,  40,  40,  40,  40,
p_top_requested                     = 5000,
num_metgrid_levels                  = 38,
num_metgrid_soil_levels             = 4,
dx                                  = 25000,5000, 1000, 1000, 1000, 1000, 1000,
dy                                  = 25000,5000, 1000, 1000, 1000, 1000, 1000,
grid_id                             = 1,     2,    3,    4,    5,    6,    7,
parent_id                           = 1,     1,    2,    2,    2,    2,    2,
i_parent_start                      = 1,   95,  241,  280,  436, 466,  435,
j_parent_start                      = 1,   80,  45,  103,  154,  258,  389,
parent_grid_ratio                   = 1,    5,   5,    5,    5,    5,    5,
parent_time_step_ratio              = 1,    5,   5,    5,    5,    5,    5,
feedback                            = 1,
smooth_option                       = 0,
smooth_cg_topo                      =.true.,
/

&physics
mp_physics                          = 2,     2,    2,    2,    2,    2,    2,
cu_physics                          = 1,     1,    0,    0,    0,    0,    0,
ra_lw_physics                       = 1,     1,    1,    1,    1,    1,    1,
ra_sw_physics                       = 1,     1,    1,    1,    1,    1,    1,
bl_pbl_physics                      = 1,     1,    1,    1,    1,    1,    1,
sf_sfclay_physics                   = 1,     1,    1,    1,    1,    1,    1,
sf_surface_physics                  = 2,     2,    2,    2,    2,    2,    2,
radt                                = 90,    90,   90,   90,   90,   90,   90,

bldt                                = 0,     0,     0,   0,    0,    0,    0,
cudt                                = 0,     0,     0,   0,    0,    0,    0,
icloud                              = 1,
num_land_cat                        = 21,
sf_urban_physics                   = 0,     0,     0,    0,    0,    0,    0,
/

&fdda
/

&dynamics
hybrid_opt                          = 2,
w_damping                           = 0,
diff_opt                            = 1,     1,     1,    1,    1,    1,    1,
km_opt                              = 4,     4,     4,    4,    4,    4,    4,
diff_6th_opt                        = 0,     0,     0,    0,    0,    0,    0,
diff_6th_factor                     = 0.12,  0.12,  0.12, 0.12, 0.12, 0.12, 0.12,
base_temp                           = 290.
damp_opt                            = 3,
zdamp                               = 5000., 5000., 5000., 5000., 5000., 5000., 5000.,
dampcoef                            = 0.2,   0.2,   0.2,   0.2,   0.2,   0.2,   0.2,
khdif                               = 0,      0,      0,     0,     0,     0,     0,
kvdif                               = 0,      0,      0,     0,     0,     0,     0,
non_hydrostatic                     = .true., .true., .true.,.true.,.true.,.true.,.true.,
moist_adv_opt                       = 1,      1,      1,     1,     1,     1,     1,
scalar_adv_opt                      = 1,      1,      1,     1,     1,     1,     1,
gwd_opt                             = 1,      1,      0,     0,     0,     0,     0,
epssm                               = 0.2,    0.2,    0.2,   0.2,   0.2,   0.2,   0.2,
w_damping                           = 1,
/

&bdy_control
spec_bdy_width                      = 5,
specified                           = .true.
/

&grib2
/

&namelist_quilt
nio_tasks_per_group = 0,
nio_groups = 1,



密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2024-5-26 18:38:18 | 显示全部楼层
很特別呢!!!我也很好奇!!!!您的real.exe能過(就不知道您這個過程也是啟用這麼多的CPU嗎?),為何wrf.exe卻無法執行呢???

密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

发表于 2024-5-27 14:17:13 | 显示全部楼层
恕我直言,你这7个嵌套,160能跑的动?你的格点数每层都很多为了测试,先把max_dom改成3看看吧
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2024-5-27 14:54:51 | 显示全部楼层
KIMO23 发表于 2024-5-26 18:38
很特別呢!!!我也很好奇!!!!您的real.exe能過(就不知道您這個過程也是啟用這麼多的CPU嗎?),為何wrf.exe卻無 ...

./real.exe也是并行运算,但是只用到10个核
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2024-5-27 14:59:40 | 显示全部楼层
andrewsoong 发表于 2024-5-27 14:17
恕我直言,你这7个嵌套,160能跑的动?你的格点数每层都很多为了测试,先把max_dom改成3看看吧

您好,是因为每层格点都太多,所以需要的核心数才非常多对吗?因为我最内层的五个小区域是必须的,您觉得可以通过降低嵌套比例来达到降低所需核心的数量吗?非常感谢您的回复!
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

发表于 2024-5-27 15:13:53 | 显示全部楼层
这……,需要消耗的计算资源很多呀,如果内存带宽不存在瓶颈,那么160核跑起来估计也很困难
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2024-5-28 17:24:39 | 显示全部楼层
我修改成了75km、15km、3km的网格,学校单节点是40个核,40核报段错误,80个核建议减少核数,因为是学校服务器,提交作业需要排队,还在试60个核会不会中断
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表