爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 17031|回复: 15

[求助]运行WRF.exe遇到内存错误的新问题

[复制链接]

新浪微博达人勋

发表于 2013-7-10 16:08:38 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
前面运行WRF的一个例子遇到segment fault, 使用ulimit解决了问题
现在运行另一个例子(Hurricane Kritina), 再一次遇到类似的内存错误
[sl@sl0 em_real]$ mpirun -np 8 ./wrf.exe
starting wrf task            2  of            8
starting wrf task            3  of            8
starting wrf task            4  of            8
starting wrf task            5  of            8
starting wrf task            6  of            8
starting wrf task            7  of            8
starting wrf task            0  of            8
starting wrf task            1  of            8

===================================================================================
=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   EXIT CODE: 174
=   CLEANING UP REMAINING PROCESSES
=   YOU CAN IGNORE THE BELOW CLEANUP MESSAGES
===================================================================================

rsl.error.0000文件见附件, 其中最后出错的几行如下:
...
Timing for main: time 2005-08-28_02:09:00 on domain   1:    0.42843 elapsed seconds
d01 2005-08-28_02:09:00           13 points exceeded cfl=2 in domain d01 at tim
e 2005-08-28_02:09:00 hours
d01 2005-08-28_02:09:00  MAX AT i,j,k:           11          10          20 ver
t_cfl,w,d(eta)=   3.831837       9.934769      3.5938144E-02
d01 2005-08-28_02:09:00           11 points exceeded cfl=2 in domain d01 at tim
e 2005-08-28_02:09:00 hours
d01 2005-08-28_02:09:00  MAX AT i,j,k:           11          10          21 ver
t_cfl,w,d(eta)=   3.942808      -3.771774      3.2001421E-02
d01 2005-08-28_02:09:00           23 points exceeded cfl=2 in domain d01 at tim
e 2005-08-28_02:09:00 hours
d01 2005-08-28_02:09:00  MAX AT i,j,k:           11          10          25 ver
t_cfl,w,d(eta)=   17.32337      -327.7667      1.7589740E-02
Timing for main: time 2005-08-28_02:12:00 on domain   1:    0.43319 elapsed seconds
Timing for main: time 2005-08-28_02:15:00 on domain   1:    0.42737 elapsed seconds
forrtl: severe (174): SIGSEGV, segmentation fault occurred
Image              PC                Routine            Line        Source            
wrf.exe            0000000001CEAC63  Unknown               Unknown  Unknown
wrf.exe            0000000001CE3E31  Unknown               Unknown  Unknown
wrf.exe            00000000018A3F70  Unknown               Unknown  Unknown
wrf.exe            0000000001470629  Unknown               Unknown  Unknown
wrf.exe            0000000000F029E0  Unknown               Unknown  Unknown
wrf.exe            0000000000DE8D4C  Unknown               Unknown  Unknown
wrf.exe            000000000049D69F  Unknown               Unknown  Unknown
wrf.exe            0000000000405461  Unknown               Unknown  Unknown
wrf.exe            000000000040541D  Unknown               Unknown  Unknown
wrf.exe            00000000004053BC  Unknown               Unknown  Unknown
libc.so.6          00000037F301ECDD  Unknown               Unknown  Unknown
wrf.exe            00000000004052B9  Unknown               Unknown  Unknown

使用ulimit -s unlimited和export KMP_STACKSIZE=500000000都没有解决这个问题. 谁知道怎么解决? 谢谢先.
rsl.error.0000 (13.5 KB, 下载次数: 5)
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2013-7-10 22:39:53 | 显示全部楼层
这个不是内存问题,是计算不稳定(CFL判据报错)。减少时间步长是个解决办法。

评分

参与人数 1金钱 +10 收起 理由
letsdo8 + 10

查看全部评分

密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2013-7-11 12:34:58 | 显示全部楼层
感谢楼上
把时间步长减小之后, 没有错误了
不需要设置栈大小
不过我有点不明白, 一般都有什么原因会引起这种segmentation fault的错误?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-12-26 17:43:41 | 显示全部楼层
bjj948 发表于 2013-7-10 22:39
这个不是内存问题,是计算不稳定(CFL判据报错)。减少时间步长是个解决办法。

我也遇到了类似的问题,但是我减小了时间步长然没有解决,请问会不会是其它参数设置的问题?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-12-27 04:50:40 | 显示全部楼层
nuist2015 发表于 2015-12-26 17:43
我也遇到了类似的问题,但是我减小了时间步长然没有解决,请问会不会是其它参数设置的问题?

将两个namelist文件贴一下,看看吧。

评分

参与人数 1金钱 +20 贡献 +2 收起 理由
letsdo8 + 20 + 2

查看全部评分

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-12-27 16:18:58 | 显示全部楼层
bjj948 发表于 2015-12-27 04:50
将两个namelist文件贴一下,看看吧。

------------------------------------- namelist.wps -----------------------------------------------
&share
wrf_core = 'ARW',
max_dom = 2,
start_date = '2015-04-28_00:00:00','2015-04-28_00:00:00','2014-09-28_00:00:00',
end_date   = '2015-04-29_00:00:00','2015-04-29_00:00:00','2014-09-29_00:00:00',
interval_seconds = 21600
io_form_geogrid = 2,
/

&geogrid
parent_id         =   1,   1,  2,
parent_grid_ratio =   1,   3,  3,
i_parent_start    =   1,  15,  14,
j_parent_start    =   1,  15,  30,
e_we              =  100,  202,  67,
e_sn              =  80,  160, 76,
geog_data_res     = '10m','2m','30s'
dx = 3000,
dy = 3000,
map_proj = 'lambert',
ref_lat   =  32.21,
ref_lon   = 118.71,
truelat1  =  30.0,
truelat2  =  60.0,
stand_lon = -98.0,
geog_data_path = '/nuist/p/work/guofx77/geog/'
/

&ungrib
out_format = 'WPS',
prefix = 'FILE',
/

&metgrid
fg_name = 'FILE'
io_form_metgrid = 2,
/


---------------------------------------------  namelist.input ---------------------------------------------------
&time_control
run_days                            = 1,
run_hours                           = 0,
run_minutes                         = 0,
run_seconds                         = 0,
start_year                          = 2015, 2015, 2012, 2012, 2012,
start_month                         = 04, 04, 05, 05, 05,
start_day                           = 28, 28, 29, 29, 29,
start_hour                          = 00, 00, 12, 18, 12,
start_minute                        = 00, 00, 00, 00, 00,
start_second                        = 00, 00, 00, 00, 00,
end_year                            = 2015, 2015, 2012, 2012, 2012,
end_month                           = 04, 04, 05, 05, 05,
end_day                             = 29, 29, 30, 30, 31,
end_hour                            = 00, 00, 06, 06, 12,
end_minute                          = 00, 00, 00, 00, 00,
end_second                          = 00, 00, 00, 00, 00,
interval_seconds                    = 21600
input_from_file                     = .true.,.false.,.false.,
history_interval                    = 20, 30, 40, 20, 60,
frames_per_outfile                  = 12,  8,  10,  30,  1,
restart                             = .false.,
restart_interval                    = 500000,
io_form_history                     = 2
io_form_restart                     = 2
io_form_input                       = 2
io_form_boundary                    = 2
debug_level                         = 0
/

&domains
time_step                           = 10,
time_step_fract_num                 = 0,
time_step_fract_den                 = 1,
max_dom                             = 2,
s_we                                = 1,     1,     1,     1,     1,
e_we                                = 100,  202,   229,   256,   241,
s_sn                                = 1,     1,     1,     1,     1,
e_sn                                = 80,   160,   313,   343,   286,
s_vert                              = 1,     1,     1,     1,     1,
e_vert                              = 48,   48,   48,     48,     48,
sfcp_to_sfcp                         = .false.
dx                                  = 3000,   1000,   4500,   1500,   500,
dy                                  = 3000,   1000,   4500,   1500,   500,
grid_id                             = 1,     2,     3,     4,     5,
parent_id                           = 0,     1,     2,     3,    4,
i_parent_start                      = 0,   15,   57,   66,   88,
j_parent_start                      = 0,   15,   50,   150,   231,
parent_grid_ratio                   = 1,    3,   3,   3,   3,
parent_time_step_ratio              = 1,    3,    3,    3,    3,
feedback                            = 0,
smooth_option                       = 0,
num_metgrid_levels                  = 27,
num_metgrid_soil_levels             = 4,
p_top_requested                     = 5000,
eta_levels                          = 1.000,0.997,0.994,0.991,0.988,0.985,0.980,0.975,0.970,0.960,0.950,
                                       0.940,0.930,0.920,0.910,0.895,0.880,
                                       0.865,0.850,0.825,0.800,0.775,0.750,
                                       0.720,0.690,0.660,0.630,0.600,0.570,
                                       0.540,0.510,0.475,0.440,0.405,0.370,
                                       0.330,0.290,0.250,0.210,0.175,0.145,
                                       0.115,0.090,0.065,0.045,0.025,0.010,
                                       0.000,
smooth_option                       = 0
/

&physics
mp_physics                          = 27,     27,     27,     27,     6,
nssl_cccn                           = 3e+7, 3e+7, 3e+7, 0.6e+9
nssl_ipelec                         = 2,     2,      2,     2,
nssl_isaund                         = -5,    -5,     -5,    -5,   
nssl_ilight                         = 2,     2,     2,     2,   
nssl_iscreen                        = 0,     0,     0,     1,      
gsfcgce_hail                        = 0,   
gsfcgce_2ice                        = 0,     
ra_lw_physics                       = 1,     1,     5,     1,      1,
ra_sw_physics                       = 1,     1,     5,     1,      1,
radt                                = 10,    10,     0,   30,      30,
sf_sfclay_physics                   = 2,     2,     2,     1,      1,
sf_surface_physics                  = 2,     2,     0,     2,      2,
bl_pbl_physics                      = 2,     2,     0,     1,     1,
bldt                                = 0,     0,     0,     0,      0,
cu_physics                          = 0,     0,     0,     0,      0,
cudt                                = 10,     5,     5,     5,      5,
surface_input_source                = 1,
num_soil_layers                     = 4,
maxiens                             = 1,
maxens                              = 3,
maxens2                             = 3,
maxens3                             = 16,
ensdim                              = 144,
/

&fdda
/


&dynamics
w_damping                           = 1,
diff_opt                            = 1,
km_opt                              = 4,
diff_6th_opt                        = 1,
diff_6th_factor                     = 0.12,
damp_opt                            = 0,
base_temp                           = 290.
zdamp                               = 5000.,  5000.,  5000.,  5000.,  5000.,
dampcoef                            = 0.2,    0.2,    0.2,    0.2,    0.2,
khdif                               = 0,    500,    500,      0,      0,
kvdif                               = 0,    500,    500,      0,      0,
non_hydrostatic                     = .true., .true., .true., .true., .true.,
time_step_sound                     = 6,      6,      6,      4,      4,
h_mom_adv_order                     = 5,      5,      5,      5,      5,
v_mom_adv_order                     = 5,      5,      5,      5,      3,
h_sca_adv_order                     = 5,      5,      5,      5,      5,
v_sca_adv_order                     = 5,      5,      5,      3,      3,
moist_adv_opt                       =4,
scalar_adv_opt                      =3,
/

&bdy_control
spec_bdy_width                      = 5,
spec_zone                           = 1,
relax_zone                          = 4,
specified                           = .true., .false.,
nested                              = .false., .true.,
/

&grib2
/

&namelist_quilt
nio_tasks_per_group = 0,
nio_groups = 1,
/
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-12-27 20:20:32 | 显示全部楼层
你算的很高分辨率,1km。驱动场是什么呀?从驱动场到3km时是否比例过大?

truelat1和truela2最好设成关于ref_lat大致对称的,以能得到的地图投影因子场值尽可能接近于1为准。(也可能把truela2移到40度就可以,因为你的区域面积是不大的)。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-12-28 10:09:44 | 显示全部楼层
letsdo8 发表于 2015-12-27 20:20
你算的很高分辨率,1km。驱动场是什么呀?从驱动场到3km时是否比例过大?

truelat1和truela2最好设成关 ...

我使用的是fnl  6小时再分析数据,现在该开始接触,很多都不是很明白,比如你说的这些我就不是很懂,需要补充的知识还很多啊!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-12-25 10:04:51 | 显示全部楼层
letsdo8 发表于 2015-12-27 20:20
你算的很高分辨率,1km。驱动场是什么呀?从驱动场到3km时是否比例过大?

truelat1和truela2最好设成关 ...

我也调整了时间步长但是还是报错
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-2-21 18:54:03 | 显示全部楼层
XBP 发表于 2016-12-25 10:04
我也调整了时间步长但是还是报错

所以楼主现在解决了这个问题了吗?
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表