爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 7335|回复: 7

请教WRF为什么会中断运行,并且不报错

[复制链接]

新浪微博达人勋

发表于 2022-7-31 18:51:55 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
请教各位前辈大佬,real.exe成功执行后,运行wrf.exe发现程序会中断,但查看rsl.error.0000里面没有发现任何错误信息,只是在输出信息上卡在了med_initialdata_input这一行,对应此时我的wrf作业中断了。然后我再次提交wrf.exe的作业,又能正常输出wrfout。非常奇怪,有时会莫名其妙的中断,有时又会正常运行,可能跟mpirun有关系吗?谢谢!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2022-7-31 21:41:13 | 显示全部楼层
应该是内存不够
密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

发表于 2022-8-1 14:02:41 | 显示全部楼层
第一:遇到这种情况,先把namelist的debuglevel调成最高=500,重新运行,会在日志中看到中断时的报错信息;
第二:如果最高等级的bebug输出都没有任何报错信息显示的话,可能是时间步长设置太大,试试减少步长;
第三:如果前两个都不行,再试试时候内存不足,试试增加运行核数
密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

发表于 2022-8-1 14:59:22 | 显示全部楼层
我也遇到过,一般是积分步长过长或者机器某个核出了问题
密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2022-8-1 10:51:04 来自手机 | 显示全部楼层

谢谢大佬,我是在超算上跑的,调用了6个nodes,每个node用20个cpu,就是mpirun -np 120,是不是需要考虑减少单个node的cpu,增加nodes数量呢,谢谢
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2022-8-3 23:36:42 来自手机 | 显示全部楼层
曼联现在没$ 发表于 2022-08-01 14:59
我也遇到过,一般是积分步长过长或者机器某个核出了问题

谢谢大佬的回复!受益匪浅!
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

 楼主| 发表于 2022-8-3 23:39:36 来自手机 | 显示全部楼层
jinxinhao 发表于 2022-08-01 14:02
第一:遇到这种情况,先把namelist的debuglevel调成最高=500,重新运行,会在日志中看到中断时的报错信息;
第二:如果最高等级的bebug输出都没有任何报错信息显示的话,可能是时间步长设置太大,试试减少步长;
第三:如果前两个都不行,再试试时候内存不足,试试增加运行核数

谢谢大佬的答疑,困扰许久,感谢!
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

发表于 2023-10-23 18:04:39 | 显示全部楼层
楼主最后解决了吗,我也遇到这个问题了
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表