爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 6962|回复: 7

./real.exe时被killed

[复制链接]
发表于 2022-10-14 15:14:04 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 张一鸣 于 2022-10-14 15:37 编辑

一 、问题描述:
1.WRF三层嵌套,运行real.exe以后,只生成了d01和d02的wrfinput文件,没有生成d03的文件。
2.查看rsl.error文件没有报错信息以后发现real.exe直接断掉的,查看slurm日志显示:
mpirun noticed that process rank 4 with PID 32633 on node n0080 exited on signal 9 (Killed)。
3.尝试了很多办法:检查namelist.input中关于嵌套的参数设置、减少积分步长、增大核数、减少核数、使用unlimited命令等没有解决问题。

二、疑惑:
1.有没有过相似经历的老师,如果有的话能不能指点一下调整思路呢?谢谢

三、附件:

rsl.error报错内容

rsl.error报错内容

密码修改失败请联系微信:mofangbao
 楼主| 发表于 2022-10-15 15:27:25 | 显示全部楼层
本帖最后由 张一鸣 于 2022-10-15 15:53 编辑

后续更新:
1.我单独缩小d03的范围以后就跑出来了d03wrfinput,因此可能是设置的分辨率高+范围大导致的。
2.所以可以确定是内存溢出的问题了。

密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

 成长值: 0
发表于 2022-10-14 19:23:07 | 显示全部楼层

回帖奖励 +25 金钱

内存充足吗 增加一个节点试试?
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-10-14 20:24:14 | 显示全部楼层
kermit 发表于 2022-10-14 19:23
内存充足吗 增加一个节点试试?

谢谢大佬的建议。
我已经试过用6个节点96核都没跑出d03的wrfinput,大佬您还有别的想法吗?
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

发表于 2022-10-15 05:36:08 | 显示全部楼层

回帖奖励 +25 金钱

加一下debug level看一下
然后d02的input文件是否创建完毕,也就是rsl中是否有d02 complete之类的,如果有,那问题就是d03的事儿。不行的话把max_dom改成2,看是否能完全跑完。

我看了一下上面,你这个范围很大很大啊,96核基本不够啊,内存是否充足呢??
你的d01都接近3000x2000了。我记得wrf网上有个脚本能根据你的namelist去计算需要的核数,也许你需要计算一下。
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-10-15 10:41:01 | 显示全部楼层
tbag 发表于 2022-10-15 05:36
加一下debug level看一下
然后d02的input文件是否创建完毕,也就是rsl中是否有d02 complete之类的,如果有 ...

谢谢大佬回复
1.我把debug level 开到过1000,但是生成的rsl里面也没warning。
2.开三层嵌套时rsl中没有complete,但是如果去掉最内层再real一下rsl中就显示了d01 2006-08-01_01:00:00 real_em: SUCCESS COMPLETE REAL_EM INIT
3.目前在网上搜到对于这个问题的处理办法呈现两极分化,有的帖子是核数减半(wrf forum上有个一样报错的解决办法是72核减到36核)跑出来了,有的呢是增加核数。我最高开过6个节点96核来跑,但是没跑出来,也用过一个节点4核来跑,同样没跑出d03的wrfinput。所以对此很迷惑
谢谢大佬指点方向,我接下来对内存不足方向进行寻找解决方法,最后感谢您解答,谢谢
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

发表于 2023-4-19 19:34:35 | 显示全部楼层
张一鸣 发表于 2022-10-15 10:41
谢谢大佬回复
1.我把debug level 开到过1000,但是生成的rsl里面也没warning。
2.开三层嵌套时rsl中没 ...

你好,请问你对这个问题是怎么看的?我目前也遇到了这个问题。
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-4-21 08:38:43 | 显示全部楼层
klingel 发表于 2023-4-19 19:34
你好,请问你对这个问题是怎么看的?我目前也遇到了这个问题。

导致问题的原因我忘了,大概率就是计算量过大,还有分辨率过高导致的
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表