爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 6716|回复: 11

没有任何 原因wrf计算到一半停掉 求解

[复制链接]

新浪微博达人勋

发表于 2015-11-18 10:05:09 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
之前做过wrf,一般的异常都可以自己排除。
现在在天河1号计算机上做wrf模拟台风,移动嵌套网格。
模拟时长4天,总是算到一半断掉。自己写了个脚本,检验任务是否断掉,如果断掉,就tail一下rsl的末尾,然后重新提交任务。发现上两次断掉时,rsl.out和rsl.error的末尾都是:

Timing for main: time 2014-09-22_16:12:30 on domain   2:    1.67014 elapsed seconds
Timing for main: time 2014-09-22_16:13:00 on domain   2:    1.01889 elapsed seconds
Timing for main: time 2014-09-22_16:13:30 on domain   2:    1.02074 elapsed seconds
  2014-09-22_16:13:30 vortex center (in nest x and y):    135.0178       138.030
7
  2014-09-22_16:13:30 grid   center (in nest x and y):    135.5000       135.500
0
  2014-09-22_16:13:30 disp          :  -0.4822235       2.530731
  2014-09-22_16:13:30 move (rel cd) :            0           0
Timing for main: time 2014-09-22_16:13:30 on domain   1:    6.02866 elapsed seconds

之后就什么都没了,很奇怪,天河的作业管理日志中显示:

srun: error: cn3068: task 12: Exited with exit code 174
srun: First task exited 60s ago
srun: tasks 0-7,9-11,13-19: running
srun: tasks 8,12: exited abnormally
srun: Terminating job step 3087145.1
slurmd[cn3067]: *** STEP 3087145.1 KILLED AT 2015-11-18T00:58:50 WITH SIGNAL 9 ***
srun: Job step aborted: Waiting up to 2 seconds for job step to finish.
slurmd[cn3067]: *** STEP 3087145.1 KILLED AT 2015-11-18T00:58:50 WITH SIGNAL 9 ***
srun: error: cn3068: tasks 10-11,13-19: Killed
如果遇到类似问题的朋友 请给出指导~

评分

参与人数 1金钱 +30 收起 理由
andrewsoong + 30 还给你哈

查看全部评分

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-11-18 15:05:36 | 显示全部楼层

回帖奖励 +40 金钱

是不是参数化方案组合的不好呢,我有时候也会遇到,换个方案就好了。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-11-18 15:06:48 | 显示全部楼层
给的太多了奖励,还给你30
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-11-18 16:46:02 | 显示全部楼层
andrewsoong 发表于 2015-11-18 15:06
给的太多了奖励,还给你30

额,参数化方案没有问题的 之前通过的 ,  而且参数化方案不是我的研究内容 我也未做变更。 我觉得是天河系统的问题 好烦
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-11-18 17:29:43 | 显示全部楼层
lmw 发表于 2015-11-18 16:46
额,参数化方案没有问题的 之前通过的 ,  而且参数化方案不是我的研究内容 我也未做变更。 我觉得是天河 ...

这个也有可能,你在本地试试
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-8-1 22:10:51 | 显示全部楼层
,继续努力
密码修改失败请联系微信:mofangbao
回复

使用道具 举报

新浪微博达人勋

发表于 2016-11-28 10:42:55 | 显示全部楼层
不知楼主问题解决没有,我也是偶尔会遇到这种情况,rsl.error和rsl.out中都没有提示的错误信息,但每天运行的绝大多数情况都没有问题
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-1-17 20:03:22 | 显示全部楼层
将时间步长改小些即可
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-1-20 22:05:26 | 显示全部楼层
正在学习,看看有什么借鉴的
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-2-21 14:50:33 | 显示全部楼层
狄振华☆ 发表于 2017-1-17 20:03
将时间步长改小些即可

我也遇到了同样的问题,时间步长从120改成90,问题依然如此,请问还有什么解决办法吗?
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表