爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 6082|回复: 3

[数值模式]CESM任务提交后运行失败,log文件显示mpirun has exited due to process...

[复制链接]
回帖奖励 90 金钱 回复本帖可获得 10 金钱奖励! 每人限 1 次

新浪微博达人勋

发表于 2016-5-7 23:06:25 | 显示全部楼层 |阅读模式
GrADS
系统平台: NUIST大型机
问题截图:
问题概况: 成功提交cesm模式(版本1.0.4)case并运行结束,发现运行失败。
检查ccsm.log文件,其结尾出现:mpirun has exited due to process rank 4 with PID 29758 on node c17n05 exiting
我看过提问的智慧: 看过
自己思考时长(天): 5

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
本帖最后由 leeol 于 2016-5-7 23:22 编辑

CESM任务提交后运行失败,log文件显示mpirun has exited due to process rank 4错误



请教诸位一个问题,成功提交cesm模式(版本1.0.4)case并运行结束,发现运行失败。

检查ccsm.log文件,其结尾出现:mpirun has exited due to process rank 4 with PID 29758 on node c17n05 exiting improperly.

4EHQ4S7H{2DM42@Z8(97~MS.png
最初我怀疑是任务并行运算的错误,于是我修改env_mach_pes.xml中的cpu设置,最大设置为12(我使用的大型机一个节点12个核)

可是,无论我在run文件中设置使用2个节点(每个12个核心)或3个节点,还是仅仅用1个节点(每个12个核心),都是出现如图上的错误

请教诸位模式大神,这个问题如何解决?

密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2016-5-9 00:38:10 | 显示全部楼层
本帖最后由 leeol 于 2016-5-9 00:48 编辑
leeol 发表于 2016-5-9 00:36
问题解决了,是mpi运行环境的问题,之前我用的是openmpi,我修改了env_machopts文件使用了mvapich2,运行 ...

还有我之前env_machopts中关于PATH设置:

setenv PATH ${INTEL}/Compiler/11.1/046/bin:${MPICH_PATH}/bin:${PATH}


修改为了
setenv PATH ${INTEL}/Compiler/11.1/046/bin/intel64:${MPICH_PATH}/bin:${PATH}



密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

发表于 2016-5-7 23:50:42 | 显示全部楼层

回帖奖励 +10 金钱

具体原因我不知道,但是我建议你先运行一个粗分辨率的case试试
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2016-5-9 00:36:36 | 显示全部楼层
本帖最后由 leeol 于 2016-5-9 12:42 编辑
andrewsoong 发表于 2016-5-7 23:50
具体原因我不知道,但是我建议你先运行一个粗分辨率的case试试

问题解决了,是mpi运行环境的问题,之前我用的是openmpi,我修改了env_machopts文件使用了mvapich2,运行就成功了。

还是表示感谢,因为我移植就是参考了你的1.0.3的移植教程,在此敬礼!!!
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表