- 积分
- 13674
- 贡献
-
- 精华
- 在线时间
- 小时
- 注册时间
- 2011-9-8
- 最后登录
- 1970-1-1
|
GrADS
系统平台: |
NUIST大型机 |
问题截图: |
|
问题概况: |
成功提交cesm模式(版本1.0.4)case并运行结束,发现运行失败。
检查ccsm.log文件,其结尾出现:mpirun has exited due to process rank 4 with PID 29758 on node c17n05 exiting |
我看过提问的智慧: |
看过 |
自己思考时长(天): |
5 |
登录后查看更多精彩内容~
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 leeol 于 2016-5-7 23:22 编辑
CESM任务提交后运行失败,log文件显示mpirun has exited due to process rank 4错误
请教诸位一个问题,成功提交cesm模式(版本1.0.4)case并运行结束,发现运行失败。
检查ccsm.log文件,其结尾出现:mpirun has exited due to process rank 4 with PID 29758 on node c17n05 exiting improperly.
最初我怀疑是任务并行运算的错误,于是我修改env_mach_pes.xml中的cpu设置,最大设置为12(我使用的大型机一个节点12个核)
可是,无论我在run文件中设置使用2个节点(每个12个核心)或3个节点,还是仅仅用1个节点(每个12个核心),都是出现如图上的错误
请教诸位模式大神,这个问题如何解决?
|
|