爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 9032|回复: 6

CMAQ中cctm步骤并行运行出错:NPROCS is not equal to NPCOL*NPROW

[复制链接]

新浪微博达人勋

发表于 2014-5-30 15:01:10 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
在运行CMAQ模型的cctm步骤时,运行脚本中关于单核、多核并行运行的设置主要在如下几行:
1 #> horizontal domain decomposition
2 # setenv NPCOL_NPROW "1 1"; set NPROCS   = 1 # single processor setting
3 setenv NPCOL_NPROW "2 2"; set NPROCS   =  4
4 #> Executable call for multiple PE, set location of MPIRUN script
5  set MPIRUN = /public/home/shangbingnan/sourcecode/mvapich2/bin/mpirun_rsh
6  set TASKMAP = $BASE/machines
7  cat $TASKMAP
8  time $MPIRUN -ssh -np $NPROCS -hostfile $TASKMAP $BASE/$EXEC

单核运行时,只设置第2行,其他行屏蔽,运行正常。
多核并行时,按照如上设置运行出错,主要错误信息是:
    >>--->> WARNING in subroutine HGRD_INIT
     NPROCS is not equal to NPCOL*NPROW
     
     
     >>--->> WARNING in subroutine GRID_INIT
     *** Failure defining horizontal domain
     
     
     >>--->> WARNING in subroutine PAR_INIT
     *** Failure defining domain configuration
Exit code -5 signaled from node29
forrtl: error (69): process interrupted (SIGINT)
Image              PC                Routine            Line        Source            
CCTM_e1a_Linux2_x  0000000000579116  init3_                    254  init3.F
CCTM_e1a_Linux2_x  000000000046E468  Unknown               Unknown  Unknown
CCTM_e1a_Linux2_x  0000000000405509  Unknown               Unknown  Unknown
CCTM_e1a_Linux2_x  0000000000465970  Unknown               Unknown  Unknown
CCTM_e1a_Linux2_x  0000000000452471  Unknown               Unknown  Unknown
CCTM_e1a_Linux2_x  0000000000403A9C  Unknown               Unknown  Unknown
libc.so.6          000000354D01D994  Unknown               Unknown  Unknown
CCTM_e1a_Linux2_x  00000000004039A9  Unknown               Unknown  Unknown


为了测试,将关于核数设置屏蔽掉,重新设置如下,可以正常运行,但都在管理节点上运算,不分配给计算节点,并且虽然是并行了,但是和单核运行时间一样,没差别:
1 #> horizontal domain decomposition
2 # setenv NPCOL_NPROW "1 1"; set NPROCS = 1 # single processor setting
3 #setenv NPCOL_NPROW "2 2"; set NPROCS = 4
4 #> Executable call for multiple PE, set location of MPIRUN script
5 set MPIRUN = /public/home/shangbingnan/sourcecode/mvapich2/bin/mpirun
6 time $MPIRUN -np 10 $BASE/$EXEC

我感觉既然可以用mpirun命令运行程序,说明安装的CMAQ是成功的,可以支持并行,但是设置的NPROCS不能成功传递给子函数,大家有遇到过这种情况的么?是安装的问题还是怎么回事呢? 谢谢您!

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2014-11-21 16:12:58 | 显示全部楼层
我设置并行时也会出问题
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-5-13 17:33:58 | 显示全部楼层
跟你问题一样
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-6-9 09:29:46 | 显示全部楼层
不知道楼主问题解决了没有,我也遇到了这样的问题,能否提供一点帮助?感谢!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-6-9 10:51:05 | 显示全部楼层
leavesxxm 发表于 2015-6-9 09:29
不知道楼主问题解决了没有,我也遇到了这样的问题,能否提供一点帮助?感谢!

没有解决。后来重新安装了5.0版本就好了。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-6-9 10:51:22 | 显示全部楼层
leavesxxm 发表于 2015-6-9 09:29
不知道楼主问题解决了没有,我也遇到了这样的问题,能否提供一点帮助?感谢!

没有解决。后来重新安装了5.0版本就好了。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-6-9 10:51:49 | 显示全部楼层

没有解决。后来重新安装了5.0版本就好了。
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表