爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 9266|回复: 15

【已解决】服务器上运行WRF并行的问题

[复制链接]

新浪微博达人勋

发表于 2016-10-19 21:33:03 | 显示全部楼层 |阅读模式
数值模式
使用语言: Linux
我看过提问的智慧: 看过
自己思考时长(天): 10
问题概况: wrf3.8正确安装,用qsub提交任务,但无法并行。
问题截图: -
系统平台: CentOS

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
本帖最后由 Quincy 于 2016-11-28 22:34 编辑

直接用mpirun提交:
2016-10-19_211940.jpg

qsub查询节点状态:
2016-10-19_204836.jpg

求指教,谢谢!

问题出现的原因是ib驱动有问题,联系了服务器工程师和管理员解决的,目前运行正常~
因为服务器是组里新买的,所以很多东西都要自己装~小白一枚,在这一过程中学到了很多~感谢大家的热心回复。

贴上自己提交作业的脚本和网上整理的qsub的用法~
#! /bin/bash
#PBS -q batch
#PBS -N mytestcase
#PBS -o /home/Quincy/qxwork/Mywork/wrf/mytestcase.out
#PBS -e /home/Quincy/qxwork/Mywork/wrf/mytestcase.err
#PBS -l nodes=4:ppn=8
#PBS -l walltime=1000:00:00

nodecpu=`cat /proc/cpuinfo|grep processor|wc -l`
id=`echo $PBS_JOBID | awk -F. '{print $1}'`
NP=`cat $PBS_NODEFILE|wc -l`
echo "The Jobbed is $id"
echo "Worker dir is $PBS_O_WORKDIR"
cat $PBS_NODEFILE
echo "begin time is `date`"
cd  $PBS_O_WORKDIR
#mpirun -np $NP -hostfile $PBS_NODEFILE  /home/Quincy/usr/wrftry/Build_WRF/WRFV3/run/wrf.exe
mpirun -np $NP -machinefile $PBS_NODEFILE  /home/Quincy/usr/wrftry/Build_WRF/WRFV3/run/wrf.exe
echo "End time is `date`"



qbs命令.docx

22.98 KB, 下载次数: 17

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-19 21:42:15 | 显示全部楼层
unlimited 试试
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-19 21:49:39 | 显示全部楼层
从图1看,你是直接在前台运行的,qsub作业管理系统应该都是一样的,我们这边提交作业是qsub script.sh,查询作业是使用 qstat -u username。不知你们的是什么情况,如果有提供使用手册的话,建议先阅读一下手册。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2016-10-19 21:54:34 | 显示全部楼层

2016-10-19_215205.jpg

您好~这是用ulimit -a 查询的结果,请问该将什么改为unlimited呢?
刚接触linux系统不久~对并行这一块不太熟悉,谢谢你~!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2016-10-19 22:01:03 | 显示全部楼层
Lighting 发表于 2016-10-19 21:49
从图1看,你是直接在前台运行的,qsub作业管理系统应该都是一样的,我们这边提交作业是qsub script.sh,查 ...

你好~是的,我是直接在前台运行的mpirun。qsub也用了,下面是qstat的结果:
111.jpg

那个表示任务状态的一栏显示的是“C”,不知道是什么意思。。。

谢谢回答~!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-19 22:09:00 | 显示全部楼层
状态栏是R才表示运行,S表示睡眠,Q表示等待,H表示挂起,C不知道是不是表示crash。能否把作业脚本贴出来看看?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-19 22:23:16 | 显示全部楼层
Quincy 发表于 2016-10-19 21:54
您好~这是用ulimit -a 查询的结果,请问该将什么改为unlimited呢?
刚接触linux系统不久~对并行这一 ...

ulimit -s unlimited
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-19 23:46:27 | 显示全部楼层
这个问题看到别人遇到过,可以百度Google一下,mpich的问题感觉不是很好搞
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-19 23:48:50 | 显示全部楼层
好像是什么内存权限之类的问题吧,有点忘记了,可以Google到mpich的论坛的,那里应该有
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2016-10-24 17:41:41 | 显示全部楼层
c应该是cancel的意思。你这个显然是内存不够。积分步长缩缩缩,模拟范围缩缩缩。
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表