爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 8716|回复: 19

在大型机提交了作业,但始终不开始计算是什么原因啊?

[复制链接]

新浪微博达人勋

发表于 2017-1-21 18:24:49 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
  如题,我好久之前就在大型机上提交了一个转WRF的作业,但是至少有半个月过去了,我的任务也没有开始运算。尝试了不同的节点数和核数,也尝试了不同的队列,不知道问题出在哪里,有没有大神可以指点一下呢?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2017-1-22 16:28:18 | 显示全部楼层
这是我的namelist.input

&time_control
run_days                            = 0,
run_hours                           = 42,
run_minutes                         = 0,
run_seconds                         = 0,
start_year                          = 2013, 2013, 2013, 2013,
start_month                         = 05,   05,   05,  05,
start_day                           = 30,   30,   30,  30,
start_hour                          = 00,   00,   00,  00,
start_minute                        = 00,   00,   00,  00,
start_second                        = 00,   00,   00,  00,
end_year                            = 2013, 2013, 2013, 2013,
end_month                           = 05,   05,   05,   05,
end_day                             = 31,   31,   31,   31,
end_hour                            = 18,   18,   18,   18,
end_minute                          = 00,   00,   00,   00,
end_second                          = 00,   00,   00,   00,
interval_seconds                    = 21600
input_from_file                     = .true.,.true.,.true.,.true.,
history_interval                    = 1440, 720, 720, 60,
frames_per_outfile                  = 1000, 1000, 1000,1000,
restart                             = .false.,
restart_interval                    = 3000,
io_form_history                     = 2
io_form_restart                     = 2
io_form_input                       = 2
io_form_boundary                    = 2
debug_level                         = 0
/

&domains
eta_levels                           = 1.00, 0.9975, 0.995, 0.99, 0.985,
                                       0.98, 0.975,  0.97,  0.96, 0.95,
                                       0.94, 0.93,   0.92,  0.91, 0.90,
                                       0.89, 0.88,   0.86,  0.84, 0.82,
                                       0.80, 0.78,   0.76,  0.72, 0.68,
                                       0.64, 0.60,   0.55,  0.50, 0.45,
                                       0.40, 0.35,   0.30,  0.20, 0.10, 0.00,
time_step                           = 81,
time_step_fract_num                 = 0,
time_step_fract_den                 = 1,
max_dom                             = 4,
e_we                                = 200,   208,   238,  376,
e_sn                                = 200,   202,   226,  373,
e_vert                              = 36,    36,    36,   36,
p_top_requested                     = 10000,
num_metgrid_levels                  = 27,
num_metgrid_soil_levels             = 4,
dx                                  = 27000, 9000,  3000,  1000,
dy                                  = 27000, 9000,  3000,  1000,
grid_id                             = 1,     2,     3,  4,
parent_id                           = 1,     1,     2,  3,
i_parent_start                      = 1,     65,    66,   60,
j_parent_start                      = 1,     60,    65,   46,
parent_grid_ratio                   = 1,     3,     3,    3,
parent_time_step_ratio              = 1,     3,     3,    3,
feedback                            = 1,
smooth_option                       = 0
/

&physics
mp_physics                          = 2,     2,     2,   2,
ra_lw_physics                       = 1,     1,     1,   1,
ra_sw_physics                       = 1,     1,     1,   1,
radt                                = 27,    9,     3,   1,
sf_sfclay_physics                   = 1,     1,     1,   1,
sf_surface_physics                  = 2,     2,     2,   2,
bl_pbl_physics                      = 8,     8,     8,   8,
bldt                                = 0,     0,     0,   0,
cu_physics                          = 1,     1,     0,   0,
cudt                                = 5,     5,     5,   5,
isfflx                              = 1,
ifsnow                              = 0,
icloud                              = 1,
surface_input_source                = 1,
num_soil_layers                     = 4,
sf_urban_physics                    = 0,     0,     0,   0,
num_land_cat                        = 20,
topo_wind                           = 0,     0,     0,   0,
slope_rad                           = 0,     0,     0,   1,
topo_shading                        = 0,     0,     0,   1,
shadlen                             = 25000,
/

&fdda
/

&dynamics
w_damping                           = 0,
diff_opt                            = 1,      1,      1,    1,
km_opt                              = 4,      4,      4,    4,
diff_6th_opt                        = 0,      0,      0,    0,
diff_6th_factor                     = 0.12,   0.12,   0.12,  0.12,
base_temp                           = 290.
damp_opt                            = 0,
zdamp                               = 5000.,  5000.,  5000., 5000.,
dampcoef                            = 0.2,    0.2,    0.2,   0.2,
khdif                               = 0,      0,      0,     0,
kvdif                               = 0,      0,      0,     0,
non_hydrostatic                     = .true., .true., .true., .true.,
moist_adv_opt                       = 1,      1,      1,     1,
scalar_adv_opt                      = 1,      1,      1,     1,
/

&bdy_control
spec_bdy_width                      = 5,
spec_zone                           = 1,
relax_zone                          = 4,
specified                           = .true., .false.,.false.,.false.,
nested                              = .false., .true., .true.,.true.,
/

&grib2
/

&namelist_quilt
nio_tasks_per_group = 0,
nio_groups = 1,
/

以及提交作业脚本:
#!/bin/bash
#PBS -S /bin/bash
#PBS -N WRF
#PBS -P P002066001
#PBS -q Regular
#PBS -l nodes=12:ppn=10
#PBS -l jobtype=parallel
#PBS -l walltime=12:00:00
cd /nuist/scratch/*****/WRFV3/test/em_real

nprocs=`cat $PBS_NODEFILE | wc -l`

mpirun -np $nprocs  ./wrf.exe


qsub job.sh后会有作业编号,qstat和showq可以查看到自己的作业已提交,但是始终处于排队状态
密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

发表于 2017-1-21 21:34:38 | 显示全部楼层
你这种提问方式,别人很难帮助你的。就比如你问别人,“你认识一个人吗?”
你应该把你在什么样的大型机上,说明具体的操作系统、作业系统以及自己写的作业脚本,最后把自己的问题或者相关的重要出错日志贴上来。这样才方便别人帮助你,也利于你快速解决问题。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-1-22 10:06:07 | 显示全部楼层
提交不了的话,也许是你wrfinput设置有问题,导致提交不了,或者提交了马上就掉了。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-1-22 10:11:53 | 显示全部楼层
elaborate~
密码修改失败请联系微信:mofangbao
回复

使用道具 举报

新浪微博达人勋

 成长值: 0
发表于 2017-1-22 10:42:18 | 显示全部楼层
先测试单机是否能运行,能的话就是提交脚本有问题,不能的话就是namelist有问题,就这么简单
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2017-1-22 14:28:24 | 显示全部楼层
风之精灵 发表于 2017-1-21 21:34
你这种提问方式,别人很难帮助你的。就比如你问别人,“你认识一个人吗?”
你应该把你在什么样的大型机 ...

我也是不知道都需要贴什么样的信息,不好意思,那我贴一下
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2017-1-22 14:29:34 | 显示全部楼层
愛、星晴 发表于 2017-1-22 10:06
提交不了的话,也许是你wrfinput设置有问题,导致提交不了,或者提交了马上就掉了。

可以提交,提交之后会有一个编号,qstat也可以看到,但提交上去之后一起处于排队状态,始终不计算
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2017-1-22 14:30:58 | 显示全部楼层
tbag 发表于 2017-1-22 10:42
先测试单机是否能运行,能的话就是提交脚本有问题,不能的话就是namelist有问题,就这么简单

哈哈哈,单机运行的话怕占用资源太多,会被管理员老师封号啊
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2017-1-22 16:54:43 | 显示全部楼层
这是我之前提交的那个作业之后出现的,类似于log文件之类的东西,里面写着:
ModuleCmd_Switch.c(172):ERROR:152: Module 'intel/11.1.046' is currently not loaded
-bash: /var/spool/PBS/mom_priv/jobs/289657.log05.SC: /bin/bash^M: bad interpreter: No such file or directory
第一行我差不多能看懂,第二行是什么意思呢?
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表