爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 14314|回复: 14

关于metgrid和real的并行问题

[复制链接]

新浪微博达人勋

发表于 2015-5-15 11:41:09 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
正在试验一个时间段很长的WRF模拟,两层嵌套,于是考虑到在geogrid metgrid real过程中并行计算,且所用cpu个数都为24,其中geogrid和metgrid都运行成功,并已连接met_em_d*到run目录下,但是到real.exe过程的时候,总会报错如下:
***************************************************
FATAL CALLED FROM FILE:  <stdin>  LINE:     404
error opening met_em.d01.2010-05-01_00:00:00.nc for input; bad date in namelist or file not in directory
***************************************************
查询了相关解决方案,有说是ln的问题,cp就能解决,但没成功;有说是namelist时间设置问题,但反复看了发现没有错误。namelist.input如下:
***************************************************
&time_control
run_days                            = 91,
run_hours                           = 18,
run_minutes                         = 0,
run_seconds                         = 0,
start_year                          = 2010, 2010, 2000,
start_month                         = 05,   05,   01,
start_day                           = 01,   01,   24,
start_hour                          = 00,   00,   12,
start_minute                        = 00,   00,   00,
start_second                        = 00,   00,   00,
end_year                            = 2010, 2010, 2000,
end_month                           = 07,   07,   01,
end_day                             = 31,   31,   25,
end_hour                            = 18,   18,   12,
end_minute                          = 00,   00,   00,
end_second                          = 00,   00,   00,
interval_seconds                    = 21600,
input_from_file                     = .true.,.true.,.true.,
history_interval                    = 60,  60,   60,
frames_per_outfile                  = 1,    1, 1000,
restart                             = .false.,
restart_interval                    = 10000,
io_form_history                     = 102,
io_form_restart                     = 102,
io_form_input                       = 102,
io_form_boundary                    = 102,
debug_level                         = 0,
************************************************
个人估计的原因在于metgrid用并行后生成的文件在.nc后还有一个cpu的编号,如met_em.d01.2010-05-01_00:00:00.nc_0000,会不会是因为有了最后的编号导致real找不到报错中的nc文件。如果是这原因,那么应该怎么修改呢?如果不是,麻烦各位帮我想想办法~


密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-5-15 13:02:03 | 显示全部楼层
我并行的时候没发现met文件有后面的那一串啊~~~
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-5-15 13:31:49 | 显示全部楼层
本帖最后由 Mid_Farmer 于 2015-5-15 13:32 编辑

不好意思 刚刚没有点“回复” 所以把内容删了。。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-5-15 13:32:21 | 显示全部楼层
andrewsoong 发表于 2015-5-15 13:02
我并行的时候没发现met文件有后面的那一串啊~~~

哈哈 终于有人回复啦 太感谢你了
我先是mpirun -np 24 ./geogrid.exe
生成了geo_em.d01.nc_0000到geo_em.d01.nc_0023以及d02共48个文件
然后ungrib.exe
再mpirun -np 24 ./metgrid.exe
生成了2010-05-01_00:00:00.nc_0000到0023等很多按日期和cpu编号排序的文件
但是在mpirun -np 24 ./real.exe的时候
就提示找不到这样的nc的文件,是不是因为多了后面的cpu编号哇?你怎么后面会没有出现编号呢,照理说同样一个时次的文件交给了多核去处理,应该会生成各个核处理出来的结果呀?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-5-15 13:44:12 | 显示全部楼层
Mid_Farmer 发表于 2015-5-15 13:32
哈哈 终于有人回复啦 太感谢你了
我先是mpirun -np 24 ./geogrid.exe
生成了geo_em.d01.nc_0000到geo_e ...

./geogrid.exe这一步我并没有并行,只有met那一步并行了,并行也不能产生序号那么多啊。。。。。。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-5-15 14:05:19 | 显示全部楼层
andrewsoong 发表于 2015-5-15 13:44
./geogrid.exe这一步我并没有并行,只有met那一步并行了,并行也不能产生序号那么多啊。。。。。。

你这么一说我还真觉得是不应该产生后面的编号呢 以前只在wrf.exe过程用mpirun 结果也不会出现后面的编号
但是你geogrid不并行,metgrid并行怎么会不报错呢,手册上不是说geogrid metgrid real三者如果要并行就必须用一样的cpu数么 我刚刚试了下geogrid单核 metgrid并行 会报错如下:
************************
ERROR: Couldn't open file ./geo_em.d01.nc_0014 for input.
ERROR: Couldn't open file ./geo_em.d01.nc_0003 for input.      (等等好几行cpu编号0001——00023)
************************
肿么解决哇?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-5-15 15:50:21 | 显示全部楼层
Mid_Farmer 发表于 2015-5-15 14:05
你这么一说我还真觉得是不应该产生后面的编号呢 以前只在wrf.exe过程用mpirun 结果也不会出现后面的编号
...

说实话我从没见过并行会产生那么多不该有的,在我这里,不管是不是并行,都只会产生一个geo_em.d01.nc和一个geo_em.d02.nc。你产生那么多是什么意思!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-5-15 17:44:43 | 显示全部楼层
andrewsoong 发表于 2015-5-15 15:50
说实话我从没见过并行会产生那么多不该有的,在我这里,不管是不是并行,都只会产生一个geo_em.d01.nc和 ...

是呢 你说得有道理 不管并行不并行 是应该只产生一个该时次的对应文件 我再看看到底哪儿有问题哈 谢谢你啦~
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-5-15 17:57:55 | 显示全部楼层
Mid_Farmer 发表于 2015-5-15 17:44
是呢 你说得有道理 不管并行不并行 是应该只产生一个该时次的对应文件 我再看看到底哪儿有问题哈 谢谢你 ...

你看看你的版本的WPS是不是有bug修复。或者你的并行有问题。我用的是MPICH。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2017-2-8 12:11:29 | 显示全部楼层
我现在运行模式也出现这个问题了,请问楼主这个问题后来怎么解决的?谢谢~!
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表