请选择 进入手机版 | 继续访问电脑版
爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 7521|回复: 10

新手求教:运行wrf4版本 不能多节点运行,只能单节点多核运行

[复制链接]

新浪微博达人勋

发表于 2018-9-29 17:41:58 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
如题,用的是曙光集群,不能多节点运行,只能单节点运行,但是用满单节点的所有20多个核,运行时间也太久了。编译的时候configure是选15,dmpar的
可能是什么错误呢
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2018-9-30 08:09:39 | 显示全部楼层
检查一下分块,当分块网格过小的时候mpi会启动失败的,顺便你需要贴一下多结点运行时的rse.error文件
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2018-9-30 09:59:47 | 显示全部楼层
我最近在曙光上运行,也遇到这个问题了。目前测试好像是并行库的问题,后来用了openmpi 3.1.2可以了。编译器是intel的
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2018-9-30 15:12:10 | 显示全部楼层
谢谢楼上两位的回复,两个节点并行的时候,其中一个节点,只显示执行到一半的结果,没有错误信息,另一个显示segmet错误,就是网上说的内存不够的时候出现的错误。所以一直不得其解。
现在我用的是mvapich 来编译,我换用openmpi试一下。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2018-9-30 15:14:48 | 显示全部楼层
werewolf 发表于 2018-9-30 09:59
我最近在曙光上运行,也遇到这个问题了。目前测试好像是并行库的问题,后来用了openmpi 3.1.2可以了。编译 ...

您能详细解释一下吗?我用的也是曙光。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2018-9-30 15:14:52 | 显示全部楼层
werewolf 发表于 2018-9-30 09:59
我最近在曙光上运行,也遇到这个问题了。目前测试好像是并行库的问题,后来用了openmpi 3.1.2可以了。编译 ...

您能详细解释一下吗?我用的也是曙光。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2018-9-30 16:07:44 | 显示全部楼层
我的是啥错误都没有就停止了。你先看一下计算节点堆栈限制是多少,先排除堆栈溢出。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2018-10-5 17:49:35 | 显示全部楼层
我们的工程师说在计算节点上进行计算,是没有堆栈限制的
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2020-3-26 15:09:16 | 显示全部楼层
dellaqin 发表于 2018-10-5 17:49
我们的工程师说在计算节点上进行计算,是没有堆栈限制的

请问楼主解决这个问题了吗? 我这是real.exe可以多节点运行,但wrf.exe却不行,且没有错误提示,并排除了排除堆栈溢出的可能。
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

新浪微博达人勋

发表于 2020-3-27 09:51:30 | 显示全部楼层

请问楼主解决这个问题了吗? 我这是real.exe可以多节点运行,但wrf.exe却不行,且没有错误提示,并排除了排除堆栈溢出的可能。
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表