爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 6590|回复: 6

cesm1.2.2 在集群上运行速度过慢

[复制链接]
发表于 2016-3-20 21:53:12 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
请问,cesm运行过慢大概是什么问题?

我用的是cesm1.2.2版本,编译器是intel和openmpi,服务器上128个核运行 E1850C5CN 的实验,平均一天只能跑1年左右,跟正常情况比起来差了8倍上下。 找了好久也没找到问题所在,所以不知道版上是否有人知道?

(每个节点16个核,总共128个核,PE layout都是 128x1,0的配置,节点内存64g,2.6GHz频率)

非常感谢!
密码修改失败请联系微信:mofangbao
发表于 2016-3-20 23:13:27 | 显示全部楼层
是不是数据交换遇到瓶颈了?
密码修改失败请联系微信:mofangbao
 楼主| 发表于 2016-3-21 09:27:14 | 显示全部楼层
我觉得应该是这样 因为我看timing里面,cam每天只能运行不到1年,基本上限制了整个模式的速度,我查了路南,cam需要大量数据传输,所以我觉得应该是数据交换的问题,但是我们的平台是支持infiniband的, 我不知道为什么会出现这个问题?
密码修改失败请联系微信:mofangbao
发表于 2016-3-21 09:52:20 | 显示全部楼层
使用的CPU越多,越可能会出现这种情况。建议你减小一半的CPU再试试速度是不是有所改善
密码修改失败请联系微信:mofangbao
 楼主| 发表于 2016-3-21 09:55:11 | 显示全部楼层
请问你的意思是 如果我同时用很多个节点 每个节点只用一部分核吗?这个方法我试过好像没有改善  我比较过别人的结果 在同样的配置下 速度大概是我的8倍左右  我也
密码修改失败请联系微信:mofangbao
发表于 2016-3-21 11:22:01 | 显示全部楼层
来学习一下
密码修改失败请联系微信:mofangbao
发表于 2016-11-16 16:53:24 | 显示全部楼层
Vincent 发表于 2016-3-21 09:27
我觉得应该是这样 因为我看timing里面,cam每天只能运行不到1年,基本上限制了整个模式的速度,我查了路南 ...

楼主 我在天河上运行cesm也遇到了类似的问题,我跑1.9x2.5分辨率的,(每个节点24个核,我用了256个核),我设置NTASKS=128,NTHRDS=2.然后atm_in文件中,npr_yz=32,4,4,32。在提交作业yhbatch之后,它显示分区之后就卡住了,一直不往下写,等了2天也是这样。不知道是什么原因。请问楼主最后解决了么?

密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表