您的位置:   网站首页    行业动态    案例精选丨奥工科技助力东南大学高性能云计算平台升级

案例精选丨奥工科技助力东南大学高性能云计算平台升级

阅读量:3722736 2019-10-23



东南大学(Southeast University)简称“东大”,是中华人民共和国教育部直属、中央直管副部级建制的全国重点大学,建筑老八校及原四大工学院之一,国家首批双一流(A类)、211工程、985工程重点建设高校。


项目背景
2002年,东南大学作为中国大陆第一所参与AMS项目的高校与丁肇中教授合作,包括参与AMS探测器的合作研制和建立东南大学AMS-02数据处理和分析中心(AMS-SOC)。
(丁肇中教授和东南大学AMS实验数据处理中心部分参与者合影)
AMS(Alpha Magnetic Spectrometer,阿尔法磁谱仪)是由著名物理学家、诺贝尔物理学奖获得者丁肇中教授领导的一个大型空间物理实验,也是国际空间站上惟一的大型物理实验仪器。AMS实验是人类第一次在太空中精密地测量高能量带电原子和粒子的实验,其目的是为了寻找由反物质所组成的宇宙和暗物质的来源以及测量宇宙线的来源。

根据AMS数据处理需求,东南大学于2011年建成了拥有4500核(峰值计算能力达60万亿次)和880TB存储的高性能云计算平台,配备1Gbps的专用网络链路和56Gbps的计算存储网络。
(东南大学AMS数据处理与分析平台)
业务挑战
东南大学建成的高性能云计算平台,已成为AMS-02实验在亚洲乃至世界最主要的数据中心。随着近几年历史数据的沉淀和计算量的急剧增长,现有的资源在硬件规模及性能、软件配置等方面均存在明显的限制。加上东南大学双一流建设进程的快速推进,各学院不同类型、不同方向的教学科研需求逐渐增加,这些都对高性能云计算平台的建设提出了新的挑战。为此学校于2017年11月正式成立东南大学大数据中心,专门从事高性能云计算平台的建设、维护,并基于此开展云计算、大数据、及人工智能相关领域的科学研究、人才培养及社会服务工作。
其中,如何完善大数据中心的高性能云计算平台架构,更好地支撑AMS实验数据处理和满足学校教学科研要求,成了学校最关注的问题。
目前,东南大学高性能云计算平台面临的主要问题如下:
●  无法满足随着教育本身增长的教学科研资源需求
●  IT运维管理成本高,运维复杂且效率低   
● 资源利用率低,服务器资源不能被合理、有效的利用,造成了极大的资源浪费
● 安全机制不足,安全运维保障能力不足,运维保障体系不健全   

解决方案
针对学校信息化的限制性问题,为实现学校IT资源的有效整合、统筹规划, 奥工科技为东南大学定制了一套HPC结合OpenStack的架构,采用统一存储并兼顾高性能与科研学术的整体建设方案,对东南大学大数据中心的高性能云计算平台进行了升级。本次部署使得平台对外提供高性能及云资源高达2000+核心,运营效率大幅度提升。
奥工科技为平台部署了71台ProLiant BL460c Gen9两路服务器,每台配置2颗Intel Xeon E5-2680v4处理器,主频2.4GHz,14个CPU物理核心,28个线程,内存配置128GB 2400MHz 容错内存,配置两块600GB本地硬盘。本次项目建设采用了Apollo 4500 Gen9高性能计算专用存储阵列,以确保高性能计算集群的数据能快速地读写,也确保整个平台数据的安全性。存储阵列包含135块近线SAS硬盘,总容量118TB。

本次部署在安全机制上增加了用户管理,通过ldap统一用户认证软件实现了HPC+OpenStack用户的统一纳管,通过单独的作业提交节点隐藏了内部集群网络,并通过跳板机的形式,最大限度保障了内网平台的正常工作。
用户价值
高性能集群建设满足了差异化系统平台对不同类型应用快速响应的需求,并赋予了整套集群弹性伸缩的能力,让高性能拥有云一样的扩展能力。
目前,东南大学大数据中心的高性能云计算平台已经完成了基于虚拟化的HPC性能测试,测试结果表明:架构已能够有效解决虚拟化导致的网络延迟问题(IB虚拟化技术),云上高性能计算平台效率达到90%以上,使得HPC over Cloud变为可行。

“ “我校对高性能云计算平台一直非常重视,奥工科技在HPC全栈云服务领域有着丰富的实践经验。这次的全面升级,使得我们的云上高性能平台突破原来的限制,效率得到了提升,稳定性得到了增强。未来,我们会继续深化和奥工的伙伴关系,以教育信息化支撑教育和教育管理,从而加快推进教育现代化目标实现和人力资源强国建设。”
   ——东南大学大数据中心办公室

-END-

在线QQ咨询,点这里

QQ咨询

微信服务号