方案架构
为满足各类CAD/CAE应用对高性能计算的需求,曙光推荐采用如下解决方案。
设计系统:设计系统同时满足设计/仿真用户设计和前后处理的需求。曙光提供的设计系统方案可以提供单计算核心性能高、每核心内存容量大、内存性能好,满足三维可视化要求、本地IO性能高的曙光专用图形服务器,进而满足多用户远程前后处理和设计迫切需求。且图形服务器可以远程集中部署,统一管理、服务多样、并保障数据安全。
仿真系统:满足计算流体力学类应用软件并行扩展性好的特点,提供曙光旗舰类TC4600E 刀片产品提高计算密度、强化计算效率,满足亿级网格以上算例并行计算需求。对于跨节点并行扩展性弱、内存容量/性能需求高的电磁仿真、结构分析(隐式求解)类的仿真应用软件,提供曙光TC6600 4路刀片服务器、I840 四路服务器、I980八路服务器等多种产品,灵活组合,满足多样化的应用需求。此外还可为支持GPU加速的应用软件提供X580/745/780/785/795/等多种GPU服务器产品。根据用户应用特点、算例规模制定个性化的仿真方案。仿真系统可与设计系统无缝集成,形成一体化成熟的解决方案。
存储系统:多数CAE仿真软件并行扩展性好,算例数据量大,为了应对高通量计算产生的数据,曙光高性能集群配置了Parastor分布式并行存储系统。Parastor支持数据,在线扩容,存储容量和聚合带宽同步提升,满足了高通量计算对存储系统的需求。
网络系统:曙光为高性能集群配备了高带宽低延迟的Infiniband或Omni-Path等高速网络,满足了应用软件中各类MPI程序数据交换需求,提高了多节点并行效率,加快了模拟计算过程。
软件系统:曙光Gridview集群管理和作业调度系统,提供满足制造行业要求的工业仿真云版本,实现设计、仿真平台的统一门户,一体化管理,监控管理和作业调度,以及符合用户使用习惯的常用主流商用CAE软件的图形Portal,并支持Portal定制开发, 同时提供HPC基础运行环境。
运维服务:曙光EasyOP在线运维为高性能集群7*24小时在线运维服务,保障了集群良好的运行状态,将科研人员从繁琐的集群管理工作中解放出来,投入更多的时间到实际的科研过程中。