技术参数 | 2U机架式服务器,带原装滑轨;配置2颗32核处理器;配置512GB ECC内存;2个1Gb Base-T以太网电口,2个万兆光口;面板交互式液晶屏;PREC H755 RAID卡:可以支持做多个RAID组;2块* 960G/SATA-3/2.5寸/企业级 SSD;12块*16T SAS 7200转;配置远程管理卡,具有单独的管理网口,不依赖主机操作系统进行远程操作,支持视频重定向,服务器复位、重新启动、开机/关机,远程虚拟介质;1200瓦电源冗余电源;HPC资源管理软件及部署服务;软件架构:管理软件基于B/S架构。能使用主流浏览器进行管理。提供针对本次项目的授权及服务承诺函;合同签订前需提供相同配置测试机;必须原厂工程师上门安装调试,本次采购设备由厂商直接发货至武汉大学,为保证货物的原装性,所有配置必须是原厂整机出厂,保证完整包装不开封,包装箱上注明采购用户名称:武汉大学,交货期:中标公示结束后3日内。所有部件原厂3年质保,3年硬盘不返还服务。
本项目属于“交钥匙”项目,需要投标方提供满足本次设备采购的硬件集成、HPC资源管理软件实施交付工作,并且配合客户安装部署应用软件,提供不少于3年的技术支持服务。
HPC资源管理软件及部署服务:
任务调度及WEB作业提交门户:
1.底层采用Slurm调度,支持Slurm资源组管理
2.提供WEB门户,要求提供基于WEB界面的:调度系统设置、队列设置、权限设置、作业提交、报表功能。
3.支持常用高性能计算软件的应用模板,支持用户通过界面
4.自定义应用模板,可拖拽式编辑。
5.支持WEB界面的作业查询、删除、挂起和释放等操作,可以根据作业ID, 作业名, 用户名, 状态, 和队列排序。
6.支持任务配额管理:可为用户/组配置最大作业数、最大处理器数、内存和硬盘等限制。
7.WEB界面提供作业日志实时输出功能,支持历史作业查询功能
8.支持Web界面实时交互式作业
9.支持GPU调度,支持为计算任务分配GPU资源,包括GPU卡资源集中管理,统一分配,GPU卡多用户共享,GPU任务排队调度等功能;
10.支持GPU管理,支持GPU资源情况监控,可以显示GPU资源总量/使用量,GPU核心平均利用率,GPU显存平均利用率;支持GPU服务器性能数据监控,可显示GPU卡的时钟信息、PCIE信息、温度曲线、利用率曲线等性能信息;
11.支持容器和虚拟化技术,应用环境无缝与HPC系统相结合,可以打包整个科学计算所需的工作流程,软件和库甚至数据。
12.支持GPU透传到容器
13.支持在容器中部署Hadoop、Spark、TensorFlow等大数据和人工智能应用环境。
14.支持多种作业提交方式:支持命令行、WEB界面、应用软件集成界面、作业脚本和可执行文件等。
15.支持软件商业软件License管理。
|