📋 快速导航

🖥️ 服务器使用手册

全面的服务器配置指南、使用技巧和最佳实践,助您高效进行科学计算

📋 快速导航

🖥️ 服务器配置规格

我们提供多种配置的高性能计算服务器,以满足不同规模的科学计算需求。

🚀 GPU加速型
  • CPUIntel E5 2697 V4
  • GPU4×NVIDIA V100 16GB
  • 内存128GB DDR4-2400
  • 存储100T
  • 网络InfiniBand HDR
⚡ CPU密集型
  • CPU2×Intel 8259CL
  • 核心数48核心/96线程
  • 内存192G DDR4-2666
  • 存储100T
  • 网络InfiniBand HDR
💾 大内存型
  • CPUAMD EPYC 7742X2
  • 核心数128核心/256线程
  • 内存256G DDR4-2666
  • 存储100T
  • 网络InfiniBand HDR
🌐 集群节点
  • 节点数56个计算节点
  • 总核心1800+ CPU核心
  • 总内存100TB+ 系统内存
  • 互联网络InfiniBand HDR
  • 存储100TB+ 共享存储
99.9%
系统可用性
300+
并发用户
12/7
技术支持
100TB
存储容量

⚙️ 系统环境配置

🐧 操作系统
  • 发行版CentOS 8 / Ubuntu 22.04
  • 内核版本Linux 5.4+
  • 容器Docker / Singularity
  • 调度器SLURM 21.08
🔧 编译器套件
  • GCC11.2.0
  • Intel OneAPI2022.1
  • CUDA11.7
  • OpenMPI4.1.1
📚 数学库
  • Intel MKL2022.1
  • FFTW3.3.10
  • ScaLAPACK2.2.0
  • cuBLAS11.7
🧪 科学软件
  • VASP6.4.1 (GPU版本和CPU)
  • Quantum ESPRESSO7.1
  • LAMMPS2024.06.23
  • Python3.9 + 科学计算包

🔗 服务器连接指南

获取账号信息

联系客服获取您的专属账号信息,包括用户名、初始密码和服务器IP地址。

账号格式:用户名通常为您的姓名拼音或指定的用户ID,密码需要在首次登录后修改。

SSH客户端配置

推荐使用以下SSH客户端连接服务器:

  • Windows:PuTTY、MobaXterm、Windows Terminal
  • macOS/Linux:Terminal内置ssh命令
  • 图形界面:VS Code Remote SSH插件

建立SSH连接

使用以下命令连接到服务器:

# 基本连接命令 ssh username@server-ip # 指定端口连接 ssh -p 22 username@server-ip # 使用密钥认证 ssh -i ~/.ssh/private_key username@server-ip

密钥认证设置(推荐)

为了提高安全性,建议使用SSH密钥认证:

# 生成SSH密钥对 ssh-keygen -t rsa -b 4096 -C "your_email@example.com" # 上传公钥到服务器 ssh-copy-id username@server-ip # 或手动添加公钥 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
安全提醒:首次登录后请立即修改密码,并启用密钥认证。避免使用弱密码,定期更新认证信息。

📊 SLURM作业管理系统

我们使用SLURM (Simple Linux Utility for Resource Management) 作为作业调度系统,提供高效的资源管理和作业调度。

查看系统状态

# 查看所有节点状态 sinfo # 查看队列信息 squeue # 查看我的作业 squeue -u $USER # 查看节点详细信息 scontrol show nodes

提交作业

创建SLURM作业脚本提交计算任务:

#!/bin/bash #SBATCH --job-name=vasp_calc #SBATCH --nodes=1 #SBATCH --ntasks-per-node=32 #SBATCH --time=24:00:00 #SBATCH --partition=compute #SBATCH --output=vasp_%j.out #SBATCH --error=vasp_%j.err # 加载必要的模块 module load intel/2022.1 module load vasp/6.3.2 # 运行VASP计算 mpirun -np 32 vasp_std
# 提交作业 sbatch job_script.sh

作业管理命令

# 取消作业 scancel JOB_ID # 查看作业详情 scontrol show job JOB_ID # 查看作业资源使用 sacct -j JOB_ID --format=JobID,JobName,Partition,Account,AllocCPUS,State,ExitCode # 交互式作业 srun --pty -n 1 -t 2:00:00 /bin/bash
作业优先级:系统根据用户历史使用情况、作业大小和等待时间动态调整作业优先级,确保资源公平分配。

🧪 VASP计算软件使用指南

环境配置

# 加载VASP模块 module load intel/2022.1 module load vasp/6.3.2 # 检查可用的VASP版本 module avail vasp # 查看已加载模块 module list

准备输入文件

VASP计算需要以下四个基本输入文件:

  • POSCAR:原子位置和晶格参数
  • POTCAR:赝势文件
  • INCAR:计算参数设置
  • KPOINTS:k点网格设置

典型INCAR参数设置

# 基本DFT计算 SYSTEM = Si bulk calculation ISTART = 0 ICHARG = 2 ENCUT = 520 EDIFF = 1E-6 EDIFFG = -0.01 NSW = 100 IBRION = 2 ISIF = 3 ISMEAR = 0 SIGMA = 0.05

GPU加速设置

对于GPU节点,可以使用GPU加速版本的VASP:

# 加载GPU版本VASP module load cuda/11.7 module load vasp-gpu/6.3.2 # SLURM脚本GPU设置 #SBATCH --gres=gpu:4 #SBATCH --partition=gpu # 运行GPU版本 mpirun -np 4 vasp_gpu
💡 性能提示
  • 合理设置NCORE参数以优化并行效率
  • 大体系计算建议使用GPU加速
  • 调整KPAR参数进行k点并行
  • 使用LREAL=Auto加速大体系计算
📁 文件管理
  • 定期备份重要计算结果
  • 使用合理的目录结构组织文件
  • 清理临时文件释放存储空间
  • 压缩大文件以节省空间

性能优化建议

🚀 计算优化
  • 并行策略:合理设置MPI进程数和OpenMP线程数
  • 内存使用:避免内存溢出,优化内存分配
  • I/O优化:减少频繁的文件读写操作
  • 编译优化:使用优化编译选项
📊 监控工具
  • htop:实时系统资源监控
  • nvidia-smi:GPU使用状态监控
  • iostat:磁盘I/O性能监控
  • sacct:作业资源使用统计
⚙️ 系统调优
  • CPU亲和性:绑定进程到特定CPU核心
  • 网络优化:调整网络参数提升通信效率
  • 文件系统:选择合适的文件系统类型
  • 缓存策略:优化系统缓存配置
🎯 最佳实践
  • 基准测试:运行标准测试评估性能
  • 参数调优:系统性测试不同参数组合
  • 负载均衡:合理分配计算任务
  • 定期维护:保持系统最佳运行状态
性能评估:建议用户在正式计算前进行小规模测试,评估不同参数设置的性能表现,选择最优配置。

🔧 常见问题与故障排除

❓ 无法连接到服务器
可能原因:
  • 网络连接问题
  • 服务器维护中
  • 防火墙阻止连接
  • 账号信息错误
解决方法:
  1. 检查网络连接状态
  2. 验证服务器IP和端口
  3. 确认用户名和密码
  4. 联系技术支持确认服务器状态
❓ 作业一直处于等待状态
可能原因:
  • 资源需求超过可用资源
  • 队列中有优先级更高的作业
  • 作业脚本存在错误
  • 账户资源配额不足
解决方法:
# 查看作业状态和原因 squeue -j JOB_ID -o "%.18i %.9P %.8j %.8u %.2t %.10M %.6D %R" # 查看详细作业信息 scontrol show job JOB_ID
❓ VASP计算出现错误
常见错误类型:
  • 内存不足:减少并行进程数或增加内存申请
  • 收敛困难:调整电子步收敛参数
  • k点错误:检查KPOINTS文件格式
  • 赝势问题:确认POTCAR文件完整性
调试方法:
# 检查输出文件 tail -50 OUTCAR # 查看错误信息 grep "ERROR" OUTCAR # 监控计算进度 grep "LOOP+" OUTCAR
❓ 磁盘空间不足
解决步骤:
  1. 清理临时文件和缓存
  2. 压缩不常用的数据文件
  3. 删除重复或无用文件
  4. 申请额外存储空间
# 查看磁盘使用情况 df -h # 查看目录大小 du -sh * # 清理临时文件 find . -name "*.tmp" -delete

💬 技术支持服务

我们提供全天候专业技术支持,确保您的科学计算工作顺利进行。

📞
电话支持
400-888-9999
工作日 9:00-18:00
紧急故障 24/7 支持
✉️
邮件支持
support@yuansuan.tech
技术问题详细描述
24小时内响应
💬
在线客服
企业QQ: 800-888-9999
微信群: YuanSuan_HPC
实时技术咨询
🎯
远程协助
专家远程调试
性能优化指导
计算方案定制

支持等级说明

  • L1基础支持:连接问题、密码重置、基本使用指导
  • L2技术支持:软件配置、作业调试、性能分析
  • L3专家支持:复杂问题诊断、定制化解决方案

联系前准备

  • 准备详细的问题描述
  • 提供相关的错误信息和日志
  • 说明使用的软件版本和配置
  • 描述已尝试的解决方法
服务承诺:我们承诺为每位客户提供专业、及时的技术支持,确保您的科学研究工作不受技术问题影响。