MUNGE

在集群间配置 MUNGE,这可以认为是 配置Slurm 的前奏

在操作之前建议配置好存储共享,下面将默认工作在共享存储下

主节点

#!/bin/bash
set -e

# 设置统一的时区,保持时间同步
timedatectl set-timezone Asia/Shanghai

timedatectl

echo "===== 创建 slurm 用户 ====="

# 创建系统用户 slurm(如果不存在)
if ! id -u slurm &>/dev/null; then
    sudo useradd -r -m -d /var/lib/slurm -s /bin/bash slurm
    echo "用户 slurm 已创建"
else
    echo "用户 slurm 已存在"
fi

# 设置统一的时区,保持时间同步
timedatectl set-timezone Asia/Shanghai

timedatectl

sudo apt install -y munge libmunge2
sudo /usr/sbin/create-munge-key
sudo chown munge:munge /etc/munge/munge.key
sudo chmod 400 /etc/munge/munge.key


# 拷贝到共享存储位置
#cp /etc/munge/munge.key /slurm-install/munge-data/munge.key

从节点执行下面脚本即可

#!/bin/bash
set -e

# 设置统一的时区,保持时间同步
timedatectl set-timezone Asia/Shanghai

timedatectl

echo "===== 创建 slurm 用户 ====="

# 创建系统用户 slurm(如果不存在)
if ! id -u slurm &>/dev/null; then
    sudo useradd -r -m -d /var/lib/slurm -s /bin/bash slurm
    echo "用户 slurm 已创建"
else
    echo "用户 slurm 已存在"
fi

# 设置 slurm home 目录权限
#sudo chown -R slurm:slurm /var/lib/slurm
#sudo chmod 700 /var/lib/slurm

echo "===== 配置 MUNGE ====="

sudo apt update
sudo apt install -y munge libmunge-dev libmunge2


# 创建目录
sudo mkdir -p /etc/munge /var/lib/munge /var/log/munge

# 从共享目录复制 munge key
# /slurm-install/munge-data/munge.key 在N台机器间共享
sudo cp /slurm-install/munge-data/munge.key /etc/munge/munge.key
sudo chown munge: /etc/munge/munge.key
sudo chmod 400 /etc/munge/munge.key

# 设置 munge 相关目录权限
sudo chown -R munge: /var/lib/munge /var/log/munge
sudo chmod 0700 /var/lib/munge /var/log/munge

# 启动 MUNGE
sudo systemctl enable munge
sudo systemctl start munge
systemctl status munge --no-pager

测试解密