Name or service not known问题解决
Name or service not known问题描述目前使用一台ubuntu服务器作为跳转节点,IP设置为静态,netplan设置如下:
/etc/netplan/00-network-manager-all.yaml# Let NetworkManager manage all devices on this systemnetwork: ethernets: eno1: dhcp4: false addresses: - 1??.2??.2??.??5/24 nameservers: addresses: [202.38.64.56,202.38.64.17] eno2: dhcp4: false addresses: - 192.168.1.200/24 version: 2 renderer: NetworkManager
在尝试访问外站时发现无法解析域名,报错情形如下:
> ping www.baidu.comping: www.baidu.c ...
专栏:运维日常
运维日常更新也有好几篇了,也收录在这个专栏里面,质量良莠不齐,期待时长更新和修改。btw.运维也不是我的主业...
集群节点用户系统同步-NIS
资源目前课题组的服务器一共分两组:
node00-node05组成的Node算力序列,简称Node组; node组的算力为 12cpu*6 node=72CPU, 满负荷进程数144个(单节点提交<=24进程), 内存:128 GB/node * 6 node
Core01,Core01组成的Intel Core算力序列, 简称Core组。core组的算力为 24cpu*2core=48CPU, 满负荷96进程(单节点提交<=48进程), 内存:512 GB/Core *2 core两个组的算力差异不大,但是后者更适用于高并行的模拟任务,开销的内存较小;node更适合大批量的数据处理,如反演等数据产品的制备,需要大的内存开销。所以在使用上,我们决定按照任务类型将及其分配给不同的用户组。也就是两个不同的集群,共享一套磁盘存储。
目前,8台机器的操作系统已经全部更新,如下:
Hosts
系统
内存
子网ip
node00
Ubuntu 22.04.3 LTS
256 GB
192.168.1.100* ...
libgfortran.so.3 动态库缺失
修复NCL缺失老版本动态库文件依赖的问题
集群节点文件共享-Node02更新系统
node2 的系统崩溃了,需要安装新系统,决定更换成ubuntu,但是替换后的兼容稳定性,运算效率等都是未知数,并且我没有配置集群的经验。这次使用node02实践一下,争取可以形成生产力
从零开始挂载磁盘阵列
场景之前课题组就有一个磁盘阵列,大概是2018年购置的,raid6的阵列,一共130TB的净存储空间。实话说已经不小了,奈何GPM DPR和ENV的数据太过巨大,原始数据迅速就塞满了,后来大家就到处找空间。我做一次反演,原始数据倒要分好几段存储,苦不堪言。这次又添置了一个新的阵列,瞬间富裕起来了。36*12T的raid6,6块用于热备份,净空间有328T。预装的系统为 Ubuntu 20.04.1 LTS (GNU/Linux 5.4.0-58-generic x86_64),大爱ubuntu。
要立即用起来,那就要挂载到计算节点上。之前是学校超算的老师过来操作的。当时不在场,小磁盘挂载还是操作过的,决定自己来。机房的结构大致是这样的,机柜之间有一些飞线。pdu使用的美标,没有画出来,但是加机器时需要提前准备好特用的电源线。
计算节点和存储阵列的网络关系如下,node01和node05是可以独立登录的,拥有静态互联网IP,可以校内访问。两个Raid阵列也是可以校内登录的。所有节点和阵列使用静态局域网ip地址进行通讯。
dataserver2有两个网线,一根接校园网交换机,自动获取ip ...
集群节点文件系统共享NFS设置
场景最近需要急速反演一套GMI Emissivity数据(chuanxi)。 最麻烦和耗时的工作来自于原始数据的下载:
GMI1B,GMI2A GROPF, 201811 ~ 202007 (800 GB)
H8 L2CLP (300 GB)
ERA5 Plevels+Surface (100 GB)
所以,服务器为了安全考虑没有联网,本地下载到一块陈年(2014年产)2TB硬盘上放弃了数据上传,太慢了,简单粗暴,直接插在机架上。
查看磁盘查看当前磁盘挂载情况,可以看出目前系统根目录是创建在/dev/sda盘上的
[hjh@node01] ~ $ df -hFilesystem Size Used Avail Use% Mounted on/dev/sda2 30G 7.2G 21G 26% / ## 根目录是创建在sda磁盘上的tmpfs 63G 84K 63G 1% /dev/shm/dev/sda3 74G 95 ...