Linux运维笔记:1010实验室电脑资源规范使用指南

文章目录

  • 一. 检查资源使用情况,避免冲突
      • 1. 检查在线用户
      • 2. 检查 CPU 使用情况
      • 3. 检查 GPU 使用情况
      • 4. 协作建议
  • 二. 备份重要文件和数据
  • 三. 定期清理硬盘空间
  • 四. 退出 ThinLinc 时注销,释放内存
  • 五. 校外使用时配置 VPN
    • 注意事项
  • 总结

实验室的电脑配备了 CPU 和 GPU 资源,供多个子用户共享使用。为了避免资源冲突、提高效率并保护数据安全,大家需要规范使用工作站。以下是详细指导,帮助大家高效、协作地使用资源。

一. 检查资源使用情况,避免冲突


在运行代码前,务必检查 CPU 和 GPU 的使用情况,确保不与他人任务冲突。一起运行代码会降低性能,甚至导致程序崩溃。建议协商排队使用。

1. 检查在线用户

  • 命令who
  • 作用:查看当前登录工作站的用户。
  • 操作:在终端输入以下命令:
    who
    
  • 输出示例
    user1   pts/0    2025-06-03 14:30 (192.168.1.10)
    user2   pts/1    2025-06-03 14:32 (10.0.0.5)
    
  • 说明:显示在线用户、登录时间和来源 IP。联系在线用户,确认他们的任务状态。

2. 检查 CPU 使用情况

  • 命令htop
  • 作用:实时查看 CPU 和内存使用情况,识别占用资源的进程。
  • 操作
    1. 在终端输入:
      htop
      
    2. 查看“CPU”栏,检查使用率(例如 50% 表示一半负载)。
    3. F5 查看进程树,找到占用 CPU 的用户和程序(PID、用户、命令等)。
  • 建议:如果 CPU 占用高(如 >80%),联系相关用户,协商错开运行时间。

3. 检查 GPU 使用情况

  • 命令nvidia-smi
  • 作用:查看 GPU 内存、利用率和运行进程。
  • 操作
    1. 在终端输入:
      nvidia-smi
      
    2. 检查“GPU-Util”列(GPU 利用率)和“Processes”部分(显示 PID、用户、程序名)。
  • 输出示例
    +---------------------------------------------------------------------------------+
    | NVIDIA-SMI 550.54.14    Driver Version: 550.54.14    CUDA Version: 12.4        |
    |-------------------------------+----------------------+-------------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC    |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M.    |
    |===============================+======================+=========================|
    |   0  NVIDIA GeForce RTX 4090  Off  | 00000000:01:00.0 Off |                 Off    |
    | 30%   38C    P2    55W / 450W |  14704MiB / 24564MiB |      0%      Default    |
    +-------------------------------+----------------------+-------------------------+
    | Processes:                                                                      |
    |  GPU   GI   CI   PID   Type   Process name                  GPU Memory Usage    |
    |===============================+======================+=========================|
    |    0    N/A  N/A  12345   C    python                    14700MiB              |
    +-------------------------------+----------------------+-------------------------+
    
  • 建议:若 GPU 内存或利用率高,联系占用者(通过 PID 对应用户),商量排队使用

4. 协作建议

  • 沟通:运行大任务前,与在线用户沟通,确认资源可用性。
  • 排队:协商使用时间,避免同时运行多个重负载任务。

二. 备份重要文件和数据


  • 重要性:工作站数据可能因硬件故障、误操作或系统问题丢失。
  • 建议
    1. 定期备份重要代码、数据和配置文件。
    2. 存储位置:
      • 个人电脑硬盘
      • U 盘或移动硬盘
      • 云存储(如百度网盘)
    3. 使用 SCP 命令FileZilla 软件(如下截图所示)可以快捷与个人主机文件传输
  • 注意:不要完全依赖工作站存储,意外情况随时可能发生!并且注意传入工作站的文件是否安全,切勿将疑似带有病毒的文件包传入!

在这里插入图片描述

三. 定期清理硬盘空间


  • 背景:工作站硬盘是公用的,空间有限,需共同维护。
  • 操作
    1. 检查磁盘使用情况:
      df -h
      
      • 查看挂载点(如 /home)的剩余空间。
    2. 查找大文件或无用数据:
      du -sh /home/* | sort -hr
      
      • 列出目录和文件大小,找出占用空间大的内容。
    3. 清理垃圾文件:
      • 删除临时文件、日志、旧数据包等。
      • 示例:删除 *.tmp 文件:
        rm -rf /home/your_username/*.tmp
        
  • 建议
    • 将不必要的文件转移到个人电脑或网盘。
    • 能不留的垃圾文件和数据包都删除,保持硬盘整洁。
    • 定期(例如每周)检查和清理。

四. 退出 ThinLinc 时注销,释放内存


  • 背景:ThinLinc 是实验室常用的远程桌面工具,退出时若不注销,会话可能继续占用内存,导致工作站性能下降或死机。

  • 操作

    1. 确认无程序需要后台运行。
    2. 点击桌面右上角的“注销”按钮(通常在系统菜单中)。
    3. 选择“注销”或“Log Out”,结束会话。

    在这里插入图片描述

  • 好处

    • 释放主机内存,减少资源占用。
    • 降低工作站死机风险,提高稳定性。
  • 注意

    • 但是若有长期任务(如训练模型),要确保任务在后台运行
    • 若再次登陆时,发现无法通过 ThinLinc 建立连接的问题,如下图所示把End existing session勾选上再次尝试
      在这里插入图片描述

五. 校外使用时配置 VPN


  • 需求:在校外访问实验室工作站需通过学校网络。
  • 操作
    1. 访问学校官网,找到 IT 或网络服务页面。
    2. 下载 VPN 连接软件:EasyConnect
    3. 安装并配置:
      • 输入学校提供的 VPN 服务器地址。
      • 使用您的学号/工号和密码登录。
    4. 连接成功后,通过 ThinLinc 或 SSH 访问工作站。
  • 建议
    • 确保 EasyConnect 版本与学校要求一致。
    • 校外使用时,保持 VPN 连接稳定,避免中断。

注意事项

  • 谨慎操作:管理员修改系统设置或删除文件前,确认权限和影响。
  • 备份:所有建议中,备份和沟通始终是关键,保护代码和数据。
  • 尊重他人:资源共享,优先沟通,协商使用

总结


规范使用实验室电脑资源是大家的责任!运行代码前检查 CPU(htop)和 GPU(nvidia-smi),用 who 确认在线用户,协商排队;备份重要数据,定期清理硬盘;退出 ThinLinc 时注销释放内存;校外使用时配置 EasyConnect VPN。让我们共同维护工作站的高效和稳定!

如有疑问,联系实验室管理员或群内讨论。谢谢配合!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.tpcf.cn/bicheng/83535.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手机邮箱APP操作

收发电子邮件方式 邮箱可以在网络段登录,也可以在手机端登录。 大学网络服务 收发电子邮件有三种方式: 1、Web方式: 1)登录“网络服务”(https://its.pku.edu.cn),点页面顶端“邮箱”。 2&…

Dockerfile 使用多阶段构建(build 阶段 → release 阶段)后端配置

错误Dockerfile配置示例: FROM python:3.11 as buildENV http_proxyhttp://172.17.0.1:7890 ENV https_proxyhttp://172.17.0.1:7890WORKDIR /appENV PYTHONPATH/app# Install Poetry # RUN curl -sSL https://install.python-poetry.org | POETRY_HOME/opt/poetry…

webstrom中git插件勾选提交部分文件时却出现提交全部问题怎么解决

原因是我有个.husky的文件制定了执行提交的时候就是提交所有的文件 修改.husky/pre-commit文件就可以啦 #!/usr/bin/env sh . "$(dirname -- "$0")/_/husky.sh"# 获取通过 WebStorm 提交的暂存文件(仅勾选的部分) STAGED_FILES$(gi…

OSG编译wasm尝试

最近遇到一个情况,需要尝试一下OSG到webassembly 发现官网有教程 于是顺着看了看,默认教程是xubuntu的一个系统跑的,但是我本着试一试的想法,拉下来直接在windows上跑,奇奇怪怪的报错简直头皮发麻 然后怎么办呢&#x…

QT中子线程触发主线程弹窗并阻塞等待用户响应-传统信号槽实现

目录 QT中子线程触发主线程弹窗并阻塞等待用户响应传统信号槽实现实现思路具体步骤1. 定义信号与槽2. 异步任务中触发弹窗3. 主线程处理弹窗4. 连接信号与槽关键点总结 更简单实现 QT中子线程触发主线程弹窗并阻塞等待用户响应 传统信号槽实现 场景需求:在子线程执…

STM32学习之WWDG(原理+实操)

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

【端午安康】龙舟争渡Plug-In

文章目录 正文附录A:关于Python的录屏方法总结(来自DeepSeek的回答)1. 使用 pyautogui 和 OpenCV 录制屏幕2. 使用 mss 库(高效屏幕捕获)3. 使用 PIL.ImageGrab 录制屏幕4. 使用 Windows 原生快捷键录制(非…

Apache SeaTunnel部署技术详解:模式选择、技巧与最佳实践

Apache SeaTunnel(原Waterdrop)作为高性能、分布式数据集成平台,支持海量数据的离线与实时同步。其灵活多样的部署模式可适配不同规模的生产环境需求。本文将系统解析SeaTunnel的部署架构、技术要点及最佳实践,帮助用户高效构建稳定可靠的数据管道。 一、部署模式全景概览 …

【机械视觉】Halcon—【六、交集并集差集和仿射变换】

【机械视觉】Halcon—【六、交集并集差集和仿射变换】 目录 【机械视觉】Halcon—【六、交集并集差集和仿射变换】 介绍 交集并集差集介绍: 1. 交集(Intersection) 2. 并集(Union) 3. 差集(Difference&#xff…

实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.6 R语言解题

本文是实验设计与分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅珏生译) 第5章析因设计引导5.7节思考题5.6 R语言解题。主要涉及方差分析&#xff0c;正态假设检验&#xff0c;残差分析&#xff0c;交互作用图&#xff0c;等值线图。 dataframe <-data.frame…

剑指offer15_数值的整数次方

数值的整数次方 实现函数 double Power(double base, int exponent) 题目要求 计算 base exponent \text{base}^{\text{exponent}} baseexponent&#xff1a; 不得使用库函数不需要考虑大数问题&#xff0c;绝对误差不超过 10 − 2 10^{-2} 10−2不会出现底数和指数同为 0…

【Typst】1.Typst概述

概述 Typst是一种用于排版文档的标记语言&#xff0c;可以用于排版各种精美的论文、文章、书籍、报告和作业等。它是LaTex的精神续作&#xff0c;但是运行环境和编译速度都要更简单、更快捷。 它设计了一种脚本结合简单的标记语法实现复杂的排版效果。并且支持模板创建、文件…

[Java恶补day14] 56. 合并区间

以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#xff0c;该数组需恰好覆盖输入中的所有区间 。 示例 1&#xff1a; 输入&#xff1a;intervals [[1,3…

DiskGenius专业版v6.0.1.1645:分区管理、数据恢复、备份还原,一应俱全!

各位小伙伴&#xff0c;大家好&#xff01;今天阿灿给大家带来一款超好用的分区工具&#xff0c;DiskGenius专业版。这款工具堪称电脑管理界的“瑞士军刀”&#xff0c;功能强大&#xff0c;现在出了新版本v6.0.1.1645&#xff0c;简繁中文单文件便携版&#xff0c;使用超方便。…

azure web app创建分步指南系列之二

为注册表授权托管标识 你创建的托管标识尚未获得从容器注册表中提取数据的授权。在此步骤中,你将启用授权。 返回容器注册表的管理页面: 在左侧导航菜单中,选择“访问控制 (IAM)”。选择“添加角色分配”。此屏幕截图显示了如何为容器注册表启用添加角色分配。在角色列表中…

STM32 AD单通道与多通道实战指南

文章目录 AD单通道&#xff08;实验&#xff09;有关配置的库函数AD单通道部分主要代码 AD多通道实现多通道采集实现思路探讨单次转换非扫描模式实现AD多通道AD多通道部分代码 学习建议&#xff1a;推荐搭配 江协科技 AD单通道 AD多通道一起食用&#xff01;&#xff01;&#…

沟通频率不合适,如何找到平衡点

在团队协作中&#xff0c;沟通频率过高、信息干扰、节奏错位常常导致效率下降与成员倦怠。PMI研究指出&#xff0c;沟通不当是75%项目延误的根源&#xff0c;其中沟通频率失衡是关键变量之一。要解决这一问题&#xff0c;关键在于设定节奏、分层沟通、制定协议。其中&#xff0…

EC2 实例详解:AWS 的云服务器怎么玩?☁️

弹性计算、灵活计费、全球可用&#xff0c;AWS EC2 全攻略 在 AWS 生态中&#xff0c;有两个核心服务是非常关键的&#xff0c;一个是 S3&#xff08;对象存储&#xff09;&#xff0c;另一个就是我们今天的主角 —— Amazon EC2&#xff08;Elastic Compute Cloud&#xff09…

lvs-keepalived高可用群集

目录 1.Keepalived 概述及安装 1.1 Keepalived 的热备方式 1.2 keepalived的安装与服务控制 &#xff08;1&#xff09;安装keep alived (2)控制 Keepalived 服务DNF 安装 keepalived 后,执行以下命令将keepalived 服务设置为开机启动。 2.使用 Keepalived 实现双机热备 …

车载诊断架构SOVD --- 车辆发现与建连

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 钝感力的“钝”,不是木讷、迟钝,而是直面困境的韧劲和耐力,是面对外界噪音的通透淡然。 生活中有两种人,一种人格外在意别人的眼光;另一种人无论…