曲速引擎(Warp Drive)- 小曲博客 专注于计算机方面的博客 研究方向包括但不限于网络安全、单片机硬件、人工智能、全栈编程、自媒体

Kubernetes GPU 资源调度实战:从单卡到多卡的完整方案

这套方案已经在我们生产环境稳定运行了很长时间,希望能帮到正在为 GPU 资源分配头疼的朋友们。 前期准备:给节点贴上身份标签 在开始资源调度之前,我们得先给每个节点打上对应的 GPU 类型标签,这就像给每台机器贴个身份证一样: # 给不同节点标记不同的GPU类型 kubectl label node

Administrator Administrator 发布于 2025-08-08

kubernetes算力调度 - 支持异构卡

传统的 Docker 容器在 GPU 使用上存在明显的局限性:无法对显存进行精确切分,也无法控制 GPU 利用率分配,这在多任务并行的场景下会造成资源浪费和性能瓶颈,通过 Kubernetes 的 HAMI插件调度机制,我们可以实现更精细化的 GPU 资源管理。 Project-HAMi 异构 AI

Administrator Administrator 发布于 2025-08-08

Kubernetes GPU集群部署方法 - 3

初始化 k8s Master 节点 初始化集群 执行以下命令初始化 Kubernetes 集群,指定 Pod 网络 CIDR 为 10.244.0.0/16: sudo kubeadm init --pod-network-cidr=10.244.0.0/16 -v=5 等待完成后,根据提示创建配

Administrator Administrator 发布于 2025-08-08

Kubernetes GPU集群部署方法 - 2

kubectl 自动补全配置指南 本章将详细介绍如何为 kubectl 命令行工具配置自动补全功能,包括安装依赖、配置方法和常见问题排查。自动补全可以显著提高使用 kubectl 的效率,减少输入错误。 1. 安装 bash-completion(为 kubectl 命令提供自动补全支持) sudo

Administrator Administrator 发布于 2025-08-08

Kubernetes GPU集群部署方法 - 1

1. Kubernetes 运行时安装与配置 Containerd 是 Kubernetes 集群的核心容器运行时组件,它负责管理容器的完整生命周期。当 kubelet 需要创建 Pod 时,会通过 CRI(Container Runtime Interface)接口与 containerd 通信,

Administrator Administrator 发布于 2025-08-08

Kubernetes GPU集群部署方法 - 0

本章节主要解决 Kubernetes 框架的安装部署问题 1. Kubernetes 搭建方法 本文采用 k8s v1.28 进行搭建,并使用 Ubuntu22.04 系统承载,以下是详细安装步骤: 2.1 k8s 安装 # 更新系统并安装依赖 sudo apt-get update sudo ap

Administrator Administrator 发布于 2025-08-08

Docker容器GPU运行时配置完整指南

容器GPU运行时配置完整指南 1. 安装 Docker 和 Docker Compose # 更新系统包索引 sudo apt update # 安装必要的依赖包 sudo apt install -y \ apt-transport-https \ ca-certificates

Administrator Administrator 发布于 2025-08-08

LLM大推理 CUDA驱动完整安装教程

LLM大推理 CUDA驱动完整安装教程 1. 环境准备和检查 1.1 系统要求检查 # 检查系统版本 lsb_release -a cat /etc/os-release # 检查是否有NVIDIA显卡 lspci | grep -i nvidia 检查结论: 系统版本:确认为Ubu

Administrator Administrator 发布于 2025-08-08

解决QAnything2.0无法解析文档和无法启动容器的问题

由于存储桶数据被覆盖,图片异常,请查看 https://mp.weixin.qq.com/s/PsI7AVXWoSVfhIjirQlWSQ 一、docker-compose 运行启动到一半中断问题 这类问题一般是因为内存不足或者机器性能低导致的,在启动过程中docker-compose.yml文件,

Administrator Administrator 发布于 2024-10-12

ChatGPT的免费平替:Code Assistant AI

这个项目是我基于DeepSeekV2.5 进行辅助开发的,由于DeepSeeK V3 API 价格上涨了,hold不住成本,则下线处理了 由于存储桶问题,图片异常了,想看图片的看我公众号备份:https://mp.weixin.qq.com/s/blQjqoh9UqaABoPm0NnySA 关于 C

Administrator Administrator 发布于 2024-09-12