nbd-vram - Linux에서 NVIDIA GPU VRAM을 스왑 공간으로 사용하는 도구

9 hours ago 2

nbd-vram은 Linux에서 NVIDIA GPU의 유휴 VRAM을 높은 우선순위의 스왑 공간으로 쓰게 해주는 작은 데몬임
납땜 메모리라 업그레이드가 어렵고 내장 AMD/ATI GPU가 화면 출력을 맡는 하이브리드 그래픽 노트북에서, 놀고 있는 NVIDIA VRAM을 메모리 압박 완화에 활용함
테스트 환경은 AMD/ATI + RTX 3070 Laptop, RAM 16GB, VRAM 8GB, NVIDIA driver 580.159.03, kernel 6.17, Pop!_OS이며, VRAM 7GB를 스왑으로 할당해 zram·SSD 스왑까지 합쳐 약 46GB의 주소 지정 가능한 메모리를 구성함
동작 순서는 RAM이 먼저 차고, 그다음 VRAM이 PCIe를 통해 넘친 페이지를 흡수하며, 이후 zram이 CPU로 압축하고, 마지막에 SSD를 사용하는 구조임
데몬은 CUDA driver API로 VRAM을 할당하고, Unix socket 위의 NBD(Network Block Device) 프로토콜로 블록 장치를 제공하며, 커널의 내장 nbd 드라이버가 /dev/nbdX로 노출해 일반 스왑 장치처럼 사용함
데이터 경로는 kernel swap subsystem → /dev/nbdX → nbd kernel driver → Unix socket → nbd-vram daemon → cuMemcpyHtoD/DtoH → GPU VRAM으로 이어짐
별도 커널 모듈이나 NVIDIA 커널 심볼이 필요 없어서, 커널·드라이버 업데이트 뒤에도 재빌드 없이 유지될 수 있음
NVIDIA P2P API 방식은 consumer GeForce GPU에서 nvidia_p2p_get_pages_persistent가 EINVAL을 반환하고, BAR1 직접 ioremap_wc 방식도 약 16MiB의 디스플레이 프레임버퍼 외 영역 읽기가 0을 반환해 실패함
CUDA 복사 경로인 cuMemcpyHtoD와 cuMemcpyDtoH는 특별한 권한 없이 CUDA GPU에서 동작하므로, NBD 접근이 P2P·BAR1 제약을 우회함
요구사항은 CUDA 지원 NVIDIA GPU, libcuda.so.1이 있는 NVIDIA 드라이버, Linux kernel 3.0+의 nbd 모듈, nbd-client, gcc, make이며 CUDA toolkit은 필요 없음
설치 후 vram-swap-nbd systemd 서비스가 부팅 시 자동 실행되며, /etc/systemd/system/vram-swap-nbd.service의 VRAM_SETUP_SIZE_MB와 VRAM_SWAP_PRIORITY로 사용할 VRAM 상한과 스왑 우선순위를 조정함
데몬은 요청한 VRAM 크기를 먼저 시도하고 GPU 메모리가 부족하면 512MiB 단위로 줄여 할당하므로, VRAM_SETUP_SIZE_MB는 필수 크기가 아니라 상한으로 동작함
전원 인식 관리를 켜면 AC 전원 해제나 배터리 임계값 이하에서 서비스가 자동 중지되고, 전원이 복구되면 다시 시작되며, 수동 systemctl stop은 덮어쓰지 않음
RTX 3070 Laptop 벤치마크에서 순차 처리량과 지속 랜덤 I/O는 NVMe가 더 빠르지만, 4K 읽기 1 request/sec 지연 시간은 VRAM이 평균 335us로 NVMe 9.05ms보다 27배 빠름
MIT 라이선스로 제공되며, 저장소는 스모크 테스트용 test-nbd.sh, 전체 파티션 검사용 test-fill.sh, 처리량·IOPS·지연 시간 벤치마크 스크립트를 함께 제공함

Read Entire Article

nbd-vram - Linux에서 NVIDIA GPU VRAM을 스왑 공간으로 사용하는 도구

Related

Meta 직원은 업무 중 추적을 최대 30분까지 거부할 수 있다

MacBook Neo가 너무 인기가 많아 Apple이 생산량을 두 배로 늘림

Uber의 월 1,500달러 AI 한도는 AI 도구 가격 책정에 유용한 신호

Elixir v1.20: 이제 점진적 타입 언어

Gemma 4 12B: 통합형 인코더 없는 멀티모달 모델

Stanford Law 연구에서 AI가 법학 교수보다 더 나은 성과를 보임

KDE Plasma의 마지막 X11 지원 릴리스 준비

BYD 자동차 부품의 CT 스캔

Tips

Trending

Popular

Announcing New Joule Studio for Enterprise Scale Agentic Dev...

트래블월렛 '친구간송금' 600만건 돌파…2030 해외송금 플랫폼 자리잡았다

트럼프 “美·나이지리아군, ‘IS 2인자’ 제거… 글로벌 작전 능력 축소”

'통한의 극장골 실점 패배' 주승진 김천 감독 "뒷심이 부족했다" [전주 현장]

“트럼프, 中이 원하는 대만 발언 안해…양측 긴장 유지될 것”

[전화성의 기술창업 Targeting] 〈395〉 [AC협회장 주간록105] 마이클 잭슨 자산과 스타트업 경...

What's new in Chrome from Google I/O 2026

테이트 30년, 현대미술사를 바꾼 혁명가의 22세기 미술관론

테루아와 시간이 빚어낸 예술…뉴질랜드 와인 페스티벌 열린다

테슬라, 로봇택시 사고 17건 경위 공개…원격 조종자 개입도 사유?