Skip to content

Instantly share code, notes, and snippets.

View cieske's full-sized avatar
😛
이것저것 보장하라! 아무거나 규탄한다!

cieske cieske

😛
이것저것 보장하라! 아무거나 규탄한다!
View GitHub Profile
@garg-aayush
garg-aayush / Steps_multiple_cuda_environments.md
Last active July 19, 2024 05:13
Managing multiple CUDA versions using environment modules in Ubuntu

Steps to manage multiple CUDA environments

Latest Update: May 19th, 2024

This gist contains all the steps required to:

  • Install multiple CUDA versions (e.g., CUDA 11.8 and CUDA 12.1
  • Manage multiple CUDA environments on Ubuntu using the utility called environment modules.
  • Use this approach to avoid CUDA environment conflicts.

Environment Modules is a package that provides for the dynamic modification of a user's environment via modulefiles. You can find more on it at https://modules.readthedocs.io/en/latest/

NSML
- GPU 자원의 효율적인 사용을 위해 개발된 MLaaS (Machine Learning as a Service), 클라우드 플랫폼
- AI 연구개발이 가능하도록 돕는 역할을 수행합니다. 단순히 CLI와 Web interface만으로 복잡한 설정 없이 AI 학습을 진행
- NSML 에서는 Session 이라는 개념, 하나의 작업 단위를 Session
- 하나의 session 안에서는 여러 개의 model을 run(진행)
- 모델들은 checkpoint라는 번호로 구분되어 계속 저장
- NSML 을 돌릴 때 Local 에서
Local 환경에서 필요한 것
- Files : 첫 시작점으로 불리는 entry fiel 을 포함한 파일들을 지칭. NSML에 사용하는 명령어들과 머신러닝 모델들을 적는 파일