뉴스탭
뉴스컴퓨팅
엔비디아, OCI에 최신 엔비디아 GPU 가속 컴퓨팅 인스턴스 탑재
최인훈 기자  |  news@newstap.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2023.09.23  09:07:13
트위터 페이스북 미투데이 요즘 네이버 구글 msn

엔비디아(www.nvidia.co.kr)가 오라클과 협력해 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, 이하 OCI)에 최신 엔비디아(NVIDIA) GPU 가속 컴퓨팅 인스턴스를 탑재한다고 발표했다.

생성형 AI와 대규모 언어 모델(LLM)이 획기적인 혁신을 주도하면서 훈련과 추론에 대한 컴퓨팅 요구가 급증하고 있다. 따라서 최신 생성형 AI 애플리케이션에는 대규모 워크로드를 빠르고 정확하게 처리할 수 있는 최첨단 인프라부터 가속화된 풀스택 컴퓨팅이 필요하다. 이러한 요구를 충족하기 위해 OCI는 OCI 컴퓨트(OCI Compute)에서 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)를 정식 제공하고, 엔비디아 L40S GPU도 곧 지원 예정이라고 밝혔다.

OCI의 엔비디아 H100 텐서 코어 GPU 인스턴스
OCI 컴퓨트 베어 메탈 인스턴스(bare-metal instances)는 엔비디아 호퍼 아키텍처(Hopper architecture)기반의 엔비디아 H100 GPU가 탑재됐다. 이를 통해 모든 워크로드를 위한 탁월한 성능, 확장성, 유연성을 제공하며, 대규모 AI와 고성능 컴퓨팅을 위한 비약적인 도약을 가능하게 한다.

엔비디아 H100 GPU를 사용하는 조직은 엔비디아 A100 텐서 코어 GPU(A100 Tensor Core GPU)를 활용할 때보다 AI 추론 성능이 최대 30배 향상되고, AI 훈련이 4배 향상된다. H100 GPU는 LLM 훈련과 실행 과정에서 추론 등 리소스 집약적인 컴퓨팅 작업을 위해 설계됐다.

BM.GPU.H100.8 OCI 컴퓨트 형태에는 각각 80GB의 HBM2 GPU 메모리를 갖춘 8개의 엔비디아 H100 GPU가 포함된다. 8개의 GPU 간에 3.2TB/s의 이중 대역폭이 제공되므로 각 GPU는 엔비디아 NV스위치(NVSwitch)와 NV링크(NVLink) 4.0 기술을 통해 다른 7개의 모든 GPU와 직접 통신할 수 있다. 또한 여기에는 각각 3.84TB 용량의 로컬 NVMe 드라이브 16개, 112코어의 4세대 인텔 제온(4th Gen Intel Xeon) CPU 프로세서와 2TB의 시스템 메모리도 포함된다.

즉, 이 형태는 조직의 가장 까다로운 워크로드에 최적화돼 있다고 할 수 있다.

아울러 조직은 워크로드의 타임라인과 규모에 따라 OCI 슈퍼클러스터(OCI Supercluster)를 통해 고성능, 초저지연 네트워크를 사용해 단일 노드에서 최대 수만 개의 H100 GPU로 엔비디아 H100 GPU 사용량을 확장할 수 있다.

OCI의 엔비디아 L40S GPU 인스턴스
엔비디아 L40S GPU는 엔비디아 에이다 러브레이스 아키텍처(Ada Lovelace architecture)를 기반으로 하는 데이터센터용 유니버설(universal) GPU이다. L40S GPU는 LLM 추론과 훈련, 비주얼 컴퓨팅과 비디오 애플리케이션을 위한 획기적인 멀티 워크로드 가속화를 제공한다. 엔비디아 L40S GPU가 탑재된 OCI 컴퓨팅 베어 메탈 인스턴스는 올해 말부터 얼리 액세스가 가능하며, 2024년 초 상용화될 예정이다.

이 인스턴스는 그래픽, 비디오 컴퓨팅 작업뿐만 아니라 중소 규모의 AI 워크로드를 다루기 위해 엔비디아 H100과 A100 GPU 인스턴스의 대안을 제공할 예정이다. 엔비디아 L40S GPU는 생성형 AI 워크로드에서 최대 20%의 성능 향상, 엔비디아 A100에 비해 미세 조정(fine-tuning) AI 모델에서 최대 70%의 성능 향상을 제공한다.

BM.GPU.L40S.4 OCI 컴퓨트 형태에는 4개의 엔비디아 L40S GPU가 포함된다. 여기에는 최대 112코어의 최신 세대의 인텔 제온 CPU, 1TB의 시스템 메모리, 데이터 캐싱용(caching) 15.36TB의 저지연 NVMe 로컬 스토리지, 400GB/s의 클러스터 네트워크 대역폭이 함께 제공된다. 이 인스턴스는 LLM 훈련, 미세 조정과 추론부터 엔비디아 옴니버스(Omniverse) 워크로드, 산업 디지털화, 3D 그래픽과 렌더링, 비디오 트랜스코딩과 FP32HPC와 같은 다양한 용도를 다루기 위해 만들어졌다.

엔비디아와 OCI: 엔터프라이즈 AI(Enterprise AI)
이번 엔비디아와 OCI의 협력은 모든 규모의 조직이 최첨단 엔비디아 H100과 L40S GPU 가속 인프라를 통해 생성형 AI 혁신에 동참할 수 있도록 지원한다.

그러나 엔비디아 GPU 가속 인스턴스에 대한 액세스만으로는 충분하지 않을 수 있다. OCI 컴퓨팅에서 엔비디아 GPU의 잠재력을 최대한 활용하려면 최적의 소프트웨어 레이어가 필요하다. 엔비디아 AI 엔터프라이즈는 지원 서비스로 기본 엔비디아 GPU 인프라에 최적화된 오픈 소스 컨테이너와 프레임워크를 활용한다. 이를 통해 엔터프라이즈급 가속화된 AI 소프트웨어의 개발과 배포를 간소화한다.

최인훈 기자의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
가장 많이 본 기사
1
65인치 거대 게이밍 모니터 등장? 144Hz 디지털TV ‘더함 스마트 65 UHD VRR144Hz 구글 시네마TV Real 120Hz’
2
95프로블럼, ‘네고왕 인연’ 개그맨 홍현희 모델 발탁
3
크리스마스 선물이 펑펑! MSI, 게이밍 SSD 구매시 경품 증정
4
안랩, 협력업체(공인 파트너사) 대상 ESG 교육 진행
5
더함, UHD 144Hz 75형 구글3.0 게이밍TV 출시 기념 20퍼센트 할인
6
전문가를 위해 설계된 그래픽카드 'AMD 라데온 프로 W7700'
7
소니코리아, 뉴에라와 함께 ‘겨울의 완성 1000XM5 선물 프로모션’ 진행
8
유라, ‘연말 고객 감사 대전’ 진행…보상판매 기회도 제공
9
브레빌 코리아, 다가오는 크리스마스와 연말을 맞아 특별한 선물 같은 혜택 선사하는 ‘크리스마스 보너스 프로모션’ 진행
10
유니씨앤씨, 11번가 삼성 갤럭시북3 프로 16인치 브랜드위크 진행
신문사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
서울특별시 영등포구 영신로34길 10 영남빌딩 5층 504호  |  대표전화 : 070-7527-0410
등록번호 : 서울특별시 자00408  |  등록년월일 : 2013년 4월 15일
발행인 : (주)이노엠앤엠 이준문  |  편집인 : 이준문  |  청소년보호책임자 : 이준문
Copyright © 2013 뉴스탭. All rights reserved. mail to news@newstap.co.kr