엔비디아, 암페어(Ampere) 아키텍처에서 멀티 인스턴스 GPU 지원

뉴스탭 시작페이지로 즐겨찾기 추가

처음으로 로그인 회원가입 전체기사

최종편집 : 2024.4.26 금 10:41

뉴스 컴퓨팅

엔비디아, 암페어(Ampere) 아키텍처에서 멀티 인스턴스 GPU 지원

최인훈 기자 | news@newstap.co.kr

승인 2020.05.29 10:49:45

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 자사의 암페어(Ampere) 아키텍처에서 멀티 인스턴스 GPU(Multi-Instance GPU, 이하 MIG)를 지원해 기업들이 보다 신속하게 인공지능(AI) 모델을 개발 및 배포하도록 돕는다고 밝혔다.

MIG는 엔비디아 A100 GPU를 최대 7개의 독립된 GPU 인스턴스로 분할한다. 인스턴스들은 각각 고유한 메모리, 캐시, 스트리밍 멀티프로세서를 사용해 동시에 실행된다. 이를 통해 모든 작업에 대해 보장된 서비스 품질로 적합한 크기의 GPU를 제공해 이전 GPU 대비 최대 7배 향상된 활용도를 구현한다.

MIG 모드의 A100은 최대 7개의 다양한 크기의 AI 또는 고성능컴퓨터(HPC) 워크로드를 혼합해 실행할 수 있다. 이 기능은 일반적으로 최신 GPU가 제공하는 성능을 모두 필요로 하지 않는 AI 추론 작업에 유용하다. 예컨대 사용자는 20GB의 메모리를 갖춘 2개의 MIG 인스터스 혹은 10GB의 3개 인스턴스, 5GB의 7개 인스턴스를 생성할 수 있어 각각의 워크로드에 맞는 최적의 조합을 만들 수 있다.

MIG는 GPU 인스턴스를 차단시키므로 결함격리(fault isolation) 기능을 제공하여 한 인스턴스의 문제가 동일한 GPU에서 실행되는 다른 사용자에게 영향을 주지 않는다. 각 인스턴스는 보장된 QoS를 제공해 사용자의 워크로드가 예상되는 레이턴시(지연시간)과 처리량을 확보할 수 있도록 한다.

클라우드 서비스제공업체와 그 외의 기업은 MIG를 통해 GPU 서버의 활용률을 향상시켜 사용자에게 최대 7배 많은 GPU 인스턴스를 제공할 수 있다. 구글 클라우드의 수석 소프트웨어 엔지니어 팀 호킨 (Tim Hockin)은 “엔비디아는 구글 클라우드의 전력적 파트너로 고객을 위해 혁신을 거듭하고 있다. MIG는 공유 쿠버네티스(Kubernetes) 클러스터에서 GPU의 효율성과 활용도를 새로운 수준으로 끌어올린다. 구글 클라우드는 엔비디아, 그리고 쿠버네티스 커뮤니티와 협력해 이러한 공유 GPU 활용사례를 만들어내고, 이를 구글 쿠버네티스 엔진(Google Kubernetes Engine)을 통해 이용할 수 있기를 기대한다”라고 말했다.

MIG로 추론작업 최적화 가능해져
기업은 MIG를 통해 AI 모델의 개발과 배포속도를 향상시킬 수 있다. MIG는 최대 7명의 데이터 사이언티스트가 전용 GPU와 같은 기능에 동시에 액세스할 수 있으므로 최적의 정확성과 성능을 위해 딥 러닝 모델을 세부적으로 조정할 수 있다. 이는 시간이 많이 소요되지만, 많은 컴퓨팅 성능이 필요하지 않는다.

모델을 실행할 준비가 되면 MIG는 단일 GPU에서 한번에 최대 7개의 추론작업을 할 수 있다. 이런 작업에는 GPU 전체를 사용할 필요가 없고 레이턴시가 짧은 작은 모델을 사용하는 배치-1 추론 워크로드가 가장 적합하다.

미국의 주문형 배송업체 포스트메이츠(Postmates)의 AI 디렉터 젠유 궈(Zhenyu Guo)는 “엔비디아 기술은 우리의 배달 로봇 플랫폼 서브(Serve)에 있어 매우 중요하다. MIG를 사용하면 컴퓨팅 리소스를 역동적으로 재구성하여 변화하는 워크로드 요구를 충족시키고 클라우드 기반 인프라를 최적화하여 최대의 효율성과 비용 절감을 누릴 수 있으므로 배포된 모든 GPU를 최대한 활용할 수 있다”고 말했다.

IT·데브옵스(DevOps) 구축
사용자들은 AI와 HPC용 MIG를 활용하기 위해 쿠다(CUDA) 프로그래밍 모델을 변경할 필요가 없다. MIG는 쿠버네티스와 컨테이너뿐만 아니라 기존의 리눅스(Linux) 운영 체제에도 구동된다. MIG는 A100용으로 제공된 소프트웨어에도 작동된다. 이는 GPU 드라이버, 곧 배포될 예정인 엔비디아 쿠다 11 소프트웨어, 업데이트된 엔비디아 컨테이너 런타임, 엔비디아 디바이스 플러그인(NVIDIA Device Plugin)을 통한 쿠버네티스의 새로운 리소스 유형이 포함된다.

MIG와 함께 엔비디아 버추얼 컴퓨터 서버(vComputeServer)를 사용하면 RHV(Red Hat Virtualization)와 VM웨어 v스피어(VMware vSphere)와 같은 하이퍼바이저의 관리와 모니터링 기능 제공이 가능하다. 또한, 실시간 마이그레이션과 멀티 테넌시와 같은 많이 사용되는 기능 지원도 가능하다.

레드 햇(Red Hat)의 마케팅 디렉터 척 더뷰크(Chuck Dubuque)는 “고객들은 가상 시스템에서 실행되는 멀티 테넌트 워크 플로우를 관리하면서 격리와 보안 기능도 제공해야 할 필요를 점점 더 느끼고 있다. 엔비디아 A100 GPU의 새로운 멀티 인스턴스 GPU 기능을 통해 클라우드에서 엣지까지 레드 햇 플랫폼에서 실행되는 AI 가속 워크로드가 가능해진다"라고 소감을 밝혔다.

사용자가 엔비디아 A100과 해당 소프트웨어를 사용하면 마치 실제 물리적 GPU에서처럼 새로운 GPU 인스턴스에서 작업을 체크하고 스케줄링 할 수 있다.

최인훈 기자의 다른기사 보기

가장 많이 본 기사

1
이엠텍, 국내 최초 NVIDIA RTX 최신 기능을 활용하는 완전 무소음 그래픽카드! 이엠텍 지포스 RTX 3050 KalmX D6 6GB 출시

2
틈새 시장 공략 'SAPPHIRE 라데온 RX 7600 XT PULSE OC D6 16GB'

3
LG전자, 240Hz 올레드 게이밍 모니터 ‘27GS95QE’ 신제품 출시

4
브롬톤 런던, 성수에 팝업스토어 오픈...1세대 자전거부터 브롬톤 런던 제품까지 한자리에

5
클리오, 일본 핵심 벤더업체 인수 통해 글로벌 신성장동력 확보

6
안랩, 위협 인텔리전스 플랫폼 ‘안랩 TIP’에 금융권 특화 보고서와 신규 위협정보 등 추가

7
코멕스, '에코 클리어 오븐글라스' 현대홈쇼핑서 최대 69% 할인

8
에코백스, 업계 최초 하이브리드 청소기 ‘디봇 X2 콤보’ 출시 및 보상판매 이벤트 진행

9
더욱 세련된 블랙으로!... ‘라익미 V320 트리플블랙’ 제로베젤 업그레이드

10
‘케이블 없어지니 편하고 깔끔해’...마이크로닉스, 겜디아스 아이올로스 P2 시리즈 쿨링팬 출시

1이엠텍, 국내 최초 NVIDIA RTX 최신 기능을 활용하는 완전 무소음 그래픽카드! 이엠텍 지포스 RTX 3050 KalmX D6 6GB 출시

2틈새 시장 공략 'SAPPHIRE 라데온 RX 7600 XT PULSE OC D6 16GB'

3LG전자, 240Hz 올레드 게이밍 모니터 ‘27GS95QE’ 신제품 출시

4브롬톤 런던, 성수에 팝업스토어 오픈...1세대 자전거부터 브롬톤 런던 제품까지 한자리에

5클리오, 일본 핵심 벤더업체 인수 통해 글로벌 신성장동력 확보

6안랩, 위협 인텔리전스 플랫폼 ‘안랩 TIP’에 금융권 특화 보고서와 신규 위협정보 등 추가

7코멕스, '에코 클리어 오븐글라스' 현대홈쇼핑서 최대 69% 할인

8에코백스, 업계 최초 하이브리드 청소기 ‘디봇 X2 콤보’ 출시 및 보상판매 이벤트 진행

9더욱 세련된 블랙으로!... ‘라익미 V320 트리플블랙’ 제로베젤 업그레이드

10‘케이블 없어지니 편하고 깔끔해’...마이크로닉스, 겜디아스 아이올로스 P2 시리즈 쿨링팬 출시