¿£ºñµð¾Æ(www.nvidia.co.kr, CEO Á¨½¼ Ȳ)´Â ÀÚ»çÀÇ ¾ÏÆä¾î(Ampere) ¾ÆÅ°ÅØó¿¡¼ ¸ÖƼ ÀνºÅϽº GPU(Multi-Instance GPU, ÀÌÇÏ MIG)¸¦ Áö¿øÇØ ±â¾÷µéÀÌ º¸´Ù ½Å¼ÓÇÏ°Ô ÀΰøÁö´É(AI) ¸ðµ¨À» °³¹ß ¹× ¹èÆ÷Çϵµ·Ï µ½´Â´Ù°í ¹àÇû´Ù.
MIG´Â ¿£ºñµð¾Æ A100 GPU¸¦ ÃÖ´ë 7°³ÀÇ µ¶¸³µÈ GPU ÀνºÅϽº·Î ºÐÇÒÇÑ´Ù. ÀνºÅϽºµéÀº °¢°¢ °íÀ¯ÇÑ ¸Þ¸ð¸®, ij½Ã, ½ºÆ®¸®¹Ö ¸ÖƼÇÁ·Î¼¼¼¸¦ »ç¿ëÇØ µ¿½Ã¿¡ ½ÇÇàµÈ´Ù. À̸¦ ÅëÇØ ¸ðµç ÀÛ¾÷¿¡ ´ëÇØ º¸ÀåµÈ ¼ºñ½º Ç°Áú·Î ÀûÇÕÇÑ Å©±âÀÇ GPU¸¦ Á¦°øÇØ ÀÌÀü GPU ´ëºñ ÃÖ´ë 7¹è Çâ»óµÈ È°¿ëµµ¸¦ ±¸ÇöÇÑ´Ù.
MIG ¸ðµåÀÇ A100Àº ÃÖ´ë 7°³ÀÇ ´Ù¾çÇÑ Å©±âÀÇ AI ¶Ç´Â °í¼º´ÉÄÄÇ»ÅÍ(HPC) ¿öÅ©·Îµå¸¦ È¥ÇÕÇØ ½ÇÇàÇÒ ¼ö ÀÖ´Ù. ÀÌ ±â´ÉÀº ÀϹÝÀûÀ¸·Î ÃֽŠGPU°¡ Á¦°øÇÏ´Â ¼º´ÉÀ» ¸ðµÎ ÇÊ¿ä·Î ÇÏÁö ¾Ê´Â AI Ãß·Ð ÀÛ¾÷¿¡ À¯¿ëÇÏ´Ù. ¿¹ÄÁ´ë »ç¿ëÀÚ´Â 20GBÀÇ ¸Þ¸ð¸®¸¦ °®Ãá 2°³ÀÇ MIG ÀνºÅͽº ȤÀº 10GBÀÇ 3°³ ÀνºÅϽº, 5GBÀÇ 7°³ ÀνºÅϽº¸¦ »ý¼ºÇÒ ¼ö ÀÖ¾î °¢°¢ÀÇ ¿öÅ©·Îµå¿¡ ¸Â´Â ÃÖÀûÀÇ Á¶ÇÕÀ» ¸¸µé ¼ö ÀÖ´Ù.
MIG´Â GPU ÀνºÅϽº¸¦ Â÷´Ü½ÃÅ°¹Ç·Î °áÇ԰ݸ®(fault isolation) ±â´ÉÀ» Á¦°øÇÏ¿© ÇÑ ÀνºÅϽºÀÇ ¹®Á¦°¡ µ¿ÀÏÇÑ GPU¿¡¼ ½ÇÇàµÇ´Â ´Ù¸¥ »ç¿ëÀÚ¿¡°Ô ¿µÇâÀ» ÁÖÁö ¾Ê´Â´Ù. °¢ ÀνºÅϽº´Â º¸ÀåµÈ QoS¸¦ Á¦°øÇØ »ç¿ëÀÚÀÇ ¿öÅ©·Îµå°¡ ¿¹»óµÇ´Â ·¹ÀÌÅϽÃ(Áö¿¬½Ã°£)°ú 󸮷®À» È®º¸ÇÒ ¼ö ÀÖµµ·Ï ÇÑ´Ù.
Ŭ¶ó¿ìµå ¼ºñ½ºÁ¦°ø¾÷ü¿Í ±× ¿ÜÀÇ ±â¾÷Àº MIG¸¦ ÅëÇØ GPU ¼¹öÀÇ È°¿ë·üÀ» Çâ»ó½ÃÄÑ »ç¿ëÀÚ¿¡°Ô ÃÖ´ë 7¹è ¸¹Àº GPU ÀνºÅϽº¸¦ Á¦°øÇÒ ¼ö ÀÖ´Ù. ±¸±Û Ŭ¶ó¿ìµåÀÇ ¼ö¼® ¼ÒÇÁÆ®¿þ¾î ¿£Áö´Ï¾î ÆÀ ȣŲ (Tim Hockin)Àº “¿£ºñµð¾Æ´Â ±¸±Û Ŭ¶ó¿ìµåÀÇ Àü·ÂÀû ÆÄÆ®³Ê·Î °í°´À» À§ÇØ Çõ½ÅÀ» °ÅµìÇÏ°í ÀÖ´Ù. MIG´Â °øÀ¯ Äí¹ö³×Ƽ½º(Kubernetes) Ŭ·¯½ºÅÍ¿¡¼ GPUÀÇ È¿À²¼º°ú È°¿ëµµ¸¦ »õ·Î¿î ¼öÁØÀ¸·Î ²ø¾î¿Ã¸°´Ù. ±¸±Û Ŭ¶ó¿ìµå´Â ¿£ºñµð¾Æ, ±×¸®°í Äí¹ö³×Ƽ½º Ä¿¹Â´ÏƼ¿Í Çù·ÂÇØ ÀÌ·¯ÇÑ °øÀ¯ GPU È°¿ë»ç·Ê¸¦ ¸¸µé¾î³»°í, À̸¦ ±¸±Û Äí¹ö³×Ƽ½º ¿£Áø(Google Kubernetes Engine)À» ÅëÇØ ÀÌ¿ëÇÒ ¼ö Àֱ⸦ ±â´ëÇÑ´Ù”¶ó°í ¸»Çß´Ù.
MIG·Î Ãß·ÐÀÛ¾÷ ÃÖÀûÈ °¡´ÉÇØÁ®
±â¾÷Àº MIG¸¦ ÅëÇØ AI ¸ðµ¨ÀÇ °³¹ß°ú ¹èÆ÷¼Óµµ¸¦ Çâ»ó½Ãų ¼ö ÀÖ´Ù. MIG´Â ÃÖ´ë 7¸íÀÇ µ¥ÀÌÅÍ »çÀ̾ðƼ½ºÆ®°¡ Àü¿ë GPU¿Í °°Àº ±â´É¿¡ µ¿½Ã¿¡ ¾×¼¼½ºÇÒ ¼ö ÀÖÀ¸¹Ç·Î ÃÖÀûÀÇ Á¤È®¼º°ú ¼º´ÉÀ» À§ÇØ µö ·¯´× ¸ðµ¨À» ¼¼ºÎÀûÀ¸·Î Á¶Á¤ÇÒ ¼ö ÀÖ´Ù. ÀÌ´Â ½Ã°£ÀÌ ¸¹ÀÌ ¼Ò¿äµÇÁö¸¸, ¸¹Àº ÄÄÇ»Æà ¼º´ÉÀÌ ÇÊ¿äÇÏÁö ¾Ê´Â´Ù.
¸ðµ¨À» ½ÇÇàÇÒ Áغñ°¡ µÇ¸é MIG´Â ´ÜÀÏ GPU¿¡¼ Çѹø¿¡ ÃÖ´ë 7°³ÀÇ Ãß·ÐÀÛ¾÷À» ÇÒ ¼ö ÀÖ´Ù. ÀÌ·± ÀÛ¾÷¿¡´Â GPU Àüü¸¦ »ç¿ëÇÒ ÇÊ¿ä°¡ ¾ø°í ·¹ÀÌÅϽð¡ ªÀº ÀÛÀº ¸ðµ¨À» »ç¿ëÇÏ´Â ¹èÄ¡-1 Ãß·Ð ¿öÅ©·Îµå°¡ °¡Àå ÀûÇÕÇÏ´Ù.
¹Ì±¹ÀÇ ÁÖ¹®Çü ¹è¼Û¾÷ü Æ÷½ºÆ®¸ÞÀÌÃ÷(Postmates)ÀÇ AI µð·ºÅÍ Á¨À¯ ±Å(Zhenyu Guo)´Â “¿£ºñµð¾Æ ±â¼úÀº ¿ì¸®ÀÇ ¹è´Þ ·Îº¿ Ç÷§Æû ¼ºê(Serve)¿¡ ÀÖ¾î ¸Å¿ì Áß¿äÇÏ´Ù. MIG¸¦ »ç¿ëÇϸé ÄÄÇ»Æà ¸®¼Ò½º¸¦ ¿ªµ¿ÀûÀ¸·Î À籸¼ºÇÏ¿© º¯ÈÇÏ´Â ¿öÅ©·Îµå ¿ä±¸¸¦ ÃæÁ·½ÃÅ°°í Ŭ¶ó¿ìµå ±â¹Ý ÀÎÇÁ¶ó¸¦ ÃÖÀûÈÇÏ¿© ÃÖ´ëÀÇ È¿À²¼º°ú ºñ¿ë Àý°¨À» ´©¸± ¼ö ÀÖÀ¸¹Ç·Î ¹èÆ÷µÈ ¸ðµç GPU¸¦ ÃÖ´ëÇÑ È°¿ëÇÒ ¼ö ÀÖ´Ù”°í ¸»Çß´Ù.
IT·µ¥ºê¿É½º(DevOps) ±¸Ãà
»ç¿ëÀÚµéÀº AI¿Í HPC¿ë MIG¸¦ È°¿ëÇϱâ À§ÇØ Äí´Ù(CUDA) ÇÁ·Î±×·¡¹Ö ¸ðµ¨À» º¯°æÇÒ ÇÊ¿ä°¡ ¾ø´Ù. MIG´Â Äí¹ö³×Ƽ½º¿Í ÄÁÅ×À̳ʻӸ¸ ¾Æ´Ï¶ó ±âÁ¸ÀÇ ¸®´ª½º(Linux) ¿î¿µ üÁ¦¿¡µµ ±¸µ¿µÈ´Ù. MIG´Â A100¿ëÀ¸·Î Á¦°øµÈ ¼ÒÇÁÆ®¿þ¾î¿¡µµ ÀÛµ¿µÈ´Ù. ÀÌ´Â GPU µå¶óÀ̹ö, °ð ¹èÆ÷µÉ ¿¹Á¤ÀÎ ¿£ºñµð¾Æ Äí´Ù 11 ¼ÒÇÁÆ®¿þ¾î, ¾÷µ¥ÀÌÆ®µÈ ¿£ºñµð¾Æ ÄÁÅ×ÀÌ³Ê ·±Å¸ÀÓ, ¿£ºñµð¾Æ µð¹ÙÀ̽º Ç÷¯±×ÀÎ(NVIDIA Device Plugin)À» ÅëÇÑ Äí¹ö³×Ƽ½ºÀÇ »õ·Î¿î ¸®¼Ò½º À¯ÇüÀÌ Æ÷ÇԵȴÙ.
MIG¿Í ÇÔ²² ¿£ºñµð¾Æ ¹öÃß¾ó ÄÄÇ»ÅÍ ¼¹ö(vComputeServer)¸¦ »ç¿ëÇϸé RHV(Red Hat Virtualization)¿Í VM¿þ¾î v½ºÇǾî(VMware vSphere)¿Í °°Àº ÇÏÀÌÆÛ¹ÙÀÌÀúÀÇ °ü¸®¿Í ¸ð´ÏÅ͸µ ±â´É Á¦°øÀÌ °¡´ÉÇÏ´Ù. ¶ÇÇÑ, ½Ç½Ã°£ ¸¶À̱׷¹À̼ǰú ¸ÖƼ Å×³Í½Ã¿Í °°Àº ¸¹ÀÌ »ç¿ëµÇ´Â ±â´É Áö¿øµµ °¡´ÉÇÏ´Ù.
·¹µå ÇÞ(Red Hat)ÀÇ ¸¶ÄÉÆà µð·ºÅÍ Ã´ ´õºäÅ©(Chuck Dubuque)´Â “°í°´µéÀº °¡»ó ½Ã½ºÅÛ¿¡¼ ½ÇÇàµÇ´Â ¸ÖƼ Å׳ÍÆ® ¿öÅ© Ç÷ο츦 °ü¸®ÇÏ¸é¼ °Ý¸®¿Í º¸¾È ±â´Éµµ Á¦°øÇØ¾ß ÇÒ Çʿ並 Á¡Á¡ ´õ ´À³¢°í ÀÖ´Ù. ¿£ºñµð¾Æ A100 GPUÀÇ »õ·Î¿î ¸ÖƼ ÀνºÅϽº GPU ±â´ÉÀ» ÅëÇØ Å¬¶ó¿ìµå¿¡¼ ¿§Áö±îÁö ·¹µå ÇÞ Ç÷§Æû¿¡¼ ½ÇÇàµÇ´Â AI °¡¼Ó ¿öÅ©·Îµå°¡ °¡´ÉÇØÁø´Ù"¶ó°í ¼Ò°¨À» ¹àÇû´Ù.
»ç¿ëÀÚ°¡ ¿£ºñµð¾Æ A100°ú ÇØ´ç ¼ÒÇÁÆ®¿þ¾î¸¦ »ç¿ëÇÏ¸é ¸¶Ä¡ ½ÇÁ¦ ¹°¸®Àû GPU¿¡¼Ã³·³ »õ·Î¿î GPU ÀνºÅϽº¿¡¼ ÀÛ¾÷À» üũÇÏ°í ½ºÄÉÁÙ¸µ ÇÒ ¼ö ÀÖ´Ù. |