¿Âµð¹ÙÀ̽º À½¼º AI ±â¼úÀ» °³¹ßÇÏ´Â ÇÁ·¹¸®½ºÄí³Ê°¡ ¼¼°èÀû ±ÇÀ§ÀÇ À½¼º·À½Çâ·½Åȣó¸® Çмú´ëȸ 'ICASSP 2024'¿¡¼ ³í¹®ÀÌ Ã¤Åõƴٰí 19ÀÏ ¹àÇû´Ù.
±¹Á¦ Àü±âÀüÀÚ°øÇÐÇùȸ(IEEE)°¡ ÁÖÃÖÇÏ´Â 'ICASSP 2024'´Â ¿ÃÇØ ¼¿ï ÄÚ¿¢½º ÄÁº¥¼Ç ¼¾ÅÍ¿¡¼ Áö³ 14ÀϺÎÅÍ ´å»õ°£ ¿·È´Ù. ±¸±Û, ¾ÖÇÃ, ¾Æ¸¶Á¸, »ï¼ºÀüÀÚ, Çö´ëÂ÷ µî ¼¼°èÀû ±â¾÷°ú Àü ¼¼°è ÀΰøÁö´É ºÐ¾ß ¿¬±¸ÀÚ 4000¿©¸íÀÌ Âü¼®Çß´Ù.
À̹ø¿¡ äÅÃµÈ ÇÁ·¹¸®½ºÄí³ÊÀÇ ³í¹® 'WAV2VEC-VC: VOICE CONVERSION VIA HIDDEN REPRESENTATIONS OF WAV2VEC 2.0'Àº ÈÀÚ¿¡ ´ëÇÑ ¾î¶°ÇÑ »çÀü Á¤º¸ ¾øÀ̵µ À½¼º º¯Á¶(voice conversion)°¡ °¡´ÉÇÑ ´ÙÁß ÈÀÚ À½¼º º¯Á¶ ±â¼úÀÌ ¼Ò°³µÆ´Ù.
¿¹¸¦ µé¾î AÈÀÚÀÇ À½¼ºÀ» BÈÀÚÀÇ ¸ñ¼Ò¸®·Î º¯È¯ÇÏ°íÀÚ ÇÒ ¶§, AÈÀÚ À½¼º¿¡¼ ¾ð¾îÀûÀÎ Á¤º¸¸¦ ÃßÃâÇÏ°í BÈÀÚ À½¼º¿¡¼ ¸ñ¼Ò¸® Á¤º¸¸¦ ÃßÃâÇÑ ÈÄ µÎ Á¤º¸¸¦ °áÇÕÇÏ¿© AÈÀÚ°¡ ¹ßÈÇÑ ³»¿ëÀ» BÈÀÚÀÇ ¸ñ¼Ò¸®·Î ¹ßÈÇÑ À½¼ºÀ» ÇÕ¼ºÇس½´Ù.
ƯÈ÷ ÇØ´ç ±â¼ú¿¡¼´Â ¸ÞŸ¿¡¼ °³¹ßÇÑ ÀÚ±â Áöµµ ÇнÀ À½¼º Ç¥Çö 'wav2vec 2.0'À» È°¿ëÇØ ÀÔ·Â À½¼º¿¡¼ ÈÀÚÀÇ ¸ñ¼Ò¸® ¹× ¾ð¾îÀûÀÎ Á¤º¸¸¦ È¿°úÀûÀ¸·Î ÃßÃâÇϴµ¥ ¼º°øÇß´Ù.
±è±â¿¬ ÇÁ·¹¸®½ºÄí³Ê ´ëÇ¥´Â "À̹ø ¿¬±¸ °á°ú´Â ´Ü¼øÈ÷ À½¼º º¯Á¶ ÀÛ¾÷¿¡¸¸ ±¹ÇÑµÉ °ÍÀÌ ¾Æ´Ï¶ó ¿©·¯ À½¼º ÀÛ¾÷(ÈÀÚ ÀνÄ, ÈÀÚ ºÐÇÒ, À½Áú °³¼±, À½¼º ÀÎ½Ä µî)¿¡ Àû¿ëÀÌ °¡´ÉÇÒ °ÍÀ¸·Î ±â´ëµÈ´Ù"¸ç "»ç¿ëÀÚ °£ À½¼º ÆÄÀÏÀ» °øÀ¯ÇÒ ¶§ ÇØ´ç ±â¼úÀ» Àû¿ëÇØ ¿øº» ÈÀÚÀÇ ¸ñ¼Ò¸®¸¦ À͸íÈÇÔÀ¸·Î½á °³ÀÎÁ¤º¸ À¯ÃâÀ» ¹æÁöÇÒ °Í"À̶ó°í ¸»Çß´Ù.
ÇÁ·¹¸®½ºÄí³Ê´Â ¿Âµð¹ÙÀ̽º À½¼º AI ±â¼ú°ú °³ÀÎÁ¤º¸º¸È£ ±â¼úÀ» °³¹ßÇÏ´Â ½ºÅ¸Æ®¾÷ÀÌ´Ù. Áö³ÇØ 8¿ù ¹ýÀμ³¸³ ÀÌÈÄ 2°³¿ù¸¸¿¡ ºí·çÆ÷ÀÎÆ®ÆÄÆ®³Ê½º·ÎºÎÅÍ ½ÃµåÅõÀÚ¸¦ À¯Ä¡ÇÏ°í ÇÙ½É ±â¼úÀ» °íµµÈÇÏ°í ÀÖ´Ù. |