ºòµ¥ÀÌÅÍ ¼Ö·ç¼Ç ±â¾÷ ¢ß¸ðºñÁ¨(´ëÇ¥ À̸í±Ô)´Â ±âÁ¸ÀÇ ºòµ¥ÀÌÅÍ µ¥ÀÌÅͺ£À̽ºÀÎ ¾ÆÀ̸®½º DB(IRIS DB)¿¡ ¿ÀǼҽº ÇÁ·¹ÀÓ¿÷ÀÎ ½ºÆÄÅ©(Spark)¿ÍÀÇ ÅëÇÕÀ» ¿Ï·áÇß´Ù°í ¹àÇû´Ù.
À̹ø ÅëÇÕÀ» ÅëÇØ ¾ÆÀ̸®½º DB´Â ½ºÆÄÅ©¿¡¼ Á¦°øÇÏ´Â SQLÀ» ÅëÇÕÇÏ¿© Áö¿øÇÔÀ¸·Î½á ±âÁ¸ÀÇ ÀåÁ¡ÀÎ ½Ç½Ã°£ SQL ¼º´É°ú ÇÔ²² ½ºÆÄÅ©¸¦ ÅëÇÑ Àå±â°£ÀÇ SQL ¹× ¹èÄ¡¼º/´ëÈÇü SQLÀÇ ¼º´É±îÁö ÃÖ»óÀ¸·Î º¸ÀåÇÒ ¼ö ÀÖ°Ô µÇ¾ú´Ù. ´ë±Ô¸ð ºòÅ×ÀÌºí¿¡ ´ëÇÑ Á¶ÀÎ(JOIN) ¿¬»êÀ» Æ÷ÇÔÇÑ ¸ðµç SQL ºÐ¼® ÀÛ¾÷ÀÌ °¡´ÉÇØÁ® ±âÁ¸ÀÇ ´ÜÀÏ DBMS¿¡ ±â¹ÝÇÑ ·¹°Å½Ã(Legacy) ½Ã½ºÅÛÀ» ´ë±Ô¸ð ºÐ»ê º´·ÄÈÇÏ´Â ÀÛ¾÷¿¡ ¾ÆÀ̸®½º DB¸¦ È°¿ëÇÒ ¼ö ÀÖ´Ù´Â °ÍÀÌ Æ¯Â¡ÀÌ´Ù.
ÇϵÓÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÈ ºòµ¥ÀÌÅÍ ¿¡ÄÚ ½Ã½ºÅÛÀº Àúºñ¿ëÀ¸·Î ºÐ»ê ½Ã½ºÅÛ ±¸ÃàÀÌ °¡´ÉÇØ ¿ë·® È®´ëÀÇ Ãø¸é¿¡¼´Â ÀåÁ¡ÀÌ ÀÖÁö¸¸ ¹ÝÀÀ ¼Óµµ°¡ ¸Å¿ì ´À¸®±â ¶§¹®¿¡ Àå±â°£¿¡ °ÉÄ£ ¹èÄ¡ ºÐ¼®¿¡´Â ¿ëÀÌÇÏÁö¸¸ ºÐ ´ÜÀ§ ¹Ì¸¸ÀÇ ÂªÀº ¹ÝÀÀ ¼Óµµ¸¦ ÇÊ¿ä·Î ÇÏ´Â ÀÛ¾÷¿¡´Â ÀûÇÕÇÏÁö ¾Ê´Ù´Â ÁöÀûÀ» ¹Þ´Â´Ù. À̸¦ º¸¿ÏÇϱâ À§ÇØ ÇϵÓÀÇ ¿¡ÄÚ ½Ã½ºÅÛÀ» ±×´ë·Î À¯ÁöÇÏ¸é¼ ¼º´ÉÀ» Çâ»ó½ÃÅ°·Á´Â ´Ù¾çÇÑ ½Ãµµ Áß¿¡¼ ÃÖ±Ù µÎ°¢À» ³ªÅ¸³»°í ÀÖ´Â ¿ÀǼҽº ÇÁ·¹ÀÓ¿÷ÀÌ ½ºÆÄÅ©À̸ç, ÀÌ¿¡ SQLÀÌ Àû¿ëµÇ¾î SQL¿ÂÇϵÓ(SQL on Hadoop)¿¡ °¡¼Óµµ°¡ ºÙ°í ÀÖ´Â »óȲÀÌ´Ù.
¸ðºñÁ¨ ±èÇü±Ù ¿¬±¸¼ÒÀåÀº “½ºÆÄÅ©´Â ¸Þ¸ð¸® ±â¹ÝÀ¸·Î »ý¼ºµÇ´Â RDD(Resilient Distributed Datasets)À̶ó´Â µ¶Æ¯ÇÑ µ¥ÀÌÅÍ ±¸Á¶¸¦ È°¿ëÇØ ³ôÀº ¼º´ÉÀÇ ºÐ¼®À» °¡´ÉÇÏ°Ô ÇØÁØ´Ù”¸ç “°³¹ßÀÚÀÇ ÀÔÀå¿¡¼ ±âÁ¸ÀÇ ÇÏµÓ »ç¿ë°ú ºñ½ÁÇÑ ¼öÁØÀ¸·Î °³¹ßÇ쵂 ¼º´ÉÀº °ÅÀÇ 10¹è ÀÌ»ó ºü¸¥ °á°ú¸¦ ±â´ëÇÒ ¼ö ÀÖÀ» °Í”À̶ó°í °Á¶Çß´Ù.
ÇÑÆí, ¸ðºñÁ¨Àº ½ºÆÄÅ© ÀÌ¿Ü¿¡µµ ÇÏµÓ ±â¹Ý ¿ÀǼҽº¿ÍÀÇ È£È¯¼ºÀ» Áö¼ÓÀûÀ¸·Î °ÈÇØ ´Ù¾çÇÑ ÇüÅÂÀÇ ºòµ¥ÀÌÅÍ ½Ã½ºÅÛÀ» ±¸ÃàÇÒ ¿¹Á¤ÀÌ´Ù. ƯÈ÷ ±¹³»¿¡¼ °³¹ßµÈ ŸÁ¶ SQL¿£Áø°úÀÇ ÅëÇÕµµ °ø½ÄÀûÀ¸·Î ¹ßÇ¥ÇÒ ¿¹Á¤¿¡ ÀÖÀ¸¸ç ÀÌ´Â ¼ø¼ö ÅäÁ¾ ±â¼ú·Î ºòµ¥ÀÌÅÍ Ç÷§Æû Àüü¸¦ ±¸¼ºÇÒ ¼ö ÀÖ°Ô µÈ´Ù´Â Á¡¿¡¼ Å« Àǹ̰¡ ÀÖ´Ù. |