`Æ®·£½ºÆ÷¸Ó` ÀÕ´Â ÃÊÃÊ°Å´ë AI ¿À³ª¡¦ ±¸±Û, `ŸÀÌźÁî` °ø°³
ÀÔ·Â: 2025-01-16 16:40
Æص¿Çö ±âÀÚ
»õ ¾ÆÅ°ÅØó ³í¹® ¹ßÇ¥ÇÑ ¿¬±¸Áø
"LLM¡¤RNN Á¢¸ñÇØ °íÀ¯ÇÑ°è ±Øº¹
´õ ÀûÀº ÆĶó¹ÌÅÍ·Î GPT-4 ´É°¡"
"LLM¡¤RNN Á¢¸ñÇØ °íÀ¯ÇÑ°è ±Øº¹
´õ ÀûÀº ÆĶó¹ÌÅÍ·Î GPT-4 ´É°¡"
"Æ®·£½ºÆ÷¸Ó ¾ÆÅ°ÅØó¸¦ ÀÕ´Â ÃÊÃÊ°Å´ë ÀΰøÁö´É(AI) ±â¼úÀÌ µîÀåÇϳª."
±¸±ÛÀÌ ÇöÀçÀÇ ´ëÇü¾ð¾î¸ðµ¨(LLM)ÀÇ ÇѰ踦 ±Øº¹Çϱâ À§ÇÑ »õ·Î¿î ¾ÆÅ°ÅØó¸¦ ¼±º¸¿´´Ù. Àΰ£ÀÌ ±â¾ïÇÏ´Â ¹æ½ÄÀ» ¸ð¹æÇØ ÀΰøÁö´É(AI)ÀÇ ¸Þ¸ð¸® ¹æ½ÄÀ» ±¸Çö, º¸´Ù È¿À²ÀûÀÌ¸é¼ ±â¾ï¡¤ÇнÀµµ ´õ ÀßÇÏ´Â ¸ðµ¨ÀÌ µîÀåÇÒ °ÍÀ¸·Î ±â´ëÇÑ´Ù.
ÃÖ±Ù ±¸±Û ¿¬±¸ÁøÀº 'ŸÀÌźÁî(Titans)'¶ó ¸í¸íÇÑ »õ·Î¿î '½Å°æ Àå±â ±â¾ï ¸ðµâ(neural long-term memory module)'¿¡ ´ëÇÑ ³í¹®(Titans: Learning to Memorize at Test Time)À» ¿¬±¸¼º°ú °øÀ¯ »çÀÌÆ®ÀÎ ¾ÆÄ«À̺꿡 ¿Ã·È´Ù. À̸¦ ÀÛ¼ºÇÑ ¾Ë¸® º£·çÁî, ÆäÀ̸° Á¾, ¹ÙÇÕ ¹Ì·ÎÅ©´Ï µî ±¸±Û ¿¬±¸¿ø 3ÀÎÀº À̸¦ ±â¹ÝÀ¸·Î ÇÑ AI¸ðµ¨ÀÌ ¾ð¾î ¸ðµ¨¸µ, »ó½Ä Ãß·Ð, À¯Àüü ºÐ¼®, ½Ã°è¿ ÀÛ¾÷ µî¿¡ ´õ¿í È¿°úÀû¡¤È¿À²ÀûÀ¸·Î ÀÛµ¿ÇÒ °ÍÀ̶ó°í ¹àÇû´Ù.
³í¹®Àº ÇöÀç LLMÀÇ ±â¹ÝÀÎ Æ®·£½ºÆ÷¸Ó ±¸Á¶¿Í ±âÁ¸ µö·¯´× ±â¼úÀÎ ¼øȯ½Å°æ¸Á(RNN)À» Á¢¸ñ, °¢°¢ÀÌ °¡Áø ÇѰ踦 ±Øº¹ÇÏ´Â °ÍÀÌ ÇÙ½ÉÀÌ´Ù. ƯÈ÷ ±ä ¹®¸Æ(ÄÜÅؽºÆ®) Á¤º¸¸¦ È¿À²ÀûÀ¸·Î ÀúÀåÇÏ°í È°¿ëÇÒ ¼ö ÀÖ´Â Àå±â ¸Þ¸ð¸®(long-term memory)¸¦ µµÀÔ, ½Ã°£¿¡ Áö³²¿¡ µû¶ó ´ë·®ÀÇ Á¤º¸¸¦ ó¸®ÇÏ´Â ¹æ½ÄÀ» °³¼±Çß´Ù. ÆÄÀÌÅäÄ¡¿Í JAX·Î ±¸ÇöµÆÀ¸¸ç, ¸ðµ¨ ÈƷá¤Æò°¡¿¡ ¾²ÀÎ Äڵ嵵 °ð °ø°³ÇÒ °èȹÀÌ´Ù.
¾îÅÙ¼Ç ±â¹Ý Æ®·£½ºÆ÷¸Ó´Â ªÀº ¹®¸Æ ³» °ü°è(Á¾¼Ó¼º)¸¦ ¸ðµ¨¸µÇÏ´Â µ¥ °·ÂÇÏÁö¸¸, ¹®¸ÆÀÌ ±æ¾îÁö¸é ¿¬»ê ¹× ¸Þ¸ð¸® ºñ¿ëÀÌ ±âÇϱ޼öÀûÀ¸·Î Áõ°¡ÇÏ´Â ¹®Á¦°¡ ÀÖ´Ù. RNN°ú ¼±Çü Æ®·£½ºÆ÷¸Ó ¹æ½ÄÀº ¸Þ¸ð¸® »ç¿ë·®À» ÁÙÀ̱â À§ÇØ Á¤º¸¸¦ ¾ÐÃàÇØ ÀúÀåÇÏÁö¸¸, ÀÌ´Â Á¤º¸¼Õ½ÇÀ» ÃÊ·¡ÇÏ°í ±ä ¹®¸Æ Á¤º¸¸¦ È¿°úÀûÀ¸·Î È°¿ëÇÏÁö ¸øÇÒ ¼ö ÀÖ´Ù.
±¸±ÛÀÇ »õ ¾ÆÅ°ÅØó´Â ´Ü±â, Àå±â, ÀÛ¾÷ ±â¾ïÀ¸·Î ³ª´² Á¤º¸¸¦ ÀúÀ塤Ȱ¿ëÇÏ´Â Àΰ£ ³úÀÇ ±â¾ï ±¸Á¶¸¦ ¸ð¹æÇß´Ù. ¡âÆ®·£½ºÆ÷¸ÓÀÇ ¾îÅÙ¼Ç ¸ÞÄ¿´ÏÁòÀ» »ç¿ëÇØ ÇöÀçÀÇ ¹®¸Æ µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â ´Ü±â¸Þ¸ð¸® ÄÚ¾î ¡â°ú°Å µ¥ÀÌÅ͸¦ Å×½ºÆ® °úÁ¤¿¡¼µµ ÇнÀ¡¤ÀúÀåÇϸç ÇÊ¿ä ½Ã °Ë»ö(retrieve)µµ ÇÏ´Â Àå±â¸Þ¸ð¸® ¡âƯÁ¤ ŽºÅ©¿¡ ´ëÇÑ »çÀüÁö½ÄÀ» ÀúÀåÇÏ´Â µ¶¸³Àû ÆĶó¹ÌÅÍÀÎ Áö¼Ó(Persistent) ¸Þ¸ð¸® µî 3°³ ÁÖ¿ä ¸ðµâÀ» ±¸¼ºÇÏ°í Á¤º¸Ã³¸® ¹æ½ÄÀ» °áÇÕÇß´Ù.
'ŸÀÌźÁî'´Â Àΰ£ÀÌ ÀλóÀûÀÎ °ÍÀ» ´õ Àß ±â¾ïÇÏ´Â ¸éµµ ¸ð¹æÇß´Ù. ÀÔ·Â µ¥ÀÌÅÍ°¡ °ú°Å µ¥ÀÌÅÍ¿Í ¾ó¸¶³ª ´Ù¸¥Áö '³î¶ó¿ò(surprise)' ÁöÇ¥·Î ÃøÁ¤, ³ôÀº °ªÀÇ Á¤º¸´Â ´õ °ÇÏ°Ô ÇнÀÇÏ´Â µ¿½Ã¿¡ 'ÀûÀÀÇü ¸Á°¢(Adaptive Forgetting)' ¸ÞÄ¿´ÏÁòÀ» ÅëÇØ Áߺ¹ µî °ªÀÌ ¶³¾îÁö´Â Á¤º¸¸¦ Á¦°ÅÇϱ⵵ ÇÑ´Ù. ÀÌ·± È¿À²ÀûÀÎ Á¢±Ù¹æ½ÄÀ» ÅëÇØ Á¤È®µµ¸¦ ÀÒÁö ¾ÊÀ¸¸é¼ ¼ö¸¹Àº µ¥ÀÌÅÍ Æ÷ÀÎÆ®¸¦ ó¸®ÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù.
±× ¼º´É°ú È¿À²¼ºÀº ±âÁ¸ ¾ð¾î¸ðµ¨µéÀÇ ¹æ½ÄÀ» ´É°¡ÇÒ °ÍÀ¸·Î ±â´ëµÈ´Ù. ³í¹®¿¡ µû¸£¸é 200¸¸ ÅäÅ« ÀÌ»óÀÇ ¹®¸Æ¿¡¼µµ ³ôÀº Á¤È®µµ¸¦ À¯Áö, ±âÁ¸ ¸ðµ¨ÀÌ ±ä ¹®¸Æ¿¡¼ ¼º´ÉÀÌ ±Þ°ÝÈ÷ ÀúÇϵǴ ¹®Á¦¸¦ ±Øº¹Çß´Ù. Áß¿äµµ¸¦ µûÁ® ±â¾ï¡¤¸Á°¢ÇÏ´Â ¸ÞÄ¿´ÏÁò ´öºÐ¿¡ Á¤È®ÇÏ°Ô Á¤º¸¸¦ ã¾Æ³Â´Ù. ±ä ¹®¸Æ¿¡¼ÀÇ º¹ÀâÇÑ Ãß·Ð ÀÛ¾÷À» Æò°¡ÇÏ´Â º¥Ä¡¸¶Å©(BABILong)¿¡¼± ´õ ÀûÀº ÆĶó¹ÌÅͷεµ ¿ÀÇÂAI GPT-4³ª ¸ÞŸ ¶ó¸¶3¸¦ ´É°¡ÇÏ´Â ¼º´ÉÀ» ¹ßÈÖÇß´Ù.
'ŸÀÌźÁî'´Â ¡âÇöÀç ¹®¸Æ¿¡ ¸Þ¸ð¸®ÀÇ °ú°Å µ¥ÀÌÅ͸¦ °áÇÕÇØ ´õ ³ªÀº ÀÇ»ç°áÁ¤À» Áö¿øÇÏ´Â 'ÄÜÅؽºÆ®Çü ¸Þ¸ð¸®(MAC)' ¡âªÀº ¹®¸Æ°ú ±ä ¹®¸Æ Á¤º¸¸¦ °ÔÀÌÆÃ(gating)À¸·Î ÅëÇÕÇØ ±ÕÇü ÀÖ°Ô »ç¿ëÇÏ´Â '°ÔÀÌÆ®Çü ¸Þ¸ð¸®(MAG)' ¡âÀå±â¸Þ¸ð¸®¸¦ ½Å°æ¸ÁÀÇ ÇÑ ÃþÀ¸·Î ÅëÇÕÇØ Ã³¸®ÇÏ´Â º¸´Ù ´Ü¼øÇÑ ±¸Á¶ÀÎ '·¹À̾îÇü ¸Þ¸ð¸®(MAL)' µî 3°¡Áö ¾ÆÅ°ÅØó º¯ÇüÀ» Áö³æ´Ù.
Á¶Á¤È£ ¾÷½ºÅ×ÀÌÁö AI¸®¼Ä¡¿£Áö´Ï¾î´Â "ŸÀÌźÁî´Â ±âÁ¸ Æ®·£½ºÆ÷¸ÓÀÇ ÇÑ°è·Î ÁöÀûµÈ Àå±â ÀÇÁ¸¼º ¹®Á¦¸¦ Àå±â±â¾ï¸ðµâ°ú ¿µ±¸±â¾ï¸ðµâ µî Àΰ£ÀÇ ±â¾ï ½Ã½ºÅÛÀ» ¸ð¹æÇÑ ¹æ½ÄÀ¸·Î ÇØ°á, ƯÈ÷ ±ä ¹®¸ÆÀÇ Ã³¸®¿¡¼ ´Ù¸¥ ¹æ¹ý·Ð ´ëºñ Å« ÆøÀÇ ¼º´É Çâ»óÀ» ±â·ÏÇß´Ù"¸ç "±âÁ¸ Æ®·£½ºÆ÷¸Ó¸¦ ´ëüÇÒ ¾ÆÅ°ÅØó·Î ±â´ë°¡ ³ô´Ù. ´Ù¸¸ ¶ó¸¶ µî ÃֽŠ¸ðµ¨°ú ºñ½ÁÇÑ µ¥ÀÌÅÍ·Î ÇнÀÇßÀ» ¶§ ¼º´É Â÷À̸¦ ºñ±³ÇغÁ¾ß ÇÒ °Í"À̶ó ¹àÇû´Ù.
Æص¿Çö±âÀÚ dhp@dt.co.kr
[ ÀúÀÛ±ÇÀÚ ¨ÏµðÁöÅПÀÓ½º, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö ]