µðÁöÅПÀÓ½º

 


¼þ½Ç´ë ±Ç¹ÎÇý ±³¼öÆÀ, ½ÉÃþ°­È­ÇнÀ ±â¹Ý ÀÚÀ²ÁÖÇà ¹× ¾ÈÁ¤¼º Æò°¡ ±â¼ú °³¹ß

ÇÁ¸°Æ® ÆäÀ̽ººÏ Æ®À§ÅÍ Ä«Ä«¿À½ºÅ丮
¼þ½Ç´ë ±Ç¹ÎÇý ±³¼öÆÀ, ½ÉÃþ°­È­ÇнÀ ±â¹Ý ÀÚÀ²ÁÖÇà ¹× ¾ÈÁ¤¼º Æò°¡ ±â¼ú °³¹ß
¼þ½Ç´ë ±Ç¹ÎÇý ±³¼öÆÀ, ½ÉÃþ°­È­ÇнÀ ±â¹Ý ÀÚÀ²ÁÖÇà ¹× ¾ÈÁ¤¼ºÆò°¡ ±â¼ú °³¹ß.<¼þ½Ç´ë Á¦°ø>

¼þ½Ç´ëÇб³(ÃÑÀå Àå¹ü½Ä) ÀüÀÚÁ¤º¸°øÇкΠ±Ç¹ÎÇý ±³¼ö ¿¬±¸ÆÀÀÌ ½ÉÃþ °­È­ÇнÀ ±â¹ÝÀÇ ÀÚÀ²ÁÖÇà ¹× ¾ÈÁ¤¼º Æò°¡ ±â¼úÀ» °³¹ßÇß´Ù°í 1ÀÏ ¹àÇû´Ù.

ÀÚÀ²ÁÖÇ࿬±¸°¡ °¡¼ÓÈ­µÊ¿¡ µû¶ó Àΰ£ ÁÖÇà Â÷·®°ú ÀÚÀ²ÁÖÇà Â÷·®ÀÌ °øÁ¸ÇÏ´Â µµ·Î¿¡¼­ÀÇ ÀÚÀ²ÁÖÇà Â÷·®ÀÇ ¾ÈÁ¤ÀûÀÎ ÁÖÇàÀ» À§ÇÑ ¿¬±¸°¡ È°¹ßÈ÷ ÁøÇàµÇ°í ÀÖ´Ù. ÇÏÁö¸¸ Àΰ£ ÁÖÇà Â÷·®ÀÌ ÀÚÀ²ÁÖÇà Â÷·®°ú È¥ÀçµÈ ȯ°æ¿¡¼­ ÀÚÀ²ÁÖÇà Â÷·®ÀÇ ÀÇ»ç°áÁ¤¿¡ µû¸¥ ¾ÈÁ¤¼º Æò°¡ ±â¼ú¿¡ ´ëÇÑ ¿¬±¸´Â ¾ÆÁ÷ ºÎÁ·ÇÏ´Ù. ƯÈ÷ Áö¿ªÀû¡¤½Ã°£Àû Ư¼º¿¡ µû¶ó Àΰ£ ÁÖÇà Â÷·® ÇൿÀÇ ºÒÈ®½Ç¼º Á¤µµ´Â ¸Å¿ì ´Ù¾çÇѵ¥, ´Ù¾çÇÑ µµ·Î ȯ°æ¿¡¼­ ÀÚÀ²ÁÖÇà Â÷·®ÀÇ ¾ÈÁ¤¼º Æò°¡´Â ÀÚÀ²ÁÖÇàÂ÷ »ó¿ëÈ­¸¦ À§ÇØ ÇʼöÀûÀ¸·Î ¼±ÇàµÅ¾ß ÇÑ´Ù.

±Ç ±³¼öÆÀÀÌ Á¦¾ÈÇÑ ½ÉÃþ°­È­ÇнÀ ¹æ½ÄÀº ±âÁ¸ÀÇ ¹æ½Ä°ú ´Þ¸® °³º° Â÷·®ÀÇ ºÎºÐ °üÃø Á¤º¸¸¸À» ÀÌ¿ëÇÏ´Â ºÎºÐ°üÂû ¸¶¸£ÄÚÇÁ ÀÇ»ç°áÁ¤ ¸ðµ¨(partially observable Markov decision process model)À» ±â¹ÝÀ¸·Î ÇнÀÀÌ ÀÌ·ïÁø´Ù. ÀÌ´Â ½ÇÁ¦ µµ·Î¿¡¼­ ÀÚÀ²ÁÖÇà Â÷·®ÀÌ µµ·Î Àüü°¡ ¾Æ´Ñ ÁÖº¯ÀÇ Á¤º¸¸¸ ¾òÀ» ¼ö ÀÖ´Ù´Â Á¡À» ¹Ý¿µÇÑ °ÍÀ¸·Î, ÇØ´ç ±â¼úÀÇ ½ÃÀå È°¿ë °¡´É¼ºÀÌ ¸Å¿ì Å©´Ù. ¶ÇÇÑ ¾ÈÁ¤¼º Æò°¡¸¦ À§ÇØ ÇʼöÀûÀÎ µµ·Î¸¦ ±¸¼ºÇÏ´Â ÀÏ¹Ý Â÷·®ÀÇ ÁÖÇà Á¤Ã¥À» ¹Ì±¹ LA¿¡¼­ ¼öÁýµÈ ½ÇÁ¦ ÁÖÇà µ¥ÀÌÅͼÂÀ» ÀÌ¿ëÇØ ¸ð¹æ ÇнÀ(imitation learning) ¹æ½ÄÀ¸·Î ÇнÀÇÏ¿´´Ù´Â Á¡¿¡¼­ ±âÁ¸ ¿¬±¸µéº¸´Ù Çö½ÇÀûÀ̶ó°í ÇÒ ¼ö ÀÖ´Ù.

ÀÌ¿Í ÇÔ²² ±Ç ±³¼öÆÀÀÌ Á¦¾ÈÇÑ ¾ÈÁ¤¼º Æò°¡´Â ÀÚÀ²ÁÖÇà Â÷·®ÀÇ ÁÖÇà ¾ÈÁ¤¼º°ú ÇÔ²² ÀÚÀ²ÁÖÇà Â÷·®ÀÌ µµ·Î¿¡ ÅõÀԵǾúÀ» ¶§ Àüü ±³Åë Æ®·¡ÇÈÀÇ ¾ÈÁ¤¼ºÀ» Æò°¡Çϱ⠶§¹®¿¡ ¹Ì½ÃÀû¡¤°Å½ÃÀûÀÎ ºÎºÐÀÇ ¾ÈÁ¤¼ºÀ» ¸ðµÎ Æò°¡ÇÒ ¼ö ÀÖ´Ù. ¿¬±¸ÆÀÀº ÀÏ¹Ý Â÷·®ÀÇ ÁÖÇà ºÒ¾ÈÁ¤¼ºÀÌ Áõ°¡ÇÔ¿¡ µû¶ó ÀÚÀ²ÁÖÇà Â÷·® ¹× µµ·Î ÀüüÀÇ ºÒ¾ÈÁ¤¼ºÀÌ ¾î¶»°Ô º¯È­ÇÏ´ÂÁö¿¡ ´ëÇØ ÀÌ·ÐÀû ¹× ½ÇÇèÀûÀ¸·Î ºÐ¼®Çß´Ù. ¶ÇÇÑ, ÇнÀµÈ ÀÚÀ²ÁÖÇà Â÷·®ÀÇ °æ¿ì Á¦¾ÈµÈ ½ÉÃþ°­È­ÇнÀ ±â¹Ý ÀÚÀ²ÁÖÇà ±â¼úÀÌ ±âÁ¸ÀÇ Á¦¾î ÀÌ·Ð ±â¹Ý ÀÚÀ²ÁÖÇà Â÷·®°ú ºñ±³ÇÏ¿© ºÒ¾ÈÁ¤ÇÑ µµ·Î ȯ°æ¿¡ Àß ´ëÀÀÇÏ´Â ¾ÈÁ¤ÀûÀÎ ÁÖÇàÀ» ÇÏ´Â °ÍÀ» È®ÀÎÇß´Ù.

º» ¿¬±¸¸¦ ÁøÇàÇÑ À̵¿¼ö ¼®»ç°úÁ¤Àº "ÀÚÀ²ÁÖÇà°ú °°Àº ¹Ì¼Ç Å©¸®Æ¼ÄÃ(mission-critical) ±â¼úÀÇ °æ¿ì °³¹ß °úÁ¤¿¡¼­ ¾ÈÁ¤¼º ºÐ¼®ÀÌ ¼±ÇàµÇ¾î¾ß¸¸ ÇÏ´Â ÇʼöºÒ°¡°áÇÑ ¿ä¼ÒÀε¥, °ü·Ã ±â¼ú°³¹ß¿¡ ±â¿©Çß´Ù´Â Á¡¿¡¼­ Àǹ̰¡ ÀÖ´Ù"¶ó°í ¼Ò°¨À» ¹àÇû´Ù.


ÇÑÆí º» ±â¼úÀº ¼þ½Ç´ë À̵¿¼ö ¼®»ç°úÁ¤»ýÀÌ Á¦1 ÀúÀÚ, ±Ç¹ÎÇý ±³¼ö°¡ ±³½ÅÀúÀÚ·Î SCIE±Þ Àú³Î ¿¡ 'Stability Analysis in Mixed-autonomous Traffic with Reinforcement Learning'À̶ó´Â Á¦¸ñÀ¸·Î 10¿ù 19ÀÏ °ÔÀçµÆ´Ù. ´Â 1967³âºÎÅÍ ¹ßÇàµÇ¾î ¿Â »óÀ§ 10%´ëÀÇ ÃÖ»óÀ§ Àú³ÎÀÌ´Ù. ±è¼ºÁرâÀÚ illust76@dt.co.kr






[ ÀúÀÛ±ÇÀÚ ¨ÏµðÁöÅПÀÓ½º, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö ]