شناسهٔ خبر: 23092612 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: جوان | لینک خبر

دست‌هاي ياري‌رسان به روبات‌ها در جريان يادگيري‌شان كمك مي‌كنند

همانند نوزادان به روبات‌ها نيز مي‌توان كمك كرد ياد بگيرند چگونه در جهان فيزيكي عمل كنند. اين مسئله هدف محققان است تا روبات‌ها را با ظرافت راهنمايي كنند تا به بهترين وجه ممكن و همانند انسان‌ها در كارها مشاركت كنند.

صاحب‌خبر -
مارسيا او مالي ، مهندس دانشگاه Rice روششان را جهت آموزش روبات‌ها با به كار بردن بازخوردهاي ظريف فيزيكي در حالي كه روبات‌ها مشغول اجراي فعاليت‌هايي هستند، اصلاح كرده‌اند. هدف، ساده‌سازي آموزش روبات‌هايي است كه انتظار مي‌رود به شكل مؤثر شانه به شانه انسان‌ها مشغول به كار شوند. او در اين باره مي‌گويد: «از گذشته، نقش روبات‌ها بر عهده‌گيري كارهاي بي‌ارزشي بود كه مايل به انجام آنها نبوده‌ايم: توليد، خط مونتاژ، جوشكاري و رنگ‌آميزي. در حالي كه بيشتر تمايل پيدا مي‌كنيم اطلاعات شخصي‌مان را با دنياي فناوري به اشتراك بگذاريم، مثل شيوه ثبت تعداد گام‌هايي كه برداشته‌ام توسط ساعت‌مچي و فناوري در حال حركت به سمت سخت‌افزارهاي تعبيه شده نيز هست. پيش از اين روبات‌ها در خانه‌هايمان حضور داشته و به جارو كشيدن يا كنترل ترموستات‌ها يا كوتاه نمودن چمن‌ها مي‌پرداخته‌اند. فناوري با هر نوع شيوه‌اي به زندگي‌مان راه پيدا كرده است.

پيش از اين در آشپزخانه با Alexa حرف مي‌زدم، پس چرا ماشين‌هايي وجود نداشته باشند كه به شكل فيزيكي هم بتوان با آنها همكاري داشته باشيم؟ غالب پژوهشمان معطوف به ايمن ساختن تعاملات انسان-روبات است.» طبق اظهارات محققان، روبات‌هايي كه براي واكنش به تعامل انسان-روبات به كار مي‌رفتند به شكل مرسوم چنين تعاملاتي را مخل فرض كرده و رفتار اوليه‌شان را پس از خاتمه اين نوع تعاملات از سر مي‌گرفتند. محققان با روشي كه به انسان‌ها اجازه مي‌دهد به شكل فيزيكي حالت روبات را در زمان واقعي تنظيم كنند، دست به بهبود زده‌اند.  در قلب اين برنامه با مفهوم كنترل امپدانس كه شيوه‌اي است براي مديريت اتفاقي كه در جريان بروز اجبار روي مي‌دهد، مواجهيم. روباتي كه از طريق ورودي فيزيكي امكان كنترل امپدانس را مهيا مي‌كند، حالت برنامه‌ريزي شده‌اش را در برابر واكنش تنظيم مي‌كند ولي بعد از پايان ورودي به حالت اوليه‌اش باز مي‌گردد. 

الگوريتم ساخته شده در Rice بر اين اساس كار مي‌كند و به روبات اجازه مي‌دهد حالتش را در وراي ورودي تنظيم كند و حالت جديدي براي هدفش محاسبه كند، چيزي مثل سيستم GPS كه وقتي راننده به اشتباه مسير را طي مي‌كند، مجدداً مسير را تا مقصد محاسبه مي‌كند. 
هدف تغيير شكل دادن به حالت برنامه‌ريزي شده روبات به وسيله تعاملات فيزيكي بوده است. مارسيا او مالي در اين باره مي‌گويد: «هم اكنون روبات داراي هدف يا حالت ايده‌آلي است كه نحوه تفكرش در رابطه با اجراي كار را توصيف مي‌كند. الگوريتم زمان واقعي معرفي كرده‌ايم كه حالت ترجيحي روبات در آينده را اصلاح مي‌كند يا تغيير مي‌دهد. روبات در حالت امپدانس پيوسته پس از هر بار تعامل به حالت اوليه‌اش برمي‌گردد كه در حالت يادگيري و بازخوردها نه تنها وضعيت روبات در زمان تعامل، بلكه نحوه پردازش هدفش را نيز تغيير مي‌دادند. مثلاً اگر كاربر به روبات دستور مي‌داد فنجان را از روي صفحه كليد عبور دهد، روبات اين كار را در آينده هم ادامه مي‌داد.» 

وي در ادامه افزود:«با برنامه‌ريزي مجدد حالت ترجيحي روبات پس از هر بار مشاهده جديد، روبات قادر بود رفتاري از خود نشان دهد كه با ترجيحات انساني منطبق باشد.» نتايج حاكي از اين بود كه به لحاظ فيزيكي آزمايش‌ها با تغيير حالت آسان‌تر اجرا مي‌شد و براي رسيدن به هدف به تعامل بسيار كمي نياز داشت. آزمايش‌ها نشان داد از طريق تعاملات مي‌توان روبات‌هاي غيرخودمختار را به نحوي برنامه‌ريزي كرد كه تا حدودي از آزادي، مثلاً خم كردن دست و چرخاندن مچ، برخوردار شوند. يكي از محدوديت‌هاي فعلي pHRI اين است كه هنوز قادر نيست مقدار زماني را كه طول مي‌كشد يك روبات فعاليتي انجام دهد اصلاح كند، ولي اين مسئله در برنامه‌هاي تيم Rice قرار دارد. محققان معتقدند تغيير پاراديم اين پژوهش بدين شكل است كه روبات به جاي تلقي كردن انسان‌ در قالب آشفتگي‌هاي تصادفي بايد او را در قالب فردي منطقي فرض كند كه دليلي براي برقراري تعامل دارد و مي‌كوشد مسئله مهمي را به او منتقل كند. نبايد سعي روبات معطوف به اين باشد كه خود را به كناري بكشاند بلكه بايد ياد بگيرد چه چيزي در حال رخ دادن است و كارش را بهتر از قبل انجام دهد.
 
منبع: ساینس دیلی