مارسيا او مالي ، مهندس دانشگاه Rice روششان را جهت آموزش روباتها با به كار بردن بازخوردهاي ظريف فيزيكي در حالي كه روباتها مشغول اجراي فعاليتهايي هستند، اصلاح كردهاند. هدف، سادهسازي آموزش روباتهايي است كه انتظار ميرود به شكل مؤثر شانه به شانه انسانها مشغول به كار شوند. او در اين باره ميگويد: «از گذشته، نقش روباتها بر عهدهگيري كارهاي بيارزشي بود كه مايل به انجام آنها نبودهايم: توليد، خط مونتاژ، جوشكاري و رنگآميزي. در حالي كه بيشتر تمايل پيدا ميكنيم اطلاعات شخصيمان را با دنياي فناوري به اشتراك بگذاريم، مثل شيوه ثبت تعداد گامهايي كه برداشتهام توسط ساعتمچي و فناوري در حال حركت به سمت سختافزارهاي تعبيه شده نيز هست. پيش از اين روباتها در خانههايمان حضور داشته و به جارو كشيدن يا كنترل ترموستاتها يا كوتاه نمودن چمنها ميپرداختهاند. فناوري با هر نوع شيوهاي به زندگيمان راه پيدا كرده است.
پيش از اين در آشپزخانه با Alexa حرف ميزدم، پس چرا ماشينهايي وجود نداشته باشند كه به شكل فيزيكي هم بتوان با آنها همكاري داشته باشيم؟ غالب پژوهشمان معطوف به ايمن ساختن تعاملات انسان-روبات است.» طبق اظهارات محققان، روباتهايي كه براي واكنش به تعامل انسان-روبات به كار ميرفتند به شكل مرسوم چنين تعاملاتي را مخل فرض كرده و رفتار اوليهشان را پس از خاتمه اين نوع تعاملات از سر ميگرفتند. محققان با روشي كه به انسانها اجازه ميدهد به شكل فيزيكي حالت روبات را در زمان واقعي تنظيم كنند، دست به بهبود زدهاند. در قلب اين برنامه با مفهوم كنترل امپدانس كه شيوهاي است براي مديريت اتفاقي كه در جريان بروز اجبار روي ميدهد، مواجهيم. روباتي كه از طريق ورودي فيزيكي امكان كنترل امپدانس را مهيا ميكند، حالت برنامهريزي شدهاش را در برابر واكنش تنظيم ميكند ولي بعد از پايان ورودي به حالت اوليهاش باز ميگردد.
الگوريتم ساخته شده در Rice بر اين اساس كار ميكند و به روبات اجازه ميدهد حالتش را در وراي ورودي تنظيم كند و حالت جديدي براي هدفش محاسبه كند، چيزي مثل سيستم GPS كه وقتي راننده به اشتباه مسير را طي ميكند، مجدداً مسير را تا مقصد محاسبه ميكند.
هدف تغيير شكل دادن به حالت برنامهريزي شده روبات به وسيله تعاملات فيزيكي بوده است. مارسيا او مالي در اين باره ميگويد: «هم اكنون روبات داراي هدف يا حالت ايدهآلي است كه نحوه تفكرش در رابطه با اجراي كار را توصيف ميكند. الگوريتم زمان واقعي معرفي كردهايم كه حالت ترجيحي روبات در آينده را اصلاح ميكند يا تغيير ميدهد. روبات در حالت امپدانس پيوسته پس از هر بار تعامل به حالت اوليهاش برميگردد كه در حالت يادگيري و بازخوردها نه تنها وضعيت روبات در زمان تعامل، بلكه نحوه پردازش هدفش را نيز تغيير ميدادند. مثلاً اگر كاربر به روبات دستور ميداد فنجان را از روي صفحه كليد عبور دهد، روبات اين كار را در آينده هم ادامه ميداد.»
وي در ادامه افزود:«با برنامهريزي مجدد حالت ترجيحي روبات پس از هر بار مشاهده جديد، روبات قادر بود رفتاري از خود نشان دهد كه با ترجيحات انساني منطبق باشد.» نتايج حاكي از اين بود كه به لحاظ فيزيكي آزمايشها با تغيير حالت آسانتر اجرا ميشد و براي رسيدن به هدف به تعامل بسيار كمي نياز داشت. آزمايشها نشان داد از طريق تعاملات ميتوان روباتهاي غيرخودمختار را به نحوي برنامهريزي كرد كه تا حدودي از آزادي، مثلاً خم كردن دست و چرخاندن مچ، برخوردار شوند. يكي از محدوديتهاي فعلي pHRI اين است كه هنوز قادر نيست مقدار زماني را كه طول ميكشد يك روبات فعاليتي انجام دهد اصلاح كند، ولي اين مسئله در برنامههاي تيم Rice قرار دارد. محققان معتقدند تغيير پاراديم اين پژوهش بدين شكل است كه روبات به جاي تلقي كردن انسان در قالب آشفتگيهاي تصادفي بايد او را در قالب فردي منطقي فرض كند كه دليلي براي برقراري تعامل دارد و ميكوشد مسئله مهمي را به او منتقل كند. نبايد سعي روبات معطوف به اين باشد كه خود را به كناري بكشاند بلكه بايد ياد بگيرد چه چيزي در حال رخ دادن است و كارش را بهتر از قبل انجام دهد.
منبع: ساینس دیلی