شفقنا – در سالهای اخیر، ابزارهای کامپیوتری زیادی برای تحلیل تصاویر توسعه یافتهاند که در حوزههایی مانند روباتیک و خودروهای خودران کاربرد دارند؛ اما این مدلها اغلب عملکرد خوبی ندارند و پیشبینیهایشان قابل تفسیر نیست. اکنون، محققان دانشگاه پرینستون یک الگوریتم هوش مصنوعی با نام «ترسیم معکوس» راهاندازی کردهاند که شفافتر و قابل اعتمادتر است.
این فناوری به جای تحلیل صرف یک تصویر، فرآیند خلق آن را شبیهسازی میکند. در این روش، ابتدا یک تصویر مجازی تولید شده و سپس با تنظیم پارامترها، آن را با تصویر واقعی کاملاً منطبق میکنند. به بیان دیگر، این روش یک تکنیک پیشرفته در زمینه هوش مصنوعی و بینایی کامپیوتری محسوب میشود که با استفاده از الگوریتمهای هوش مصنوعی (مانند هوش مصنوعی مولد) به کامپیوتر آموزش میدهد تا دنیای سهبعدی را از روی تصاویر دوبعدی درک کند.
این روش به جای اینکه یک تصویر را قدم به قدم پردازش کند، فرآیند را برعکس میکند به این شکل که ابتدا اشیای سهبعدی را در یک صحنه مجازی ایجاد میکند سپس این اشیا توسط یک هوش مصنوعی مولد بر اساس نمونههایی از پارامترهای صحنه ساخته میشوند و به یک تصویر دوبعدی تبدیل میگردند. در ادامه این فرایند، الگوریتم «ترسیم معکوس»، تصویر مجازی ترسیم شده را با تصویر واقعی مقایسه میکند و در نهایت، با به حداقل رساندن تفاوتها، ورودیها را به گونهای بهینهسازی میکند که تصویر مجازی کاملاً با تصویر واقعی مطابقت پیدا کند.
این فرآیند به هوش مصنوعی کمک میکند تا با دقت بسیار بالا، جزئیات سهبعدی یک صحنه را از روی یک تصویر دوبعدی بازسازی کند. به گفته محققان، این روش به خوبی بر دادههای مختلفی مانند مجموعه دادههای شرکت وایمو، یکی از پیشگامان خودروهای خودران، عمل کرده است.
این الگوریتم مزایای قابل توجهی دارد از جمله:
– شفافیت بالا: برخلاف مدلهای قبلی، این هوش مصنوعی به جای یک پیشبینی غیرقابل درک، توضیحات سهبعدی مشخصی از آنچه «میبیند» ارائه میدهد.
– عملکرد عمومی: این مدل بدون نیاز به آموزش مکرر، به خوبی در مجموعهدادههای مختلف دنیای واقعی عمل میکند که این کار هزینههای تطبیق با دادههای جدید را به شدت کاهش میدهد.
– کاربرد در خودروهای خودران: این فناوری میتواند در خودروهای خودران به رهگیری چندشیء سهبعدی کمک کند و به آنها اجازه دهد تا دنیای اطراف خود را دقیقتر درک کنند.
محققان اکنون قصد دارند این روش را به سایر وظایف بینایی کامپیوتری مانند تشخیص و بخشبندی سهبعدی گسترش دهند. هدف نهایی آنها این است که هوش مصنوعی بتواند یک مدل سهبعدی کامل از کل صحنه را در اختیار داشته باشد.
این خبر را اینجا ببینید.