شناسهٔ خبر: 74523041 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: شفقنا | لینک خبر

هوش مصنوعی جزئیات یک صحنه سه‌بعدی را از روی یک تصویر بازسازی می‌کند

صاحب‌خبر -

شفقنا – در سال‌های اخیر، ابزارهای کامپیوتری زیادی برای تحلیل تصاویر توسعه یافته‌اند که در حوزه‌هایی مانند روباتیک و خودروهای خودران کاربرد دارند؛ اما این مدل‌ها اغلب عملکرد خوبی ندارند و پیش‌بینی‌هایشان قابل تفسیر نیست. اکنون، محققان دانشگاه پرینستون یک الگوریتم هوش مصنوعی با نام «ترسیم معکوس» راه‌اندازی کرده‌اند که شفاف‌تر و قابل اعتمادتر است.

این فناوری به جای تحلیل صرف یک تصویر، فرآیند خلق آن را شبیه‌سازی می‌کند. در این روش، ابتدا یک تصویر مجازی تولید شده و سپس با تنظیم پارامترها، آن را با تصویر واقعی کاملاً منطبق می‌کنند. به بیان دیگر، این روش یک تکنیک پیشرفته در زمینه هوش مصنوعی و بینایی کامپیوتری محسوب می‌شود که با استفاده از الگوریتم‌های هوش مصنوعی (مانند هوش مصنوعی مولد) به کامپیوتر آموزش می‌دهد تا دنیای سه‌بعدی را از روی تصاویر دوبعدی درک کند.

این روش به جای اینکه یک تصویر را قدم به قدم پردازش کند، فرآیند را برعکس می‌کند به این شکل که ابتدا اشیای سه‌بعدی را در یک صحنه مجازی ایجاد می‌کند سپس این اشیا توسط یک هوش مصنوعی مولد بر اساس نمونه‌هایی از پارامترهای صحنه ساخته می‌شوند و به یک تصویر دوبعدی تبدیل می‌گردند. در ادامه این فرایند، الگوریتم «ترسیم معکوس»، تصویر مجازی ترسیم شده را با تصویر واقعی مقایسه می‌کند و در نهایت، با به حداقل رساندن تفاوت‌ها، ورودی‌ها را به گونه‌ای بهینه‌سازی می‌کند که تصویر مجازی کاملاً با تصویر واقعی مطابقت پیدا کند.

این فرآیند به هوش مصنوعی کمک می‌کند تا با دقت بسیار بالا، جزئیات سه‌بعدی یک صحنه را از روی یک تصویر دوبعدی بازسازی کند. به گفته محققان، این روش به خوبی بر داده‌های مختلفی مانند مجموعه داده‌های شرکت وایمو، یکی از پیشگامان خودروهای خودران، عمل کرده است.

این الگوریتم مزایای قابل توجهی دارد از جمله:

– شفافیت بالا: برخلاف مدل‌های قبلی، این هوش مصنوعی به جای یک پیش‌بینی غیرقابل درک، توضیحات سه‌بعدی مشخصی از آنچه «می‌بیند» ارائه می‌دهد.

– عملکرد عمومی: این مدل بدون نیاز به آموزش مکرر، به خوبی در مجموعه‌داده‌های مختلف دنیای واقعی عمل می‌کند که این کار هزینه‌های تطبیق با داده‌های جدید را به شدت کاهش می‌دهد.

– کاربرد در خودروهای خودران: این فناوری می‌تواند در خودروهای خودران به رهگیری چندشیء سه‌بعدی کمک کند و به آن‌ها اجازه دهد تا دنیای اطراف خود را دقیق‌تر درک کنند.

محققان اکنون قصد دارند این روش را به سایر وظایف بینایی کامپیوتری مانند تشخیص و بخش‌بندی سه‌بعدی گسترش دهند. هدف نهایی آن‌ها این است که هوش مصنوعی بتواند یک مدل سه‌بعدی کامل از کل صحنه را در اختیار داشته باشد.

این خبر را اینجا ببینید.