شناسهٔ خبر: 75674164 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: ایمنا | لینک خبر

OpenAI با Sora 2 دنیای ویدئوهای هوش مصنوعی را متحول کرد

ویدئوساز مبتنی بر هوش مصنوعی Sora (نسخه ۲) به کاربران امکان می‌دهد تا از هر سوژه‌ای از پت‌ها و اسباب‌بازی‌ها گرفته تا نشان‌ها و کاراکترهای خیالی یک «کمئو» (cameo) بسازند.

صاحب‌خبر -

به گزارش خبرگزاری ایمنا و به نقل از وب‌سایت The Verge، شرکت OpenAI با انتشار نسخه دوم از سامانه ویدئوساز هوش مصنوعی خود با نام Sora 2 گام تازه‌ای در تحول محتوای ویدئویی برداشته است. این نسخه جدید، دو قابلیت کلیدی با عنوان «شخصیت‌های قابل استفاده مجدد» (Character Cameos) و «ترکیب ویدئوها» (Video Stitching) را به سیستم اضافه کرده است؛ ویژگی‌هایی که مرز میان تولید محتوای دیجیتال و سینما را بیش از پیش کمرنگ می‌کنند. در نسخه تازه، کاربران می‌توانند از هر سوژه‌ای؛ از حیوان خانگی و اسباب‌بازی گرفته تا شخصیت‌های خیالی و حتی تصویر خودشان، یک کاراکتر دیجیتال بسازند، برایش نام و شناسه اختصاص دهند و آن را در پروژه‌های آینده به کار گیرند، این شخصیت‌ها می‌توانند در ویدئوهای متنوع، با حرکات، حالات چهره و صداهای گوناگون ظاهر شوند. هدف OpenAI از معرفی این ویژگی، ایجاد پیوستگی روایی و افزایش «هویت خلاق» کاربران در ویدئوهای تولیدی اعلام شده است، در کنار آن قابلیت ترکیب ویدئوها نیز به کاربران امکان می‌دهد چند کلیپ کوتاه را به صورت هوشمند به هم متصل کنند تا روایت‌های طولانی‌تر با چند صحنه مجزا بسازند، این ویژگی به ویژه برای تولیدکنندگان محتوا، فیلم‌سازان مستقل و حتی خبرنگاران چندرسانه‌ای جذاب است، زیرا مرز میان ویدئوی کوتاه شبکه‌های اجتماعی و ساختارهای سینمایی را از میان برمی‌دارد.

روایت‌سازی تعاملی؛ از الگوریتم تا هنر انسانی

Sora 2 را می‌توان نسل تازه‌ای از هوش مصنوعی‌های مولد دانست که در مرز میان فناوری و خلاقیت انسانی حرکت می‌کنند، این پلتفرم با ترکیب مدل‌های زبانی و تصویری، قادر است یک «پیوستگی شخصیتی» در خروجی ویدئویی ایجاد کند؛ ویژگی‌ای که تاکنون تنها در تولیدات حرفه‌ای سینمایی و بازی‌های دیجیتال دیده می‌شد. بر اساس توضیحات OpenAI، کاربران می‌توانند در هنگام ساخت «کمدو» یا همان شخصیت دیجیتال، فایل ویدئویی کوتاهی با صدا بارگذاری کنند تا سیستم، حرکات چهره، لحن گفتار و ویژگی‌های بصری آن فرد یا سوژه را در قالب یک مدل سه‌بعدی پایدار بازسازی کند. این مدل سپس به صورت خودکار در ویدئوهای بعدی قابل استفاده است و می‌تواند در سناریوهای مختلف ظاهر شود، از اجرای موسیقی تا گفت‌وگوهای خبری. از منظر فنی، موتور اصلی Sora از همان ساختار مدل‌های چندوجهی (multimodal) GPT و DALL·E بهره می‌برد، اما اکنون با لایه‌ای از الگوریتم‌های ویدئو به ویدئو (Video Diffusion Models) ترکیب شده است تا حرکات، نور و سایه را با دقت فریم به فریم بازسازی کند. به گفته تحلیلگران حوزه هوش مصنوعی، این سطح از یکپارچگی می‌تواند مسیر تولید محتوای شخصی‌سازی‌شده را متحول کند و «انقلاب بعدی در روایت دیجیتال» را رقم بزند، در عین حال بسیاری از منتقدان هشدار داده‌اند که افزایش سهولت در خلق کاراکترهای مشابه انسان واقعی، خطرات تازه‌ای برای حریم خصوصی و جعل هویت دیجیتال ایجاد می‌کند.

OpenAI برای افزایش تعامل اجتماعی کاربران، بخشی با نام Leaderboards به Sora افزوده است تا محبوب‌ترین ویدئوها، کاراکترها و کاربرانی که بیشترین میزان بازنشر یا «کمدو شدن» را تجربه کرده‌اند، به نمایش گذاشته شوند. این بخش در واقع نقشه راه OpenAI برای تبدیل Sora از یک ابزار تولید محتوا به یک شبکه اجتماعی مبتنی بر هوش مصنوعی است؛ جایی که کاربران نه فقط خالق، بلکه بخشی از یک اکوسیستم تعاملی هستند، با این حال استفاده از واژه‌ی «Cameo» برای این قابلیت جدید، موجب شکایت شرکت معروف Cameo Inc. از OpenAI شده است، این شرکت آمریکایی، که پلتفرم ویدئوهای سفارشی از افراد مشهور را اداره می‌کند، مدعی است استفاده از این نام در محصول OpenAI می‌تواند موجب گمراهی کاربران و تضاد با حقوق تجاری ثبت‌شده آن شود. در بیانیه OpenAI، این شرکت تأکید کرده که «Cameo» در نسخه‌ی Sora به معنای «حضور کوتاه یک شخصیت» است و هیچ قصدی برای نقض حقوق مالکیت معنوی وجود ندارد. با وجود این، پرونده حقوقی یادشده ممکن است زمینه‌ساز بحث‌های گسترده‌تری درباره نام‌گذاری تجاری، مالکیت ایده‌ها و هم‌پوشانی میان فناوری و برندینگ شود، مباحثی که در دوران هوش مصنوعی بیش از هر زمان دیگری اهمیت یافته‌اند.

آزادی دسترسی و چالش‌های اخلاقی در دنیای ویدئوهای هوشمند

در اقدامی دیگر، OpenAI محدودیت «دعوت‌نامه» برای دسترسی به Sora را در کشورهای آمریکا، کانادا، ژاپن و کره‌جنوبی به‌طورموقت لغو کرده است تا کاربران بدون نیاز به کد دعوت بتوانند وارد پلتفرم شوند، این تصمیم در عمل یک حرکت استراتژیک برای تسریع رشد جامعه کاربران تلقی می‌شود؛ جامعه‌ای که با هر آپلود جدید، داده‌های آموزشی بیشتری به الگوریتم‌های یادگیری OpenAI تزریق می‌کند، اما در کنار شور و هیجان کاربران، این گسترش سریع پرسش‌های اخلاقی متعددی را نیز برمی‌انگیزد؛ آیا ساخت یک کاراکتر دیجیتال با شباهت به یک فرد واقعی بدون رضایت او نوعی نقض حریم خصوصی محسوب می‌شود؟ و اگر چنین کاراکتری در ویدئوهای طنز، تبلیغاتی یا سیاسی ظاهر شود، چه کسی مسئول پیامدهای آن است؟ OpenAI برای کاهش ریسک‌های حقوقی، محدودیت‌هایی برای استفاده از تصاویر انسان‌های واقعی و تنظیمات پیشرفته‌ای برای تعیین سطح دسترسی طراحی کرده است، کاربران می‌توانند مشخص کنند که کمدوهای آن‌ها فقط برای خودشان، دنبال‌کنندگان تأییدشده یا عموم کاربران قابل مشاهده باشد، با این حال کارشناسان حقوق دیجیتال معتقدند که مرز میان خلاقیت و جعل هویت در چنین پلتفرم‌هایی بسیار باریک است و در آینده نیازمند چارچوب‌های قانونی دقیق‌تری خواهد بود.

تحلیل‌گران حوزه فناوری معتقدند نسخه دوم Sora نه تنها یک ابزار تولید ویدئو، بلکه نقطه عطفی در تکامل روایت دیجیتال است، در دنیایی که هوش مصنوعی به سرعت در حال تسخیر حوزه‌های متن، تصویر، صدا و اکنون ویدئو است، Sora نماینده‌ی نسلی است که می‌تواند مرز میان کاربر و خالق را از میان ببرد، برای نخستین بار هر فردی می‌تواند در چند دقیقه، شخصیت‌های دیجیتال پایدار و روایت‌های چندصحنه‌ای بسازد؛ امکانی که پیش‌تر تنها در اختیار استودیوهای بزرگ فیلم‌سازی و بازی‌سازی بود، با این حال، همان‌طور که فناوری‌های مشابه نشان داده‌اند، جذابیت نوآوری همواره با مسئولیت اخلاقی همراه است، از یک سو، دموکراتیزه شدن تولید ویدئو می‌تواند خلاقیت و روایت‌گری را برای میلیون‌ها نفر آزاد کند، اما از سوی دیگر سوءاستفاده از تصاویر و صداهای افراد واقعی می‌تواند به بحرانی تازه در اعتماد عمومی و واقعیت دیجیتال منجر شود، نسخه دوم Sora نه پایان راه، بلکه آغاز دوره‌ای است که در آن، مرز میان واقعیت و تخیل به‌طرز چشم‌گیری محو می‌شود، عصری که شاید آینده سینما، تبلیغات، روزنامه‌نگاری و حتی حافظه جمعی بشر را از نو تعریف کند.