به گزارش خبرگزاری ایمنا و به نقل از وبسایت The Verge، شرکت OpenAI با انتشار نسخه دوم از سامانه ویدئوساز هوش مصنوعی خود با نام Sora 2 گام تازهای در تحول محتوای ویدئویی برداشته است. این نسخه جدید، دو قابلیت کلیدی با عنوان «شخصیتهای قابل استفاده مجدد» (Character Cameos) و «ترکیب ویدئوها» (Video Stitching) را به سیستم اضافه کرده است؛ ویژگیهایی که مرز میان تولید محتوای دیجیتال و سینما را بیش از پیش کمرنگ میکنند. در نسخه تازه، کاربران میتوانند از هر سوژهای؛ از حیوان خانگی و اسباببازی گرفته تا شخصیتهای خیالی و حتی تصویر خودشان، یک کاراکتر دیجیتال بسازند، برایش نام و شناسه اختصاص دهند و آن را در پروژههای آینده به کار گیرند، این شخصیتها میتوانند در ویدئوهای متنوع، با حرکات، حالات چهره و صداهای گوناگون ظاهر شوند. هدف OpenAI از معرفی این ویژگی، ایجاد پیوستگی روایی و افزایش «هویت خلاق» کاربران در ویدئوهای تولیدی اعلام شده است، در کنار آن قابلیت ترکیب ویدئوها نیز به کاربران امکان میدهد چند کلیپ کوتاه را به صورت هوشمند به هم متصل کنند تا روایتهای طولانیتر با چند صحنه مجزا بسازند، این ویژگی به ویژه برای تولیدکنندگان محتوا، فیلمسازان مستقل و حتی خبرنگاران چندرسانهای جذاب است، زیرا مرز میان ویدئوی کوتاه شبکههای اجتماعی و ساختارهای سینمایی را از میان برمیدارد.
روایتسازی تعاملی؛ از الگوریتم تا هنر انسانی
Sora 2 را میتوان نسل تازهای از هوش مصنوعیهای مولد دانست که در مرز میان فناوری و خلاقیت انسانی حرکت میکنند، این پلتفرم با ترکیب مدلهای زبانی و تصویری، قادر است یک «پیوستگی شخصیتی» در خروجی ویدئویی ایجاد کند؛ ویژگیای که تاکنون تنها در تولیدات حرفهای سینمایی و بازیهای دیجیتال دیده میشد. بر اساس توضیحات OpenAI، کاربران میتوانند در هنگام ساخت «کمدو» یا همان شخصیت دیجیتال، فایل ویدئویی کوتاهی با صدا بارگذاری کنند تا سیستم، حرکات چهره، لحن گفتار و ویژگیهای بصری آن فرد یا سوژه را در قالب یک مدل سهبعدی پایدار بازسازی کند. این مدل سپس به صورت خودکار در ویدئوهای بعدی قابل استفاده است و میتواند در سناریوهای مختلف ظاهر شود، از اجرای موسیقی تا گفتوگوهای خبری. از منظر فنی، موتور اصلی Sora از همان ساختار مدلهای چندوجهی (multimodal) GPT و DALL·E بهره میبرد، اما اکنون با لایهای از الگوریتمهای ویدئو به ویدئو (Video Diffusion Models) ترکیب شده است تا حرکات، نور و سایه را با دقت فریم به فریم بازسازی کند. به گفته تحلیلگران حوزه هوش مصنوعی، این سطح از یکپارچگی میتواند مسیر تولید محتوای شخصیسازیشده را متحول کند و «انقلاب بعدی در روایت دیجیتال» را رقم بزند، در عین حال بسیاری از منتقدان هشدار دادهاند که افزایش سهولت در خلق کاراکترهای مشابه انسان واقعی، خطرات تازهای برای حریم خصوصی و جعل هویت دیجیتال ایجاد میکند.
OpenAI برای افزایش تعامل اجتماعی کاربران، بخشی با نام Leaderboards به Sora افزوده است تا محبوبترین ویدئوها، کاراکترها و کاربرانی که بیشترین میزان بازنشر یا «کمدو شدن» را تجربه کردهاند، به نمایش گذاشته شوند. این بخش در واقع نقشه راه OpenAI برای تبدیل Sora از یک ابزار تولید محتوا به یک شبکه اجتماعی مبتنی بر هوش مصنوعی است؛ جایی که کاربران نه فقط خالق، بلکه بخشی از یک اکوسیستم تعاملی هستند، با این حال استفاده از واژهی «Cameo» برای این قابلیت جدید، موجب شکایت شرکت معروف Cameo Inc. از OpenAI شده است، این شرکت آمریکایی، که پلتفرم ویدئوهای سفارشی از افراد مشهور را اداره میکند، مدعی است استفاده از این نام در محصول OpenAI میتواند موجب گمراهی کاربران و تضاد با حقوق تجاری ثبتشده آن شود. در بیانیه OpenAI، این شرکت تأکید کرده که «Cameo» در نسخهی Sora به معنای «حضور کوتاه یک شخصیت» است و هیچ قصدی برای نقض حقوق مالکیت معنوی وجود ندارد. با وجود این، پرونده حقوقی یادشده ممکن است زمینهساز بحثهای گستردهتری درباره نامگذاری تجاری، مالکیت ایدهها و همپوشانی میان فناوری و برندینگ شود، مباحثی که در دوران هوش مصنوعی بیش از هر زمان دیگری اهمیت یافتهاند.
آزادی دسترسی و چالشهای اخلاقی در دنیای ویدئوهای هوشمند
در اقدامی دیگر، OpenAI محدودیت «دعوتنامه» برای دسترسی به Sora را در کشورهای آمریکا، کانادا، ژاپن و کرهجنوبی بهطورموقت لغو کرده است تا کاربران بدون نیاز به کد دعوت بتوانند وارد پلتفرم شوند، این تصمیم در عمل یک حرکت استراتژیک برای تسریع رشد جامعه کاربران تلقی میشود؛ جامعهای که با هر آپلود جدید، دادههای آموزشی بیشتری به الگوریتمهای یادگیری OpenAI تزریق میکند، اما در کنار شور و هیجان کاربران، این گسترش سریع پرسشهای اخلاقی متعددی را نیز برمیانگیزد؛ آیا ساخت یک کاراکتر دیجیتال با شباهت به یک فرد واقعی بدون رضایت او نوعی نقض حریم خصوصی محسوب میشود؟ و اگر چنین کاراکتری در ویدئوهای طنز، تبلیغاتی یا سیاسی ظاهر شود، چه کسی مسئول پیامدهای آن است؟ OpenAI برای کاهش ریسکهای حقوقی، محدودیتهایی برای استفاده از تصاویر انسانهای واقعی و تنظیمات پیشرفتهای برای تعیین سطح دسترسی طراحی کرده است، کاربران میتوانند مشخص کنند که کمدوهای آنها فقط برای خودشان، دنبالکنندگان تأییدشده یا عموم کاربران قابل مشاهده باشد، با این حال کارشناسان حقوق دیجیتال معتقدند که مرز میان خلاقیت و جعل هویت در چنین پلتفرمهایی بسیار باریک است و در آینده نیازمند چارچوبهای قانونی دقیقتری خواهد بود.
تحلیلگران حوزه فناوری معتقدند نسخه دوم Sora نه تنها یک ابزار تولید ویدئو، بلکه نقطه عطفی در تکامل روایت دیجیتال است، در دنیایی که هوش مصنوعی به سرعت در حال تسخیر حوزههای متن، تصویر، صدا و اکنون ویدئو است، Sora نمایندهی نسلی است که میتواند مرز میان کاربر و خالق را از میان ببرد، برای نخستین بار هر فردی میتواند در چند دقیقه، شخصیتهای دیجیتال پایدار و روایتهای چندصحنهای بسازد؛ امکانی که پیشتر تنها در اختیار استودیوهای بزرگ فیلمسازی و بازیسازی بود، با این حال، همانطور که فناوریهای مشابه نشان دادهاند، جذابیت نوآوری همواره با مسئولیت اخلاقی همراه است، از یک سو، دموکراتیزه شدن تولید ویدئو میتواند خلاقیت و روایتگری را برای میلیونها نفر آزاد کند، اما از سوی دیگر سوءاستفاده از تصاویر و صداهای افراد واقعی میتواند به بحرانی تازه در اعتماد عمومی و واقعیت دیجیتال منجر شود، نسخه دوم Sora نه پایان راه، بلکه آغاز دورهای است که در آن، مرز میان واقعیت و تخیل بهطرز چشمگیری محو میشود، عصری که شاید آینده سینما، تبلیغات، روزنامهنگاری و حتی حافظه جمعی بشر را از نو تعریف کند.