شناسهٔ خبر: 78574175 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: آنا | لینک خبر

پژوهشگر ارشد حکمرانی دیجیتا‌ل‌ در گفت‌وگو با آناتک توضیح داد

چگونه تصاویر ساخته شده با هوش‌ مصنوعی را تشخیص دهیم

تشخیص میان واقعیت و محتوای تولیدشده با هوش مصنوعی روز به روز سخت‌تر می‌شود؛ تا جایی که در نگاه نخست، بسیاری از تصاویر جعلی از نمونه‌های واقعی تمیز داده نمی‌ش... تشخیص میان واقعیت و محتوای تولیدشده با هوش مصنوعی روز به روز سخت‌تر می‌شود؛ تا جایی که در نگاه نخست، بسیاری از تصاویر جعلی از نمونه‌های واقعی تمیز داده نمی‌شوند و واقعی به نظر می‌آیند. با این حال کارشناسان تأکید می‌کنند که همچنان می‌توان با بهره‌گیری از روش‌های جرم‌شناسی دیجیتال، تحلیل آماری و بررسی اصالت محتوا، احتمال جعلی بودن این تصاویر و ویدئو‌ها را ارزیابی کرد.

صاحب‌خبر -
زمانی که ابزارهای مولد هوش مصنوعی به‌ تازگی معرفی شده بودند، تصاویر تولیدشده با آنها اغلب با خطاهای آشکار و حتی خنده‌دار همراه بود؛ از جمله انگشتان اضافی، ناهنجاری‌های واضح در ساختار بدن و قرارگیری اندام‌ها در موقعیت‌هایی غیرطبیعی. امروز این خطاها کمتر دیده می‌شود زیرا شرایط تغییر کرده است. نسل جدید هوش مصنوعی مولد، تصاویری خلق می‌کند که تشخیص واقعی یا مصنوعی بودن آنها دیگر کار هر کسی نیست و نمی‌توان با اطمینان صددرصد، جعلی بودن یک تصویر را تأیید کرد. در چنین شرایطی، دیگر صرفاً مچ‌گیری از هوش مصنوعی اولویت اصلی محسوب نمی‌شود؛ بلکه مهم‌ترین مسئله، بررسی دقیق و ارزیابی محتوای بصری برای تأیید اصالت آن است. در همین راستا، با سید تقی کمالی، پژوهشگر ارشد حکمرانی دیجیتا‌ل‌، گفت‌وگو کردیم و این پژوهشگر راهکار‌های خود را درباره نشانه‌های محتوای مصنوعی و راهکارهای مؤثر برای اعتبارسنجی تصاویر تولیدشده با هوش مصنوعی، با ما در میان گذاشت.

چه ساختار‌های کلیشه‌ای در تصاویر ساخته شده با هوش مصنوعی وجود دارد که از طریق آن می‌توان به ساختگی بودن محتوا پی برد؟

پیشرفت سریع مدل‌های مولد تصویر و ویدئو در سال‌های اخیر مرز میان محتوای واقعی و مصنوعی را به شدت کم‌رنگ کرده است. ظهور مدل‌های مبتنی بر انتشار موجب شده است که بسیاری از نشانه‌های سنتی جعل دیجیتال از بین برود. مدل‌های انتشار یکی از مهم‌ترین دستاورد‌های هوش مصنوعی پس از یادگیری عمیق است و علت اصلی در دشوارتر شدن تشخیص تصاویر و ویدئو‌های جعلی است، بنابراین تشخیص محتوای مصنوعی دیگر صرفاً بر پایه مشاهده خطا‌های ظاهری مقدور نیست بلکه نیازمند ترکیب روش‌های جرم‌شناسی دیجیتال، تحلیل آماری، اعتبارسنجی منشأ محتوا و راستی‌آزمایی چند منبعی است.

مدل‌های انتشار یکی از مهم‌ترین دستاورد‌های هوش مصنوعی پس از یادگیری عمیق است و علت اصلی در دشوارتر شدن تشخیص تصاویر و ویدئو‌های جعلی است، بنابراین تشخیص محتوای مصنوعی دیگر صرفاً بر پایه مشاهده خطا‌های ظاهری مقدور نیست بلکه نیازمند ترکیب روش‌های جرم‌شناسی دیجیتال، تحلیل آماری، اعتبارسنجی منشأ محتوا و راستی‌آزمایی چند منبعی است

در سری‌های اولیه سامانه‌های مولد خطا‌هایی مانند انگشتان اضافی، چشم‌های نامتقارن یا اشیای ناقص بسیار رایج بود، اما مدل‌های جدید بخش عمده‌ای از این مشکلات را رفع کرده‌اند. با این حال همچنان چند دسته الگوی تکرارشونده قابل شناسایی است، اعم از زیبایی‌شناسی برآمده از بیش از حد کامل بودن، ناسازگاری‌ها و ناهمخوانی‌های مکانی و زمانی و الگو‌های آماری غیرطبیعی.

تصاویر تولیدشده توسط هوش مصنوعی اغلب دارای ویژگی‌هایی هستند که در تصاویر واقعی کمتر دیده می‌شوند، مانند پوست بیش از حد صاف، تقارن غیرعادی چهره، نورپردازی سینمایی، نبود نویز طبیعی و رنگ‌های بیش از حد اشباع شده. این ویژگی‌ها محصول یادگیری مدل‌ها از مجموعه‌های عظیم تصاویر حرفه‌ای است. برخی تصاویر همچنان در بازنمایی قوانین فیزیکی با مشکل مواجه‌اند، مانند جهت نامنظم سایه‌ها، انعکاس‌های نادرست، تعامل غیرواقعی نور با سطوح و خطا در پرسپکتیو. این دسته از خطا‌ها هنوز در بسیاری از مدل‌های مولد باقی مانده است.


تحلیل‌های فرکانسی نیز نشان می‌دهد تصاویر مصنوعی دارای الگو‌های توزیع فرکانسی متفاوتی نسبت به تصاویر ثبت شده با دوربین‌های واقعی هستند. این روش به دلیل بررسی دقیق الگوریتم‌های انتشار در کنار تحلیل نویز دوربین (اثر حسگر دوربین) یکی از مؤثرترین روش‌های تشخیصی در زمینه تصاویر هوش مصنوعی است. 

هوش مصنوعی در ساخت آناتومی بدن انسان چقدر موفق بوده است؟ آیا با دقت به رسم آناتومی بدن می‌توان جعلی بودن تصاویر را تشخیص داد؟

هوش مصنوعی در سال‌های اخیر پیشرفت چشمگیری در بازنمایی بدن انسان داشته است. در مقایسه با سری‌های اولیه، مدل‌های جدید قادرند نسبت‌های بدن را با دقت بیشتری بازسازی کنند اینکه حالات چهره را واقعی‌تر تولید کرده و تعامل اندام‌ها را طبیعی‌تر نمایش دهند. با این حال دشوارترین بخش برای مدل‌های مولد همچنان ساختار‌های پیچیده آناتومیک است.

در تصاویر مصنوعی هنوز گاهی مشاهده می‌شود که تعداد بند‌های انگشتان، زاویه‌های مفاصل، وضعیت شست و اتصال اندام‌ها دارای اشکال هستند و خطا‌هایی که در نواحی شانه‌ها، گردن، استخوان ترقوه، لگن و تعامل با محیط به چشم می‌آید. همچنین هوش مصنوعی هنوز گاهی در بازنمایی تماس بدن با اشیا دچار مشکل می‌شود برای مثال انگشتان درون اشیا فرومی‌روند یا وزن بدن به ‌درستی توزیع نمی‌شود. با این وجود باید گفت که اتکای صرف به آناتومی برای تشخیص تصاویر مصنوعی دیگر کافی نیست

از جمله نقاط ضعف رایج دست‌ها هستند. دست انسان دارای میزان قابل توجهی آزادی حرکتی است و یکی از پیچیده‌ترین ساختار‌های بدن محسوب می‌شود. در تصاویر مصنوعی هنوز گاهی مشاهده می‌شود که تعداد بند‌های انگشتان، زاویه‌های مفاصل، وضعیت شست و اتصال اندام‌ها دارای اشکال هستند و خطا‌هایی که در نواحی شانه‌ها، گردن، استخوان ترقوه، لگن و تعامل با محیط به چشم می‌آید. همچنین هوش مصنوعی هنوز گاهی در بازنمایی تماس بدن با اشیا دچار مشکل می‌شود برای مثال انگشتان درون اشیا فرومی‌روند یا وزن بدن به ‌درستی توزیع نمی‌شود. با این وجود باید گفت که اتکای صرف به آناتومی برای تشخیص تصاویر مصنوعی دیگر کافی نیست.

آیا ابزاری وجود دارد که جعلی بودن این محتوا‌ها را تشخیص دهد؟

بله، اما هیچ سامانه‌ای دقت صددرصد ندارد و هیچ روش واحدی قادر به تشخیص قطعی تمام انواع محتوای مصنوعی نیست. تشخیص تصاویر و ویدئو‌های تولیدشده توسط هوش مصنوعی دیگر صرفاً یک مسئله فنی محسوب نمی‌شود بلکه به یک موضوع راهبردی در حوزه اعتماد عمومی، امنیت اطلاعات و حکمرانی دیجیتال تبدیل شده است.

سامانه‌های جدید به‌ جای تشخیص جعلی بودن، اصالت را تأیید می‌کنند و در حال حاضر تشخیص محتوای تولید شده با هوش مصنوعی بیش از آنکه دیدن یک خطا باشد واجد ضرورت برای راستی‌آزمایی منشأ از طریق تحلیل متادیتا، شواهد مستقل و سامانه‌های اعتبارسنجی و ارزیابی است. متأسفانه هنوز چارچوب‌های استاندارد بین‌المللی برای ارزیابی و اعتبارسنجی محتوای مصنوعی به بلوغ کامل نرسیده‌اند. 

با این حال در این خصوص ابزار‌های جرم‌شناسی دیجیتال، سامانه‌های دانشگاهی و سامانه‌های شناسایی منشأی محتوا مانند آشکارساز‌های مبتنی بر یادگیری ماشین به ‌ویژه تحلیل فرکانس، سیگنال‌های زیستی و تحلیل نویز می‌توانند کمک‌کننده باشند و پیشنهادم به‌ عنوان مؤثرترین شیوه برای تشخیص استفاده از روش‌های چندلایه‌ای و ترکیبی است.

در عین حال پیش‌بینی می‌کنم به‌ مرور در این زمینه دولت‌ها به سمت قوانین مبتنی بر اصول، حرکت کرده و اجرای راهکار‌های فنی را به صنعت واگذار کنند و در این مسیر شرکت‌های فناور این سامانه‌ها را به‌ عنوان جزئی لاینفک از خدمات دیجیتال خود به جامعه ارائه دهند (در راستای گسترش و حفظ امنیت و اعتماد جامعه کاربران)، اما واقعیت این است که فناوری چند قدم جلوتر در حال حرکت است.

انتهای پیام/