به گزارش سرویس فناوری اطلاعات «خبرنامه دانشجویان ایران»؛ هوش مصنوعی Med-Gemini گوگل پیشرفت بسیار زیادی داشته و عملکرد آن در برخی معیارها حتی از پزشکان انسانی بهتر شده است.
هوش مصنوعی پزشکی گوگل با نام Med-Gemini، عملکرد خیرهکنندهای در تشخیص بیماری و درک پروندههای پزشکی پیچیده داشته و اخیراً توجهات زیادی را به خود جلب کرده است. این هوش مصنوعی نهتنها از سایر مدلهای مطرح مثل GPT-4 بلکه در برخی معیارها حتی از پزشکان واقعی نیز عملکرد بهتری از خود نشان داد.
طبق تحقیق منتشرشده در سایت Arxiv، هوش مصنوعی Med-Gemini میتواند اطلاعات را از منابع مختلف ازجمله متنهای پزشکی، تصاویر و حتی جستوجوهای وب تحلیل کند. این قابلیت به هوش مصنوعی گوگل اجازه میدهد دقت تشخیص بسیار بالایی داشته باشد و در نتیجه برنامههای درمانی بهتری پیشنهاد دهد.
بررسی پروندههای الکترونیکی پزشکی که معمولاً حجیم هستند، برای Med-Gemini بسیار آسان است. این هوش مصنوعی میتواند با سرعت بسیار بالا حجم عظیمی از دادههای پزشکی را غربال، جزئیات کلیدی را شناسایی و در نهایت در زمان پزشکان صرفهجویی کند.
اطلاعات پزشکی را به شکلی واضح بیان کند
Med-Gemini میتواند با بیماران و پزشکان گفتگوهای طبیعی داشته باشد، به سؤالات پاسخ دهد و اطلاعات پزشکی را به شکلی واضح بیان کند. با این تفاسیر، میتوان آیندهای را تصور کرد که در آن هوش مصنوعی در تشخیص سریعتر و دقیقتر بیماریها به پزشکان کمک میکند و دید بهتری به بیماران ارائه میدهد.
شکوفه عزیزی، محقق ایرانی واحد DeepMind گوگل که طی سالهای گذشته تعداد زیادی از مقالاتش در معتبرترین مجلات عملی جهان منتشر شدهاند، با انتشار پستی در ایکس (توییتر سابق) گفت: «برای معرفی ویژگیهای جدید Med-Gemini بسیار هیجانزدهایم. تحقیقات جدید بر اساس سه مدل جدید انجام شدند که از مدل زبانی بزرگ Gemini 1.5 بهره میبرند. Gemini 1.5 میتواند تصاویر پزشکی دوبعدی و برای اولینبار اسکنهای سهبعدی رادیولوژی را مدیریت و درصد خطر ژنومی را محاسبه کند.»
هنوز در روزهای اولیهی توسعهی Med-Gemini بهسر میبریم و برای اطمینان از ایمن بودن آن در دنیای واقعی، تحقیقات بیشتری نیاز است. حفظ عدالت و حراست از حریم خصوصی بیماران در اولویت قرار دارد. وجود سوگیری در هوش مصنوعی میتواند پیامدهای جدی داشته باشد، بنابراین توسعهی مسئولانه اهمیت ویژهای دارد.
با وجود دستاوردهای چشمگیر Med-Gemini، هدف این نیست که هوش مصنوعی مذکور جایگزین پزشکان شود. درواقع هوش مصنوعی میتواند بهعنوان ابزاری قدرتمند در اختیار پزشکان قرار گیرد تا بتوانند کیفیت مراقبت از بیماران را ارتقاء دهند.
مدلهای جمینای گوگل نسل جدیدی از مدلهای هوش مصنوعی چندوجهی هستند، به این معنی که میتوانند اطلاعات را از حالتهای مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کنند. این مدلها در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیدهاند و آنچه که «استدلال با زمینه طولانی» یا استدلال از مقادیر زیادی داده مانند ساعتها ویدیو یا دهها ساعت صوت نامیده میشود، مهارت دارند.
هوش مصنوعی Med-Gemini تمام مزایای مدلهای پایه جمینای را دارد، اما آنها را به خوبی تنظیم و متعادل کرده است. محققان این ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در مقاله گنجاندند. در این مقاله ۵۸ صفحهای مطالب زیادی وجود دارد که در این گزارش به بیان چشمگیرترین آنها میپردازیم.
قابلیتهای خودآموزی و جستجوی وب
رسیدن به یک تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعهای از اطلاعات مرتبط دیگر مانند علائم بیمار، تاریخچه پزشکی، جراحی و اجتماعی، نتایج آزمایشگاهی و نتایج سایر آزمایشات تحقیقاتی و واکنش بیمار به درمانهای قبلی گردآوری کنند تا درمانهای موجود بهروزرسانی شوند و درمانهای جدیدی معرفی میشوند. همه این موارد بر استدلال بالینی پزشک تأثیر میگذارد.
به همین دلیل است که گوگل با Med-Gemini دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفتهتر فراهم کرده است. این هوش مصنوعی مانند بسیاری از مدلهای زبان بزرگ(LLM) متمرکز بر پزشکی با MedQA که حاوی سؤالات چند گزینهای نماینده سؤالات آزمون مجوز پزشکی ایالات متحده(USMLE) است، آموزش دیده که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شده است.
با این حال، گوگل همچنین دو مجموعه داده جدید را برای مدل خود توسعه داده است. اولی MedQA-R (استدلال) است که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام «زنجیره افکار»(CoTs) گسترش میدهد. دومی MedQA-RS (استدلال و جستجو) است که دستورالعملهایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه میدهد. بدین ترتیب اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته میشود تا یک جستجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.
هوش مصنوعی Med-Gemini بر روی ۱۴ معیار پزشکی آزمایش شد و عملکرد جدیدی را روی ۱۰ معیار اجرا کرد که از مدل GPT-۴ ساخته شرکت اوپنایآی(OpenAI) پیشی گرفت. این مدل در معیار MedQA با استفاده از استراتژی جستجوی هدایتشده به دقت ۹۱.۱ درصدی دست یافت و از مدل زبان بزرگ مبتنی بر پزشکی پیشین گوگل موسوم به Med-PaLM ۲ تا ۴.۵ درصد بهتر عمل کرد.
هوش مصنوعی Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند حاوی تصاویر موارد چالش برانگیز بالینی که از یک لیست ۱۰تایی تشخیص داده میشود، به طور متوسط از ۴۴.۵ درصد بهتر از GPT-۴ عمل کرد.
محققان میگویند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستجو و کیفیت استنادها را در نظر نگرفتهایم. علاوه بر این، باید دید که آیا میتوان به مدلهای زبان بزرگ کوچکتر نیز استفاده از جستجوی وب را آموزش داد؟ ما این اکتشافات را به کارهای آینده واگذار میکنیم.
بازیابی اطلاعات خاص از پروندههای الکترونیکی پزشکی طولانی
پرونده الکترونیک سلامت(EHR) ممکن است بلندبالا باشد، اما پزشکان باید از محتوای آنها آگاه باشند. آنها گاهی پیچیده هستند، چرا که معمولاً حاوی شباهتهای متنی، املای غلط، کلمات اختصاری و مترادفها هستند که میتوانند هوش مصنوعی را به چالش بکشند.
بنابراین محققان برای آزمایش توانایی Med-Gemini در درک و استدلال از اطلاعات پزشکی بلندبالا و طولانی از یک پایگاه داده بزرگ و در دسترس عموم(Medical Information Mart for Intensive Care) که به مثابه پیدا کردن سوزن در انبار کاه است، استفاده کردند. این پایگاه حاوی دادههای بیماران بستری در بخشهای مراقبتهای ویژه است.
هدف این بود که مدل بتواند یک وضعیت، علامت، یا درمان پزشکی کماستفاده و ظریف را در مجموعه بزرگی از یادداشتهای بالینی بازیابی کند. دویست نمونه انتخاب شد و هر نمونه شامل مجموعهای از پروندههای این پایگاه از ۴۴ بیمار بستری شده در بخش مراقبتهای ویژه با سابقه پزشکی طولانی بود.
هوش مصنوعی Med-Gemini دو مرحله برای یافتن سوزن در انبار کاه پیش رو داشت. اول اینکه مجبور بود همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی میکرد. دوم اینکه باید ارتباط همه موارد را با هم ارزیابی میکرد، آنها را دستهبندی میکرد و نتیجه میگرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه میکرد. در نهایت این هوش مصنوعی عملکرد خوبی داشت.
محققان میگویند: شاید برجستهترین جنبه Med-Gemini، قابلیتهای پردازش سوابق طولانی باشد، زیرا آنها مرزهای عملکردی جدیدی را باز میکنند و امکانات کاربردی جدیدی را که قبلاً غیرممکن بود برای سیستمهای هوش مصنوعی پزشکی فراهم میکنند. این وظیفه یافتن «سوزن در انبار کاه» منعکس کننده یک چالش در دنیای واقعی است که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیتهای پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از دادههای بیماران نشان میدهد.
گفتگو با Med-Gemini
در یک آزمایش در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی که خارش دارد، پرسید. این مدل پس از درخواست تصویر، سؤالات مناسب بعدی را پرسید و آن ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.
همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه یک بیمار را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که بتوان آن را در اختیار بیمار قرار داد.
محققان میگویند: قابلیتهای مکالمه چندوجهی Med-Gemini امیدوارکننده است و چنین قابلیتهایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستمهای هوش مصنوعی را فراهم میکنند. با این حال، محققان دریافتند که کار بیشتری لازم است.
آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی، از جمله کمک به پزشکان و بیماران است، البته خطرات قابل توجهی نیز به دنبال دارد. در حالی که پتانسیل تحقیقات آینده در این حوزه را برجسته میکنیم، ما تواناییهای مکالمه بالینی را در این کار، همانطور که قبلاً توسط دیگران در تحقیقات اختصاصی در زمینه هوش مصنوعی تشخیصی محاورهای بررسی شده بود، به طور دقیق مورد بررسی قرار ندادهایم.
گزارش از امیر کریمی
نظر شما