شناسهٔ خبر: 66592319 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: خبرنامه دانشجویان ایران | لینک خبر

بررسی توانمندی هوش مصنوعی در حوزه پزشکی؛

هوش مصنوعی فراتر از دستان پزشکی

گروه گوگل ریسرچ(Google Research) و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل به نام دیپ‌مایند(DeepMind)، مدل هوش مصنوعی مد-جمینای(Med-Gemini) که خانواده‌ای از مدل‌های پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح داده‌اند. این مدل، یک پیشرفت بزرگ در تشخیص بالینی با پتانسیل عظیم در دنیای واقعی است.

صاحب‌خبر -

به گزارش سرویس فناوری اطلاعات «خبرنامه دانشجویان ایران»؛ هوش مصنوعی Med-Gemini گوگل پیشرفت بسیار زیادی داشته و عملکرد آن در برخی معیارها حتی از پزشکان انسانی بهتر شده است.

هوش مصنوعی پزشکی گوگل با نام Med-Gemini، عملکرد خیره‌کننده‌ای در تشخیص بیماری و درک پرونده‌های پزشکی پیچیده داشته و اخیراً توجهات زیادی را به خود جلب کرده است. این هوش مصنوعی نه‌تنها از سایر مدل‌های مطرح مثل GPT-4 بلکه در برخی معیارها حتی از پزشکان واقعی نیز عملکرد بهتری از خود نشان داد.

طبق تحقیق منتشرشده در سایت Arxiv،‌ هوش مصنوعی Med-Gemini می‌تواند اطلاعات را از منابع مختلف ازجمله متن‌های پزشکی، تصاویر و حتی جست‌وجوهای وب تحلیل کند. این قابلیت به هوش مصنوعی گوگل اجازه می‌دهد دقت تشخیص بسیار بالایی داشته باشد و در نتیجه برنامه‌های درمانی بهتری پیشنهاد دهد.

بررسی پرونده‌های الکترونیکی پزشکی که معمولاً حجیم هستند، برای Med-Gemini بسیار آسان است. این هوش مصنوعی می‌تواند با سرعت بسیار بالا حجم عظیمی از داده‌های پزشکی را غربال، جزئیات کلیدی را شناسایی و در نهایت در زمان پزشکان صرفه‌جویی کند.

اطلاعات پزشکی را به شکلی واضح بیان کند

Med-Gemini می‌تواند با بیماران و پزشکان گفتگوهای طبیعی داشته باشد، به سؤالات پاسخ دهد و اطلاعات پزشکی را به شکلی واضح بیان کند. با این تفاسیر، می‌توان آینده‌ای را تصور کرد که در آن هوش مصنوعی در تشخیص سریع‌تر و دقیق‌تر بیماری‌ها به پزشکان کمک می‌کند و دید بهتری به بیماران ارائه می‌دهد.

شکوفه عزیزی، محقق ایرانی واحد DeepMind گوگل که طی سال‌های گذشته تعداد زیادی از مقالاتش در معتبرترین مجلات عملی جهان منتشر شده‌اند، با انتشار پستی در ایکس (توییتر سابق) گفت: «برای معرفی ویژگی‌های جدید Med-Gemini بسیار هیجان‌زده‌ایم. تحقیقات جدید بر اساس سه مدل جدید انجام شدند که از مدل زبانی بزرگ Gemini 1.5 بهره می‌برند. Gemini 1.5 می‌تواند تصاویر پزشکی دوبعدی و برای اولین‌بار اسکن‌های سه‌بعدی رادیولوژی را مدیریت و درصد خطر ژنومی را محاسبه کند.»

هنوز در روزهای اولیه‌ی توسعه‌ی Med-Gemini به‌سر می‌بریم و برای اطمینان از ایمن بودن آن در دنیای واقعی، تحقیقات بیشتری نیاز است. حفظ عدالت و حراست از حریم خصوصی بیماران در اولویت قرار دارد. وجود سوگیری در هوش مصنوعی می‌تواند پیامدهای جدی داشته باشد، بنابراین توسعه‌ی مسئولانه اهمیت ویژه‌ای دارد.

با وجود دستاوردهای چشم‌گیر Med-Gemini، هدف این نیست که هوش مصنوعی مذکور جایگزین پزشکان شود. درواقع هوش مصنوعی می‌تواند به‌عنوان ابزاری قدرتمند در اختیار پزشکان قرار گیرد تا بتوانند کیفیت مراقبت از بیماران را ارتقاء دهند.

مدل‌های جمینای گوگل نسل جدیدی از مدل‌های هوش مصنوعی چندوجهی هستند، به این معنی که می‌توانند اطلاعات را از حالت‌های مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کنند. این مدل‌ها در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیده‌اند و آنچه که «استدلال با زمینه طولانی» یا استدلال از مقادیر زیادی داده مانند ساعت‌ها ویدیو یا ده‌ها ساعت صوت نامیده می‌شود، مهارت دارند.

هوش مصنوعی Med-Gemini تمام مزایای مدل‌های پایه جمینای را دارد، اما آنها را به خوبی تنظیم و متعادل کرده است. محققان این ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در مقاله گنجاندند. در این مقاله ۵۸ صفحه‌ای مطالب زیادی وجود دارد که در این گزارش به بیان چشمگیرترین آنها می‌پردازیم.
   
قابلیت‌های خودآموزی و جستجوی وب

رسیدن به یک تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعه‌ای از اطلاعات مرتبط دیگر مانند علائم بیمار، تاریخچه پزشکی، جراحی و اجتماعی، نتایج آزمایشگاهی و نتایج سایر آزمایشات تحقیقاتی و واکنش بیمار به درمان‌های قبلی گردآوری کنند تا درمان‌های موجود به‌روزرسانی شوند و درمان‌های جدیدی معرفی می‌شوند. همه این موارد بر استدلال بالینی پزشک تأثیر می‌گذارد.

به همین دلیل است که گوگل با Med-Gemini دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفته‌تر فراهم کرده است. این هوش مصنوعی مانند بسیاری از مدل‌های زبان بزرگ(LLM) متمرکز بر پزشکی با MedQA که حاوی سؤالات چند گزینه‌ای نماینده سؤالات آزمون مجوز پزشکی ایالات متحده(USMLE) است، آموزش دیده که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شده است.

با این حال، گوگل همچنین دو مجموعه داده جدید را برای مدل خود توسعه داده است. اولی MedQA-R (استدلال) است که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام «زنجیره افکار»(CoTs) گسترش می‌دهد. دومی MedQA-RS (استدلال و جستجو) است که دستورالعمل‌هایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه می‌دهد. بدین ترتیب اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته می‌شود تا یک جستجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.

هوش مصنوعی Med-Gemini بر روی ۱۴ معیار پزشکی آزمایش شد و عملکرد جدیدی را روی ۱۰ معیار اجرا کرد که از مدل GPT-۴ ساخته شرکت اوپن‌ای‌آی(OpenAI) پیشی گرفت. این مدل در معیار MedQA با استفاده از استراتژی جستجوی هدایت‌شده به دقت ۹۱.۱ درصدی دست یافت و از مدل زبان بزرگ مبتنی بر پزشکی پیشین گوگل موسوم به Med-PaLM ۲ تا ۴.۵ درصد بهتر عمل کرد.

هوش مصنوعی Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند حاوی تصاویر موارد چالش برانگیز بالینی که از یک لیست ۱۰تایی تشخیص داده می‌شود، به طور متوسط از ۴۴.۵ درصد بهتر از GPT-۴ عمل کرد.

محققان می‌گویند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستجو و کیفیت استنادها را در نظر نگرفته‌ایم. علاوه بر این، باید دید که آیا می‌توان به مدل‌های زبان بزرگ کوچک‌تر نیز استفاده از جستجوی وب را آموزش داد؟ ما این اکتشافات را به کارهای آینده واگذار می‌کنیم.


بازیابی اطلاعات خاص از پرونده‌های الکترونیکی پزشکی طولانی

پرونده الکترونیک سلامت(EHR) ممکن است بلندبالا باشد، اما پزشکان باید از محتوای آنها آگاه باشند. آنها گاهی پیچیده‌ هستند، چرا که معمولاً حاوی شباهت‌های متنی، املای غلط، کلمات اختصاری و مترادف‌ها هستند که می‌توانند هوش مصنوعی را به چالش بکشند.

بنابراین محققان برای آزمایش توانایی Med-Gemini در درک و استدلال از اطلاعات پزشکی بلندبالا و طولانی از یک پایگاه داده بزرگ و در دسترس عموم(Medical Information Mart for Intensive Care) که به مثابه پیدا کردن سوزن در انبار کاه است، استفاده کردند. این پایگاه حاوی داده‌های بیماران بستری در بخش‌های مراقبت‌های ویژه است.

هدف این بود که مدل بتواند یک وضعیت، علامت، یا درمان پزشکی کم‌استفاده و ظریف را در مجموعه بزرگی از یادداشت‌های بالینی بازیابی کند. دویست نمونه انتخاب شد و هر نمونه شامل مجموعه‌ای از پرونده‌های این پایگاه از ۴۴ بیمار بستری شده در بخش مراقبت‌های ویژه با سابقه پزشکی طولانی بود.

هوش مصنوعی Med-Gemini دو مرحله برای یافتن سوزن در انبار کاه پیش رو داشت. اول اینکه مجبور بود همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی می‌کرد. دوم اینکه باید ارتباط همه موارد را با هم ارزیابی می‌کرد، آنها را دسته‌بندی می‌کرد و نتیجه می‌گرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه می‌کرد. در نهایت این هوش مصنوعی عملکرد خوبی داشت.

محققان می‌گویند: شاید برجسته‌ترین جنبه Med-Gemini، قابلیت‌های پردازش سوابق طولانی باشد، زیرا آنها مرزهای عملکردی جدیدی را باز می‌کنند و امکانات کاربردی جدیدی را که قبلاً غیرممکن بود برای سیستم‌های هوش مصنوعی پزشکی فراهم می‌کنند. این وظیفه یافتن «سوزن در انبار کاه» منعکس کننده یک چالش در دنیای واقعی است که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیت‌های پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از داده‌های بیماران نشان می‌دهد.

گفتگو با Med-Gemini

در یک آزمایش در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی که خارش دارد، پرسید. این مدل پس از درخواست تصویر، سؤالات مناسب بعدی را پرسید و آن ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.

همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه یک بیمار را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که بتوان آن را در اختیار بیمار قرار داد.

محققان می‌گویند: قابلیت‌های مکالمه چندوجهی Med-Gemini امیدوارکننده است و چنین قابلیت‌هایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستم‌های هوش مصنوعی را فراهم می‌کنند. با این حال، محققان دریافتند که کار بیشتری لازم است.

آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی، از جمله کمک به پزشکان و بیماران است، البته خطرات قابل توجهی نیز به دنبال دارد. در حالی که پتانسیل تحقیقات آینده در این حوزه را برجسته می‌کنیم، ما توانایی‌های مکالمه بالینی را در این کار، همانطور که قبلاً توسط دیگران در تحقیقات اختصاصی در زمینه هوش مصنوعی تشخیصی محاوره‌ای بررسی شده بود، به ‌طور دقیق مورد بررسی قرار نداده‌ایم.

گزارش از امیر کریمی

نظر شما