گوگل با ایجاد نسل جدیدی از مدل های هوش مصنوعی تحت نام Med-Gemini به قابلیت های قابل توجهی در تشخیص بالینی دست یافته است.
من گزارش میدم تکناکاین مدل ها در تست های پزشکی بهتر از مدل های قبلی عمل کردند و می توانند با استفاده از جستجوی وب دقت پاسخ خود را در مواقع عدم قطعیت افزایش دهند. Med-Gemini در نهایت به عنوان ابزاری برای پزشکان در نظر گرفته شده است تا به آنها کمک کند تا از طریق تجزیه و تحلیل دقیق داده های بیمار، مراقبت های پزشکی بهتری ارائه دهند.
Google Research و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل، DeepMind، دامنه چشمگیر هوش مصنوعی Med-Gemini، خانواده ای از مدل های پیشرفته هوش مصنوعی متخصص در پزشکی را توصیف کردند.
پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده درمان می کنند. برای ارائه درمان موثر باید با پرونده سلامت هر بیمار آشنا بوده و از آخرین روش ها و درمان ها به روز باشند. سپس رابطه بسیار مهمی بین پزشک و بیمار شکل می گیرد که مبتنی بر همدلی، اعتماد و ارتباط است. برای اینکه یک هوش مصنوعی بتواند از یک پزشک واقعی تقلید کند، باید بتواند همه این کارها را انجام دهد.
امروزه مرز بین هوش مصنوعی و پزشکی واقعاً تنگ شده است. در شش ماه گذشته، نیواطلس در مورد مدلهای هوش مصنوعی گزارش داده است که به پزشکان کمتر باتجربه کمک کردهاند پیشسازهای سرطان روده بزرگ را شناسایی کنند، اوتیسم دوران کودکی را از روی عکسهای چشمها تشخیص دهند و فوراً پیشبینی کنند که آیا جراح تمام بافتهای سرطانی را در طول سرطان سینه برداشته است یا خیر. نه، کمک می کند. اما Med-Gemini چیز دیگری است.
Med-Gemini گوگل نسل جدیدی از مدلهای هوش مصنوعی چندوجهی است، به این معنی که میتواند اطلاعات را از حالتهای مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کند. مدلهای هوش مصنوعی به زبان و مکالمه مسلط هستند، دادههای متنوعی را که بر روی آنها آموزش دیدهاند، درک میکنند، و آنچه به آن استدلال زمینه طولانی یا استدلال از مقادیر زیادی داده، مانند ساعتها ویدیو یا دهها ساعت صدا میگویند، میگویند.
Med-Gemini تمام مزایای مدل های پایه Gemini را دارد، اما به خوبی تنظیم شده است. محققان ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در گزارشی گنجاندند. این مقاله 58 صفحه است و مهم ترین نکات آن را در این مقاله قرار داده ایم.
قابلیت های خودآموزی و جستجوی وب
تشخیص و تدوین یک برنامه درمانی به پزشکان نیاز دارد که دانش پزشکی خود را با طیف وسیعی از اطلاعات مرتبط دیگر مانند: علائم بیمار، تاریخچه پزشکی، جراحی، نتایج آزمایشگاهی و سایر آزمایشات و پاسخ بیمار به درمان های قبلی ترکیب کنند. بر اساس این اطلاعات، درمان های موجود به روز شده و درمان های جدید معرفی می شوند. همه این عوامل بر قضاوت بالینی پزشک تأثیر می گذارد.
به همین دلیل است که با Med-Gemini، گوگل دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفتهتر فراهم کرد. مانند بسیاری از LLM های متمرکز بر پزشکی، Med-Gemini در MedQA آموزش دید، مجموعه ای از سوالات چند گزینه ای نماینده آزمون مجوز پزشکی ایالات متحده (USMLE) که برای آزمایش دانش و استدلال پزشکی در سناریوهای مختلف طراحی شده است.
با این حال، گوگل دو مجموعه داده جدید برای مدل خود ایجاد کرده است. اولین مورد MedQA-R (استدلال) نامیده می شود که MedQA را با توضیحاتی که به طور مصنوعی برای استدلال ایجاد شده است به نام زنجیره های فکر (CoT) گسترش می دهد.
دومی که MedQA-RS (استدلال و جستجو) نام دارد، دستورالعمل هایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ مدل ارائه می دهد. اگر یک سوال پزشکی به پاسخ نامشخصی منجر شود، از مدل خواسته میشود تا جستجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.
Med-Gemini بر روی 14 معیار پزشکی آزمایش شد و یک وضعیت عملکرد جدید (SoTA) را روی 10 معیار ایجاد کرد، که در هر معیاری که قابل مقایسه بود، بهتر از خانواده مدلهای GPT-4 عمل کرد. در معیار MedQA (USMLE)، Med-Gemini با استفاده از استراتژی جستجوی مبتنی بر عدم قطعیت به دقت 91.1% دست یافت که از مدل زبان پزشکی بزرگ قبلی گوگل، Med-PaLM 2، 4.5% بهتر بود.
Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند (NEJM)، که مجموعهای از تصاویر چالش برانگیز بالینی است که با فهرستی از 10 ویژگی ارزیابی میشوند، با حاشیه نسبی متوسط 44.5% از GPT-4 بهتر عمل میکند.
به گفته محققان، اگرچه نتایج امیدوارکننده است، اما به تحقیقات بیشتری نیاز است. برای مثال، ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، استفاده از استخراج جستجوی چند متغیره، یا انجام تجزیه و تحلیل دقت و ارتباط نتایج جستجو و کیفیت استناد را در نظر نگرفتیم. علاوه بر این، باید دید که آیا می توان به LLM های کوچکتر نیز استفاده از جستجوی وب را آموزش داد. این یافته ها را برای تحقیقات آتی می گذاریم.
استخراج اطلاعات خاص از پرونده های الکترونیکی طولانی سلامت
پرونده الکترونیک سلامت (EHR) ممکن است طولانی باشد، اما پزشکان باید از محتوای آنها آگاه باشند. برای پیچیده تر کردن مسائل، آنها اغلب حاوی شباهت های متنی (دیابت شیرین در مقابل نفروپاتی دیابتی)، املای غلط، اختصارات (نسخه در مقابل نسخه)، و مترادف (حادثه عروق مغزی در مقابل سکته مغزی) هستند که می تواند هوش مصنوعی را گیج کند.
برای آزمایش توانایی Med-Gemini در درک و استدلال در مورد اطلاعات پزشکی درازمدت، محققان از یک پایگاه داده بزرگ و در دسترس عموم به نام Medical Information Mart for Intensive Care استفاده کردند که حاوی داده های بهداشتی شناسایی نشده از بیماران تحت مراقبت های ویژه است.
هدف این بود که مدل اشارهای به یک وضعیت، علامت یا روش پزشکی نادر و ظریف در مجموعه بزرگی از یادداشتهای بالینی در پرونده سلامت الکترونیکی استخراج کند.
200 نمونه انتخاب شد و هر نمونه شامل مجموعه ای از یادداشت ها در پرونده الکترونیکی سلامت غیرقابل شناسایی از 44 بیمار ICU با سابقه پزشکی طولانی بود. آنها باید معیارهای زیر را داشته باشند:
- بیش از 100 یادداشت پزشکی، با طول هر نمونه از 200000 تا 700000 کلمه
- در هر مثال، بیماری فقط یک بار ذکر شده است
- هر نمونه یک بیماری دارد
دو مرحله سخت بود. اول، Med-Gemini باید تمام موارد ذکر شده در مورد یک مشکل پزشکی خاص را از سوابق گسترده بازیابی می کرد. دوم، مدل باید ارتباط همه ذکرها را ارزیابی میکرد، آنها را دستهبندی میکرد و استنباط میکرد که آیا بیمار سابقه این مشکل را داشته است یا خیر و دلیل روشنی برای تصمیمگیری ارائه میداد.
در مقایسه با روش SoTA، Med-Gemini این کار دشوار و ظریف را به خوبی انجام داد. در مقایسه با روش SoTA (0.85)، امتیاز 0.77 را برای دقت کسب کرد و از روش SoTA برای یادآوری بهتر بود: 0.76 در مقابل 0.73.
به گفته محققان، شاید قابل توجه ترین جنبه Med-Gemini قابلیت های پردازش از راه دور آن باشد، زیرا محققان امروزی مرزهای عملکردی جدیدی را باز می کنند و برنامه های کاربردی جدیدی را که قبلا غیرممکن بود برای سیستم های هوش مصنوعی پزشکی ارائه می دهند. این وظایف حیاتی منعکس کننده چالش دنیای واقعی پیش روی پزشکان است و عملکرد Med-Gemini پتانسیل خود را برای کاهش قابل توجه بار شناختی و بهبود قابلیت های پزشک با استخراج و تجزیه و تحلیل کارآمد اطلاعات از حجم زیادی از داده های بیمار نشان می دهد.
گفتگو با عسل-جمینی
در آزمایشی برای سنجش میزان سودمندی هوش مصنوعی در دنیای واقعی، یک کاربر بیمار از Med-Gemini درباره یک توده پوستی خارش دار پرسید. پس از درخواست تصویر، مدل سؤالات مربوطه را پرسید و ضایعه نادر را به درستی شناسایی کرد و به کاربر توصیه کرد که در مرحله بعد چه کاری انجام دهد.
همچنین از Med-Gemini خواسته شد که عکس رادیولوژی قفسه سینه را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تهیه کند که می تواند در حالی که پزشک منتظر گزارش رسمی رادیولوژیست است به بیمار داده شود.
به گفته محققان، قابلیتهای مکالمه چندوجهی Med-Gemini-M 1.5 با توجه به اینکه بدون تنظیم دقیق مکالمه پزشکی به دست میآیند امیدوارکننده است. چنین قابلیت هایی تعامل یکپارچه و طبیعی را بین انسان ها، پزشکان و سیستم های هوش مصنوعی امکان پذیر می کند.
با این حال، محققان به این نتیجه رسیدند که کار بیشتری لازم است.
آنها گفتند که این امکان پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی از جمله کمک به پزشکان و بیماران دارد، اما مطمئناً خطرات قابل توجهی را به همراه دارد. اگرچه ما پتانسیل تحقیقات آینده در این زمینه را برجسته میکنیم، اما به طور کامل قابلیتهای مکالمه بالینی این هوش مصنوعی را بررسی نکردهایم.
چشم انداز آینده
محققان اذعان میکنند که هنوز کارهای زیادی برای انجام دادن وجود دارد، اما قابلیتهای اولیه مدل Med-Gemini قطعا امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی از جمله حفظ حریم خصوصی و انصاف را در طول فرآیند توسعه مدل بگنجانند.
به گفته محققان، ملاحظات حفظ حریم خصوصی باید به طور خاص ریشه در سیاست ها و مقررات مراقبت های بهداشتی موجود داشته باشد که اطلاعات بیمار را مدیریت و محافظت می کند. عدالت حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که سیستمهای هوش مصنوعی در مراقبتهای بهداشتی ممکن است سوگیریها و نابرابریهای تاریخی را منعکس یا تقویت کنند، که به طور بالقوه منجر به عملکرد مدلهای مختلف و نتایج مضر میشود.
اما در نهایت Med-Gemini ابزار خوبی در نظر گرفته می شود.
به گفته محققان، الگوهای زبانی بزرگ عصر جدیدی از سلامت و امکانات پزشکی را آغاز می کند. قابلیتهای نشاندادهشده توسط Gemini و Med-Gemini نشاندهنده جهش قابل توجهی در این زمینه و وسعت فرصتها برای تسریع در کشف زیستپزشکی و حمایت از ارائه مراقبتهای پزشکی مناسب است. با این حال، بسیار مهم است که بهبود در قابلیت های مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستم ها همراه باشد. با اولویتبندی هر دو جنبه، میتوانیم با مسئولیتپذیری آیندهای را متصور شویم که در آن قابلیتهای سیستمهای هوش مصنوعی شتابدهندههای معنادار و ایمن پیشرفت علمی و مراقبتهای پزشکی باشند.
این مطالعه از طریق وب سایت arXiv در دسترس است.