Google Med-Gemini AI ابزاری موثر برای پزشکان است – با یک تماس


گوگل با ایجاد نسل جدیدی از مدل های هوش مصنوعی تحت نام Med-Gemini به قابلیت های قابل توجهی در تشخیص بالینی دست یافته است.

من گزارش میدم تکناکاین مدل ها در تست های پزشکی بهتر از مدل های قبلی عمل کردند و می توانند با استفاده از جستجوی وب دقت پاسخ خود را در مواقع عدم قطعیت افزایش دهند. Med-Gemini در نهایت به عنوان ابزاری برای پزشکان در نظر گرفته شده است تا به آنها کمک کند تا از طریق تجزیه و تحلیل دقیق داده های بیمار، مراقبت های پزشکی بهتری ارائه دهند.

Google Research و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل، DeepMind، دامنه چشمگیر هوش مصنوعی Med-Gemini، خانواده ای از مدل های پیشرفته هوش مصنوعی متخصص در پزشکی را توصیف کردند.

پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده درمان می کنند. برای ارائه درمان موثر باید با پرونده سلامت هر بیمار آشنا بوده و از آخرین روش ها و درمان ها به روز باشند. سپس رابطه بسیار مهمی بین پزشک و بیمار شکل می گیرد که مبتنی بر همدلی، اعتماد و ارتباط است. برای اینکه یک هوش مصنوعی بتواند از یک پزشک واقعی تقلید کند، باید بتواند همه این کارها را انجام دهد.

امروزه مرز بین هوش مصنوعی و پزشکی واقعاً تنگ شده است. در شش ماه گذشته، نیواطلس در مورد مدل‌های هوش مصنوعی گزارش داده است که به پزشکان کمتر باتجربه کمک کرده‌اند پیش‌سازهای سرطان روده بزرگ را شناسایی کنند، اوتیسم دوران کودکی را از روی عکس‌های چشم‌ها تشخیص دهند و فوراً پیش‌بینی کنند که آیا جراح تمام بافت‌های سرطانی را در طول سرطان سینه برداشته است یا خیر. نه، کمک می کند. اما Med-Gemini چیز دیگری است.

Med-Gemini گوگل نسل جدیدی از مدل‌های هوش مصنوعی چندوجهی است، به این معنی که می‌تواند اطلاعات را از حالت‌های مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کند. مدل‌های هوش مصنوعی به زبان و مکالمه مسلط هستند، داده‌های متنوعی را که بر روی آنها آموزش دیده‌اند، درک می‌کنند، و آنچه به آن استدلال زمینه طولانی یا استدلال از مقادیر زیادی داده، مانند ساعت‌ها ویدیو یا ده‌ها ساعت صدا می‌گویند، می‌گویند.

Med-Gemini تمام مزایای مدل های پایه Gemini را دارد، اما به خوبی تنظیم شده است. محققان ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در گزارشی گنجاندند. این مقاله 58 صفحه است و مهم ترین نکات آن را در این مقاله قرار داده ایم.

قابلیت های خودآموزی و جستجوی وب

تشخیص و تدوین یک برنامه درمانی به پزشکان نیاز دارد که دانش پزشکی خود را با طیف وسیعی از اطلاعات مرتبط دیگر مانند: علائم بیمار، تاریخچه پزشکی، جراحی، نتایج آزمایشگاهی و سایر آزمایشات و پاسخ بیمار به درمان های قبلی ترکیب کنند. بر اساس این اطلاعات، درمان های موجود به روز شده و درمان های جدید معرفی می شوند. همه این عوامل بر قضاوت بالینی پزشک تأثیر می گذارد.

به همین دلیل است که با Med-Gemini، گوگل دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفته‌تر فراهم کرد. مانند بسیاری از LLM های متمرکز بر پزشکی، Med-Gemini در MedQA آموزش دید، مجموعه ای از سوالات چند گزینه ای نماینده آزمون مجوز پزشکی ایالات متحده (USMLE) که برای آزمایش دانش و استدلال پزشکی در سناریوهای مختلف طراحی شده است.

چگونه ابزارهای خودآموزی و جستجوی آنلاین Med-Gemini کار می کنند

با این حال، گوگل دو مجموعه داده جدید برای مدل خود ایجاد کرده است. اولین مورد MedQA-R (استدلال) نامیده می شود که MedQA را با توضیحاتی که به طور مصنوعی برای استدلال ایجاد شده است به نام زنجیره های فکر (CoT) گسترش می دهد.

دومی که MedQA-RS (استدلال و جستجو) نام دارد، دستورالعمل هایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ مدل ارائه می دهد. اگر یک سوال پزشکی به پاسخ نامشخصی منجر شود، از مدل خواسته می‌شود تا جستجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.

Med-Gemini بر روی 14 معیار پزشکی آزمایش شد و یک وضعیت عملکرد جدید (SoTA) را روی 10 معیار ایجاد کرد، که در هر معیاری که قابل مقایسه بود، بهتر از خانواده مدل‌های GPT-4 عمل کرد. در معیار MedQA (USMLE)، Med-Gemini با استفاده از استراتژی جستجوی مبتنی بر عدم قطعیت به دقت 91.1% دست یافت که از مدل زبان پزشکی بزرگ قبلی گوگل، Med-PaLM 2، 4.5% بهتر بود.

Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند (NEJM)، که مجموعه‌ای از تصاویر چالش برانگیز بالینی است که با فهرستی از 10 ویژگی ارزیابی می‌شوند، با حاشیه نسبی متوسط ​​44.5% از GPT-4 بهتر عمل می‌کند.

به گفته محققان، اگرچه نتایج امیدوارکننده است، اما به تحقیقات بیشتری نیاز است. برای مثال، ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، استفاده از استخراج جستجوی چند متغیره، یا انجام تجزیه و تحلیل دقت و ارتباط نتایج جستجو و کیفیت استناد را در نظر نگرفتیم. علاوه بر این، باید دید که آیا می توان به LLM های کوچکتر نیز استفاده از جستجوی وب را آموزش داد. این یافته ها را برای تحقیقات آتی می گذاریم.

استخراج اطلاعات خاص از پرونده های الکترونیکی طولانی سلامت

پرونده الکترونیک سلامت (EHR) ممکن است طولانی باشد، اما پزشکان باید از محتوای آنها آگاه باشند. برای پیچیده تر کردن مسائل، آنها اغلب حاوی شباهت های متنی (دیابت شیرین در مقابل نفروپاتی دیابتی)، املای غلط، اختصارات (نسخه در مقابل نسخه)، و مترادف (حادثه عروق مغزی در مقابل سکته مغزی) هستند که می تواند هوش مصنوعی را گیج کند.

برای آزمایش توانایی Med-Gemini در درک و استدلال در مورد اطلاعات پزشکی درازمدت، محققان از یک پایگاه داده بزرگ و در دسترس عموم به نام Medical Information Mart for Intensive Care استفاده کردند که حاوی داده های بهداشتی شناسایی نشده از بیماران تحت مراقبت های ویژه است.

هدف این بود که مدل اشاره‌ای به یک وضعیت، علامت یا روش پزشکی نادر و ظریف در مجموعه بزرگی از یادداشت‌های بالینی در پرونده سلامت الکترونیکی استخراج کند.

200 نمونه انتخاب شد و هر نمونه شامل مجموعه ای از یادداشت ها در پرونده الکترونیکی سلامت غیرقابل شناسایی از 44 بیمار ICU با سابقه پزشکی طولانی بود. آنها باید معیارهای زیر را داشته باشند:

  • بیش از 100 یادداشت پزشکی، با طول هر نمونه از 200000 تا 700000 کلمه
  • در هر مثال، بیماری فقط یک بار ذکر شده است
  • هر نمونه یک بیماری دارد

دو مرحله سخت بود. اول، Med-Gemini باید تمام موارد ذکر شده در مورد یک مشکل پزشکی خاص را از سوابق گسترده بازیابی می کرد. دوم، مدل باید ارتباط همه ذکرها را ارزیابی می‌کرد، آنها را دسته‌بندی می‌کرد و استنباط می‌کرد که آیا بیمار سابقه این مشکل را داشته است یا خیر و دلیل روشنی برای تصمیم‌گیری ارائه می‌داد.

در مقایسه با روش SoTA، Med-Gemini این کار دشوار و ظریف را به خوبی انجام داد. در مقایسه با روش SoTA (0.85)، امتیاز 0.77 را برای دقت کسب کرد و از روش SoTA برای یادآوری بهتر بود: 0.76 در مقابل 0.73.

به گفته محققان، شاید قابل توجه ترین جنبه Med-Gemini قابلیت های پردازش از راه دور آن باشد، زیرا محققان امروزی مرزهای عملکردی جدیدی را باز می کنند و برنامه های کاربردی جدیدی را که قبلا غیرممکن بود برای سیستم های هوش مصنوعی پزشکی ارائه می دهند. این وظایف حیاتی منعکس کننده چالش دنیای واقعی پیش روی پزشکان است و عملکرد Med-Gemini پتانسیل خود را برای کاهش قابل توجه بار شناختی و بهبود قابلیت های پزشک با استخراج و تجزیه و تحلیل کارآمد اطلاعات از حجم زیادی از داده های بیمار نشان می دهد.

گفتگو با عسل-جمینی

در آزمایشی برای سنجش میزان سودمندی هوش مصنوعی در دنیای واقعی، یک کاربر بیمار از Med-Gemini درباره یک توده پوستی خارش دار پرسید. پس از درخواست تصویر، مدل سؤالات مربوطه را پرسید و ضایعه نادر را به درستی شناسایی کرد و به کاربر توصیه کرد که در مرحله بعد چه کاری انجام دهد.

همچنین از Med-Gemini خواسته شد که عکس رادیولوژی قفسه سینه را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تهیه کند که می تواند در حالی که پزشک منتظر گزارش رسمی رادیولوژیست است به بیمار داده شود.

نمونه ای از گفتگوی تشخیصی Med-Gemini برای یک مشکل پوستی

به گفته محققان، قابلیت‌های مکالمه چندوجهی Med-Gemini-M 1.5 با توجه به اینکه بدون تنظیم دقیق مکالمه پزشکی به دست می‌آیند امیدوارکننده است. چنین قابلیت هایی تعامل یکپارچه و طبیعی را بین انسان ها، پزشکان و سیستم های هوش مصنوعی امکان پذیر می کند.

با این حال، محققان به این نتیجه رسیدند که کار بیشتری لازم است.

آنها گفتند که این امکان پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی از جمله کمک به پزشکان و بیماران دارد، اما مطمئناً خطرات قابل توجهی را به همراه دارد. اگرچه ما پتانسیل تحقیقات آینده در این زمینه را برجسته می‌کنیم، اما به طور کامل قابلیت‌های مکالمه بالینی این هوش مصنوعی را بررسی نکرده‌ایم.

چشم انداز آینده

محققان اذعان می‌کنند که هنوز کارهای زیادی برای انجام دادن وجود دارد، اما قابلیت‌های اولیه مدل Med-Gemini قطعا امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی از جمله حفظ حریم خصوصی و انصاف را در طول فرآیند توسعه مدل بگنجانند.

به گفته محققان، ملاحظات حفظ حریم خصوصی باید به طور خاص ریشه در سیاست ها و مقررات مراقبت های بهداشتی موجود داشته باشد که اطلاعات بیمار را مدیریت و محافظت می کند. عدالت حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که سیستم‌های هوش مصنوعی در مراقبت‌های بهداشتی ممکن است سوگیری‌ها و نابرابری‌های تاریخی را منعکس یا تقویت کنند، که به طور بالقوه منجر به عملکرد مدل‌های مختلف و نتایج مضر می‌شود.

اما در نهایت Med-Gemini ابزار خوبی در نظر گرفته می شود.

به گفته محققان، الگوهای زبانی بزرگ عصر جدیدی از سلامت و امکانات پزشکی را آغاز می کند. قابلیت‌های نشان‌داده‌شده توسط Gemini و Med-Gemini نشان‌دهنده جهش قابل توجهی در این زمینه و وسعت فرصت‌ها برای تسریع در کشف زیست‌پزشکی و حمایت از ارائه مراقبت‌های پزشکی مناسب است. با این حال، بسیار مهم است که بهبود در قابلیت های مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستم ها همراه باشد. با اولویت‌بندی هر دو جنبه، می‌توانیم با مسئولیت‌پذیری آینده‌ای را متصور شویم که در آن قابلیت‌های سیستم‌های هوش مصنوعی شتاب‌دهنده‌های معنادار و ایمن پیشرفت علمی و مراقبت‌های پزشکی باشند.

این مطالعه از طریق وب سایت arXiv در دسترس است.

Related Posts