انویدیا پلتفرم بلکول (Blackwell) را معرفی کرد: پیش به سوی هوش مصنوعی تریلیون پارامتری!


در کنفرانس سالانه GTC انویدیا که این هفته در مرکز همایش‌های سن‌خوزه برگزار شد، این غول دنیای فناوری از تراشه هسته تنسور «بلکول بی 200» (Blackwell B200) رونمایی کرد. این تراشه که قدرتمندترین پردازنده گرافیکی تک تراشه این شرکت با 208 میلیارد ترانزیستور است، می‌تواند به گفته انویدیا، هزینه‌های عملیاتی استنتاج هوش مصنوعی (مانند اجرای ChatGPT) و مصرف انرژی را تا 25 برابر نسبت به H100 کاهش دهد. این شرکت همچنین از GB200، یک «ابر تراشه» که دو تراشه B200 و یک Grace CPU را برای عملکردی حتی بالاتر ترکیب می‌کند، رونمایی کرد. با دیجی رو همراه باشید.

مدیرعامل انویدیا، جنسن هوانگ در سخنرانی اصلی خود گفت: «ما به پردازنده‌های گرافیکی بزرگ‌تری نیاز داریم.» او ادعا کرد که پلتفرم بلکول امکان آموزش مدل‌های هوش مصنوعی با تریلیون‌ها پارامتر را فراهم می‌کند که مدل‌های هوش مصنوعی مولد امروزی در کنار آن کاملاً ابتدایی جلوه خواهند کرد! برای درک بهتر، GPT-3 متعلق به OpenAI که در سال 2020 عرضه شد، شامل 175 میلیارد پارامتر بود. شایان ذکر است که تعداد پارامتر نشانگر تقریبی پیچیدگی مدل هوش مصنوعی است.

انویدیا معماری بلکول را به افتخار دیوید هارولد بلکول، ریاضیدان برجسته متخصص در نظریه بازی‌ها و آمار و اولین دانشمند سیاه‌پوستی که به آکادمی ملی علوم آمریکا راه یافت، نامگذاری کرده است. این پلتفرم شش فناوری را برای محاسبات شتاب‌دهنده معرفی می‌کند، از جمله: موتور ترنسفورماتور نسل دوم، NVLink نسل پنجم، موتور RAS، قابلیت‌های ایمن هوش مصنوعی و یک موتور رفع‌فشرده‌سازی برای پرس‌وجوهای سریع پایگاه داده.

انتظار می‌رود سازمان‌های مهمی مانند آمازون وب‌سرویس، دل تکنولوژی، گوگل، متا، مایکروسافت، OpenAI، اوراکل، تسلا و xAI پلتفرم بلکول را به کار بگیرند. بیانیه مطبوعاتی انویدیا مملو از نقل قول‌هایی از مدیران عامل شرکت‌های فناوری (مشتریان کلیدی انویدیا) مانند مارک زاکربرگ و سم التمن است که پلتفرم جدید این شرکت را تحسین می‌کنند.

پردازنده‌های گرافیکی که زمانی فقط برای اجرای بازی طراحی شده بودند، به لطف معماری موازی عظیم‌شان که تعداد بی‌شماری از کارهای ضرب ماتریس را که برای اجرای شبکه‌های عصبی امروزی ضروری است، تسریع می‌کند، برای کارهای هوش مصنوعی نیز بسیار مناسب هستند. با ظهور معماری‌های جدید یادگیری عمیق در دهه 2010، انویدیا خود را در موقعیت ایده‌آلی برای کسب سود از انقلاب هوش مصنوعی دید و شروع به طراحی پردازنده‌های گرافیکی ویژه‌ای کرد که صرفاً برای تسریع مدل‌های هوش مصنوعی در نظر گرفته شده‌اند.

تمرکز انویدیا روی مرکز داده، این شرکت را بسیار ثروتمند و باارزش کرده است و این تراشه‌های جدید نیز روند رو به رشد این شرکت را ادامه خواهند داد. در سه ماهه گذشته، درآمد انویدیا از پردازنده‌های گرافیکی تولید شده برای بازی 2.9 میلیارد دلار بوده که در مقایسه با درآمد 18.4 میلیارد دلاری مرکز داده بسیار ناچیز است و این اختلاف هر روز بیشتر هم می‌شود.

غولی درون یک غول دیگر!

تراشه Grace Blackwell GB200 که پیش‌تر به آن اشاره شد، به عنوان بخشی کلیدی از سیستم رایانه‌ای NVIDIA GB200 NVL72 وارد بازار می‌شود. این سیستم رایانه‌ای مرکز داده چند-نود (multi-node) و مجهز به خنک‌کننده مایع به طور خاص برای کارهای آموزش و استنتاج هوش مصنوعی طراحی شده است. این سیستم 36 عدد ابرتراشه GB200 (در مجموع 72 پردازنده گرافیکی B200 و 36 چیپ Grace CPU) را با هم ترکیب می‌کند که توسط NVLink نسل پنجم به هم متصل شده‌اند تا عملکرد را چند برابر کنند!

انویدیا گفته:

GB200 NVL72 برای کارهای استنتاج LLM (مدل‌های زبانی بزرگ) تا 30 برابر افزایش عملکرد نسبت به همان تعداد پردازنده گرافیکی هسته تنسور NVIDIA H100 ارائه می‌دهد و در عین حال، هزینه و مصرف انرژی را نیز تا 25 برابر کاهش می‌دهد.

چنین افزایش سرعتی به طور بالقوه می‌تواند باعث صرفه‌جویی در زمان و هزینه هنگام اجرای مدل‌های هوش مصنوعی فعلی شود، اما همچنین امکان ساخت مدل‌های هوش مصنوعی پیچیده‌تر را نیز فراهم می‌کند. مدل‌های هوش مصنوعی مولد، مانند مدل‌هایی که گوگل جمینی و تولیدکننده‌های تصویر هوش مصنوعی را نیرو می‌دهند، به شکلی واضح نیازمند محاسبات بسیار زیادی هستند.

کمبود توان محاسباتی به طور گسترده به عنوان مانعی برای پیشرفت و تحقیق در حوزه هوش مصنوعی شناخته می‌شود و تلاش و جستجو برای دستیابی به توان محاسباتی بیشتر منجر به اقداماتی مانند اقدام اخیر مدیرعامل OpenAI، سم التمن، برای بستن قراردادهایی جهت ایجاد کارخانه‌های تراشه‌سازی جدید شده است.

با وجود اهمیت ادعاهای انویدیا درباره قابلیت‌های پلتفرم بلکول، عملکرد واقعی آن و مقیاس پذیرش این فناوری در دنیای واقعی (با شروع پیاده‌سازی و استفاده از این پلتفرم توسط سازمان‌ها) هنوز مشخص نیست. علاوه بر این، رقبایی مانند اینتل و ای‌ام‌دی نیز به دنبال کسب سهمی از بازار هوش مصنوعی انویدیا هستند و این رقابت هر روز داغ‌تر از دیروز می‌شود.

انویدیا اعلام کرده است که محصولات مبتنی بر بلکول از اواخر سال 2024 از طریق شرکای تجاری مختلف در دسترس خواهند بود.

Related Posts

دیدگاهتان را بنویسید