انویدیا با سرورهای GB200 بلک‌ول، عملکرد هوش مصنوعی را به شکلی خیره‌کننده ۱۰ برابر افزایش داد

NVIDIA Shatters MoE AI Performance Records With a Massive 10x Leap on GB200 ‘Blackwell NVL72 Servers Fueled by Co Design Breakthroughs

انویدیا، غول پردازشگرهای گرافیکی، با رونمایی از سرورهای پیشرفته GB200 بلک‌ول NVL72 خود، بار دیگر توانایی‌اش در مرزهای نوآوری هوش مصنوعی را به اثبات رساند. این شرکت اعلام کرده است که با این معماری انقلابی، موفق به افزایش ۱۰ برابری عملکرد هوش مصنوعی در مدل‌های Mixture-of-Experts (MoE) شده است؛ دستاوردی که مسیر توسعه نسل بعدی سیستم‌های هوشمند را هموارتر می‌سازد. این پیشرفت چشمگیر، نتیجه یک رویکرد جامع و نوآورانه در «طراحی مشترک» سخت‌افزار و نرم‌افزار است و یک گام بلند در جهت رفع چالش‌های مقیاس‌پذیری در پردازش‌های سنگین هوش مصنوعی محسوب می‌شود.

گرافیک مفهومی نشان‌دهنده ارتباط شبکه عصبی تراشه‌ها با سرور رک انویدیا.

جهش بی‌سابقه در عملکرد هوش مصنوعی با معماری بلک‌ول انویدیا

انویدیا در بیانیه مطبوعاتی اخیر خود، جزئیات آزمایش‌های انجام‌شده بر روی خوشه هوش مصنوعی بلک‌ول GB200 NVL72 را منتشر کرد. این آزمایش‌ها با استفاده از مدل زبان بزرگ متن‌باز Kimi K2 Thinking که دارای ۳۲ میلیارد پارامتر فعال و یکی از مدل‌های برجسته MoE است، صورت گرفت. نتایج به‌وضوح نشان داد که معماری جدید بلک‌ول در مقایسه با نسل قبلی خود، یعنی سرورهای Hopper HGX 200، عملکرد هوش مصنوعی را تا ۱۰ برابر سریع‌تر ارائه می‌دهد. این جهش عظیم نه تنها نشان‌دهنده برتری تکنولوژیکی انویدیا است، بلکه تأکید می‌کند که معماری بلک‌ول برای مقابله با نیازهای محاسباتی فزاینده مدل‌های پیشرفته MoE طراحی شده و آماده است. این دستاورد به معنای پردازش سریع‌تر، کارآمدتر و در نهایت هوشمندتر شدن سیستم‌های هوش مصنوعی است.

مدل‌های هوش مصنوعی MoE: ستاره‌های نوظهور در دنیای هوش مصنوعی

مدل‌های Mixture-of-Experts یا MoE، به دلیل بهره‌وری محاسباتی بالای خود، به سرعت در حال تبدیل شدن به یک استاندارد کلیدی در حوزه هوش مصنوعی هستند. برخلاف مدل‌های زبان بزرگ سنتی (LLMs) که برای هر درخواست، تمام پارامترهای خود را فعال می‌کنند، مدل‌های MoE هوشمندانه عمل کرده و تنها زیرمجموعه‌ای از «متخصصان» خود را متناسب با نوع پرس‌وجو به کار می‌گیرند. این رویکرد باعث کاهش چشمگیر مصرف منابع محاسباتی می‌شود. با این حال، مقیاس‌پذیری و افزایش اندازه این مدل‌ها همواره با چالش‌های ارتباطی و گلوگاه‌های محاسباتی همراه بوده که از بهره‌برداری کامل از پتانسیل آن‌ها جلوگیری می‌کرد. دستیابی به عملکرد هوش مصنوعی ۱۰ برابری با سرورهای بلک‌ول انویدیا، این مانع بزرگ را از میان برمی‌دارد و راه را برای ساخت مدل‌های MoE با پارامترهای بسیار بیشتر و توانایی‌های بی‌نظیر باز می‌کند. این تحول، درک و تولید زبان طبیعی، پردازش تصویر و سایر وظایف پیچیده هوش مصنوعی را متحول خواهد کرد.

راز سرعت خیره‌کننده: فناوری‌های کلیدی در دل معماری بلک‌ول

راز دستیابی به این جهش بی‌نظیر در عملکرد هوش مصنوعی، در رویکرد منحصر به فرد «طراحی مشترک» انویدیا نهفته است؛ جایی که سخت‌افزار و نرم‌افزار به صورت هم‌زمان و هماهنگ بهینه شده‌اند. این استراتژی به انویدیا اجازه داده است تا بر محدودیت‌های ارتباطی مرسوم در سیستم‌های مقیاس بزرگ غلبه کند. پیکربندی سرورهای GB200 بلک‌ول با ویژگی‌های زیر، یک زیرساخت قدرتمند را فراهم می‌آورد:

۷۲ تراشه GB200: این تراشه‌ها که شامل پردازنده‌های گرافیکی Blackwell و پردازنده‌های مرکزی Grace هستند، توان پردازشی بی‌سابقه‌ای را ارائه می‌دهند.

۳۰ ترابایت حافظه سریع مشترک: این حجم عظیم حافظه امکان موازی‌سازی تخصصی در سطحی بی‌سابقه را فراهم می‌کند و اطمینان می‌دهد که دسته‌های توکن به طور مداوم و بهینه میان پردازنده‌های گرافیکی تقسیم شوند، در نتیجه حجم ارتباطات غیرضروری به حداقل می‌رسد.

علاوه بر بهینه‌سازی‌های سخت‌افزاری، نرم‌افزار نیز نقش حیاتی در این دستاورد ایفا کرده است:

چهارچوب Dynamo انویدیا: این چهارچوب با تخصیص هوشمند وظایف پیش‌پُرکُنی (pre-fill) و رمزگشایی (decoding) به پردازنده‌های مختلف، بهینه‌سازی عملکرد هوش مصنوعی را به حداکثر می‌رساند.

فرمت NVFP4: این فرمت جدید داده‌ها، ضمن حفظ دقت محاسباتی لازم برای مدل‌های پیچیده، عملکرد و بهره‌وری را به شکل چشمگیری افزایش می‌دهد.

آینده هوش مصنوعی در دستان عملکرد هوش مصنوعی بلک‌ول

این موفقیت برای انویدیا و شرکای آن نقطه عطفی حیاتی به شمار می‌رود. در دنیایی که مدل‌های MoE به دلیل کارایی بی‌اندازه‌شان در حال گسترش و یافتن کاربردهای متنوع هستند، توانایی انویدیا در رفع موانع مقیاس‌پذیری، این شرکت را در کانون این انقلاب هوش مصنوعی قرار می‌دهد. با ورود سرورهای GB200 بلک‌ول NVL72 به بازار، می‌توان انتظار داشت که توسعه و اجرای مدل‌های هوش مصنوعی پیشگام با سرعت و کارایی بی‌سابقه‌ای صورت گیرد. این پلتفرم جدید نه تنها امکان طراحی مدل‌های بزرگ‌تر و پیچیده‌تر را فراهم می‌آورد، بلکه دسترسی به عملکرد هوش مصنوعی بالا را برای طیف وسیع‌تری از محققان و شرکت‌ها ممکن می‌سازد. این امر به نوبه خود، پیشرفت‌های سریع‌تری را در حوزه‌هایی مانند پزشکی، رباتیک، تحلیل داده و بسیاری دیگر نوید می‌دهد و قابلیت‌های هوش مصنوعی را به سطح جدیدی ارتقا خواهد داد.

پایگاه خبری مجتمع نوآوری فرداد


مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *