AMD با معرفی چیپ جدید هوش مصنوعی MI300، انویدیا را به چالش خواهد کشید
AMD با معرفی چیپ جدید هوش مصنوعی MI300، انویدیا رو به چالش خواهد کشید. تو یه ایونت به اسم Advancing AI، این کمپانی یه چیپ جدید با نام MI300X معرفی کرد. این چیپ بر اساس دیزاین چیپلت محور AMD ساخته شده و هدفش اینه که با چیپ هوش مصنوعی انویدیا به اسم H100 رقابت کنه. تا آخر این خبر با بنچفا همراه باشید.
تیم AMD نتایج بنچمارکهای این تراشه جدید رو نشون داده که اگه حقیقی باشن، برای چیپ هوش مصنوعی تیم انویدیا خطرناکه.
مشخصات پردازنده MI300X، چیپ هوش مصنوعی AMD
به گفته AMD، پردازنده MI300X تو تست LLM Kernel تا ۲۰ درصد سریعتر از رقیبش عمل میکنه. اگه یه سیستم با ۸ تا چیپ MI300X رو با یه سیستم مشابه با ۸ تا چیپ H100 مقایسه کنیم، MI300X تا ۴۰ درصد تو Llama 2 و ۶۰ درصد تو Bloom قویتره.
AMD میگه که در عملکرد یادگیری، MI300X با رقیبش (H100) برابره و در پردازشهای استنتاجی بهتره و قیمتشم مناسبتره.
نیروی محرکه MI300 نرمافزار ROCm 6.0 بوده و این نرمافزار بهروزترین نسخه رو داره و حالا از پردازشهای پیشرفتهتر هوش مصنوعی حمایت میکنه. این نرمافزار جدید از آخرین فرمتهای محاسباتی مثل FP16 و Bf16 و FP8 پشتیبانی میکنه و بهینهسازیهایی داره که سرعت ۲-۶ برابری در vLLM رو از طریق کتابخانهی دادههای استنتاجی بهینهشده، سرعت ۱.۶ برابری در HIP Graph رو از طریق زمان اجرای بهینه شده، و سرعت ۱.۳ برابر الگوریتم Flash Attention رو از طریق کرنلهای بهینه شده ارائه میده.
عرضه چیپ MI300 توسط AMD
ما منتظر میمونیم تا ROCm 6 همراه با شتابدهندههای هوش مصنوعی MI300 تا انتهای این ماه معرفی بشه. خوب میشه ببینیم چطور ROCm 6 با آخرین نسخه از بستهی NVIDIA CUDA که رقیب اصلیشه، رقابت میکنه.
MI300X یه چیپ جذابه، بهخاطر اینکه هدفش اینه که با شتابدهندههای Hopper انویدیا و Gaudi اینتل رقابت کنه. این چیپ بر پایهی معماری CDNA 3 ساخته شده و ترکیبی از IPهای ۵ نانومتری و ۶ نانومتری رو داره که با هم حدود ۱۵۳ میلیارد ترانزیستور رو ارائه میدن.
حافظه این تراشه یک قسمت مهمه که در اون یه آپگرید محسوس داریم، حالا MI300X بازیکن قدرتمندتری شده نسبت به نسل قبلیش یعنی MI250X (که ۱۲۸ گیگابایت حافظه داشت). AMD برای اینکه به حافظه ۱۹۲ گیگابایتی برسه، MI300X رو با ۸ تا HBM3 همراه کرده.
این حافظه با یه پهنای باند ۵.۳ ترابایت بر ثانیه و ۸۹۵ گیگابایت بر ثانیه پهنای باند Infinity Fabric رو بهمون میده. برای مقایسه، شتابدهندهی هوش مصنوعی H200 انویدیا حدودا ۱۴۱ گیگابایت حافظه داره در حالی که Gaudi 3 اینتل ۱۴۴ گیگابایت.
در مورد توان مصرفی هم بگم، MI300X حدودا ۷۵۰ وات برق میکشه که نسبت به MI250X با افزایش ۵۰ درصدی و نسبت به انویدیا H200 هم با افزایش ۵۰ درصدی برق مصرف میکنه.
در حال حاضر در بازار، پردازنده AMD در حال رقابت با رقبای خودشه. انویدیا هم داره برای راهنمایی تراشههای هوش مصنوعی H200 از خانواده Hopper و B100 از خانواده بلکول رو آماده میکنه. اینتل هم GPUهای Gaudi 3 و Falcon Shores رو برای آینده در دست تولید داره.
شرکتهای بزرگ مثل اوراکل، دل، متا و OpenAI هم اعلام کردن که این تراشههای هوش مصنوعی AMD Instinct MI300 رو تو اکوسیستم خودشون حمایت میکنن.