
شکست RTX 4090 توسط Radeon RX 7900 XTX در تستهای هوش مصنوعی DeepSeek
کارت گرافیک Radeon RX 7900 XTX با عملکرد فوقالعادهای مدل هوش مصنوعی R1 شرکت DeepSeek رو اجرا میکنه و توی بنچمارکهای استنتاج، از انویدیا جیفورس RTX 4090 پیشی میگیره.
خب، جدیدترین مدل هوش مصنوعی DeepSeek صنعت رو تکان داده و در حالی که خیلی از ما داریم به این فکر میکنیم که چه منابع محاسباتی برای آموزش این مدل استفاده شده، به نظر میرسه که یک کاربر معمولی هم میتونه با کارت گرافیک AMD رادئون RX 7900 XTX از سری “RDNA 3″، عملکرد مناسبی برای اجرای این مدل به دست بیاره. تیم قرمز بنچمارکهای استنتاج مدل R1 شرکت DeepSeek رو منتشر کرده که در اون، کارت گرافیک پرچمدار سری RX 7000 رو با مدل مشابه انویدیا مقایسه کرده و عملکرد برترش رو توی چندین مدل نشون داده.
اجرای مدل هوش مصنوعی DeepSeek با Radeon RX 7900 XTX

کارتهای گرافیک معمولی برای کارهای هوش مصنوعی، برای خیلیها جواب داده، مخصوصاً چون نسبت به شتابدهندههای هوش مصنوعی اصلی، نرخ قیمت به عملکرد بهتری داشتن. از طرفی، با اجرای مدلها روی سیستم خودت، حریم خصوصیت هم حفظ میشه که این موضوع برای مدلهای هوش مصنوعی DeepSeek دغدغهی بزرگی بوده. خوشبختانه، AMD یه راهنمای کامل منتشر کرده که چطوری مدلهای تقطیرشدهی DeepSeek R1 رو روی کارتهای گرافیک خودش اجرا کنی. دستورالعملها اینها هستن:
- مرحله ۱: مطمئن شو که درایور آدرنالین نسخهی ۲۵.۱.۱ یا بالاتر رو نصب کردی.
- مرحله ۲: LM Studio نسخهی ۰.۳.۸ یا بالاتر رو از آدرس lmstudio.ai/ryzenai دانلود کن.
- مرحله ۳: LM Studio رو نصب کن و از صفحهی خوشآمدگویی رد شو.
- مرحله ۴: روی تب “Discover” کلیک کن.
- مرحله ۵: مدل تقطیرشدهی DeepSeek R1 خودت رو انتخاب کن. مدلهای کوچیکتر مثل Qwen 1.5B عملکرد خیلی سریعی دارن (و نقطهی شروع پیشنهادی هستن) در حالی که مدلهای بزرگتر قابلیت استدلال بهتری ارائه میدن. همهشون واقعاً قدرتمندن.
- مرحله ۶: در سمت راست، مطمئن شو که گزینهی “Q4 K M” برای کمّیسازی انتخاب شده و بعد روی “Download” کلیک کن.
- مرحله ۷: بعد از دانلود، برگرد به تب چت و مدل تقطیرشدهی DeepSeek R1 رو از منوی کشویی انتخاب کن و مطمئن شو که گزینهی “manually select parameters” تیک خورده.
- مرحله ۸: در بخش “GPU offload layers”، اسلایدر رو تا آخر به سمت راست بکش (ماکسیمم کن).
- مرحله ۹: روی “Model Load” کلیک کن.
- مرحله ۱۰: حالا میتونی با یک مدل استدلالی که کاملاً روی سختافزار AMDاجرا میشه، تعامل کنی!
خب، اگه دستورالعملهای بالا برات جواب نداد، AMD یه آموزش کامل توی یوتیوب منتشر کرده که هر مرحله رو به صورت جداگانه توضیح داده. حتماً برو و این ویدیو رو چک کن تا بتونی مدلهای زبان بزرگ (LLMs) شرکت DeepSeek رو روی سیستمهای محلی با سختافزار AMD اجرا کنی و مطمئن بشی که دادههات سوءاستفاده نمیشن. با توجه به کارتهای گرافیک جدیدی که از راه رسیدن (هم از انویدیا و هم AMD)، انتظار داریم قدرت استنتاج به شدت افزایش پیدا کنه، چون این کارتها موتورهای اختصاصی هوش مصنوعی دارن که برای چنین کارهایی طراحی شدن.