هوش مصنوعی DeepSeek ممکن است در آینده از چیپهای داخلی چینی استفاده کند
یه گزارش میگه که لابراتوار هوش مصنوعی چین به نام DeepSeek، که مدلهای هوش مصنوعیش هفته پیش توی وال استریت غوغا به پا کرد، میتونه برای مدلهای آیندهاش از GPUهای چینی استفاده کنه. ظاهراً هوش مصنوعی DeepSeek توانسته هزینهها رو به طور قابل توجهی نسبت به مدلهای آمریکایی کاهش بده، در حالی که از GPUهای شرکت انویدیا (NVIDIA) استفاده میکنه. این موضوع بازارها رو به هم ریخته، چون سرمایهگذارها دارن فکر میکنن که آیا اصلاً لازمه میلیاردها دلار هزینه برای توسعه هوش مصنوعی خرج بشه یا نه. کلید اصلی توسعه مدلهای این شرکت، تواناییش در استفاده از یه زبان برنامهنویسی سطح پایین به نام Parallel Thread Execution (PTX) روی GPUهای انویدیاست، به جای زبانی که انویدیا ارائه میده به نام Compute Unified Device Architecture (CUDA).
از طرفی، صنعت نیمههادی چین مدتهاست که تحت تحریمهای آمریکاست. این تحریمها باعث شدن که بزرگترین شرکت تولید نیمههادی چین، یعنی SMIC، نتونه جدیدترین ماشینهای ساخت تراشه رو از شرکت هلندی ASML بخره. این ماشینها برای ساخت پیشرفتهترین تراشهها ضرورین، و گزارشهای زیادی میگن که SMIC فقط میتونه تراشههایی با فناوری قدیمیتر ۷ نانومتری تولید کنه.
هوش مصنوعی DeepSeek میتونه از GPUهای چینی بهره ببره؟
یه عامل کلیدی که باعث شده DeepSeek بتونه عملکرد بعضی از مدلهای هوش مصنوعی غربی رو با استفاده از تعداد کمتر و کارایی پایینتر GPUهای انویدیا تقلید کنه، توانایی این شرکت در استفاده از یه زبان برنامهنویسی به نام Parallel Thread Execution یا همون PTX هست. این زبان به مهندسها اجازه میده که کنترل عمیقتری روی عملکردهای پایهای تراشه داشته باشن، و مهندسهایی که بتونن از این زبان استفاده کنن نسبتاً کمتر هستن.
تصمیم DeepSeek برای استفاده از PTX که زبان سختی محسوب میشه، ناشی از تحریمهای آمریکا روی GPUها بوده. این شرکت مجبور شده یا تعداد محدودی GPU تهیه کنه یا اینکه فقط تراشههایی با عملکرد پایینتر رو استفاده کنه. اما گزارشها از مطبوعات هنگکنگ میگن که تخصص DeepSeek در استفاده از PTX میتونه به این شرکت اجازه بده تا برای مدلهای آیندهاش به GPUهای داخلی چین تکیه کنه.
این گزارش معتقده که چون PTX به برنامهنویسها اجازه میده کنترل دقیقتری روی عملکرد GPUها داشته باشن، مهندسهای هوش مصنوعی DeepSeek میتونن عملکرد بهتری از GPUهای داخلی چین بیرون بکشن. GPUهای Hopper H800 انویدیا که DeepSeek ادعا میکنه ازشون استفاده میکنه، با فناوری ساخت ۵ نانومتری تولید شدن. این GPUها که در سال ۲۰۲۳ معرفی شدن، در اون زمان از پیشرفتهترین فناوری ساخت در صنعت استفاده میکردن.
این گزارش اضافه میکنه که با درک نحوه پیادهسازی PTX انویدیا و اینکه چطور درایورها عملکرد تراشه رو کنترل میکنن، DeepSeek میتونه برنامههای مشابهی رو با GPUهای چینی اجرا کنه. البته احتمالاً هر GPU چینی که استفاده بشه، با فناوری ساخت قدیمیتر تولید شده و عملکردش به طور قابل توجهی پایینتر از جدیدترین GPUهای Blackwell انویدیا خواهد بود.