رئیس DLSS انویدیا احتمال پشتیبانی از Frame Generation برای کارتهای RTX 30 رو رد نکرد
تو نمایشگاه CES 2025، دیجیتال فاندری با برایان کاتانزارو، معاون تحقیقات یادگیری عمیق کاربردی، درباره اعلامیه نسل جدید DLSS انویدیا و بهبودهای زیادش تو زمینه سوپر رزولوشن، بازسازی پرتو و تولید فریم، مصاحبه کرد. بخشی از این مصاحبه، میتونه کورسوی امیدی برای کاربران کارتهای نسلهای قبل انویدیا نسبت به تکنولوژیها جدید این شرکت باشه. با بنچفا تا پایان این خبر همراه باشید.
مدل Transformer: به مراتب باهوشتر!
کاتانزارو درباره مدلهای جدید ترانسفورمر که جایگزین شبکههای عصبی کانولوشنال (CNN) تو سوپر رزولوشن و بازسازی پرتو شدن، صحبت کرد. این مدلها خیلی باهوشترن، میتونن روی دیتاستهای بزرگتری آموزش ببینن و در نتیجه تصمیمات بهتری بگیرن که باعث میشه مشکلات قدیمی DLSS انویدیا مثل لرزش یا سایههای مزاحم برطرف بشه. مثلاً مدل جدید سوپر رزولوشن چهار برابر محاسبات بیشتری نسبت به مدل قبلی داره. کاتانزارو تخمین نزد که چقدر زمان رندرینگ بیشتر میبره، ولی گفت انویدیا فکر میکنه این بهترین راهه برای بازی کردن با کارتهای گرافیک GeForce RTX 50 جدید که با معماری بلکول (Blackwell) ساخته شدن و اواخر این ماه عرضه میشن.
تولید فریم هم دستخوش تغییرات بزرگی شده و مدل قبلی که بر اساس شتابدهنده سختافزاری جریان نوری (Optical Flow) بود، با یک راهکار کاملاً مبتنی بر هوش مصنوعی جایگزین شده. دلیل این کار انویدیا اینه:
وقتی داشتیم NVIDIA DLSS 3 Frame Generation رو میساختیم، واقعاً به شتابدهنده سختافزاری برای محاسبه جریان نوری نیاز داشتیم. ما به اندازه کافی Tensor Core نداشتیم و الگوریتم جریان نوری مناسبی هم نداشتیم. نتونسته بودیم یک الگوریتم جریان نوری بلادرنگ (Real-time) که روی Tensor Core اجرا بشه و تو محدوده بودجه محاسباتی ما قرار بگیره، توسعه بدیم. ما شتابدهنده جریان نوری رو داشتیم که انویدیا سالها بود به عنوان تکامل تکنولوژی کدک ویدیویی ما داشت میساخت و تو شتابدهنده بینایی کامپیوتری خودروهای خودران هم استفاده میشد.
استفاده از اون برای NVIDIA DLSS 3 Frame Generation منطقی به نظر میرسید. اما مشکل هر نوع پیادهسازی سختافزاری برای الگوریتمی مثل جریان نوری اینه که بهبود دادنش خیلی سخته. اون تقریباً همونه که هست و مشکلاتی که از اون شتابدهنده جریان نوری سختافزاری به وجود اومدن رو نمیتونستیم با یک شبکه عصبی هوشمندتر جبران کنیم تا اینکه تصمیم گرفتیم که اون رو کاملاً حذف کنیم و سراغ یک راهکار کاملاً مبتنی بر هوش مصنوعی بریم، و این کاریه که برای تولید فریم تو DLSS 4 انجام دادیم.
مدل جدید تولید فریم به Tensor Core بیشتری نیاز داره، ولی از VRAM کمتری استفاده میکنه، کیفیت تصویر بهتری ارائه میده (که کاتانزارو اون رو به ویژه برای تولید چند فریم جدید که تو کارتهای گرافیک RTX 50 جدید در دسترسه، حیاتی دونست)، و همچنین کارآمدتره چون کارهای اون به تولید چند فریم منتهی میشن.
DLSS انویدیا برای کارتهای سری RTX 30؟
الکس باتالیا از دیجیتال فاندری بعدش پرسید که آیا این مدل جدید میتونه روی سختافزارهای قدیمیتر مثل سری GeForce RTX 30 هم اجرا بشه، و رئیس بخش DLSS انویدیا این احتمال رو رد نکرد.
فکر میکنم این بیشتر یه مسئله بهینهسازی و همچنین مهندسی و در نهایت تجربه کاربریه. ما این تکنولوژی تولید فریم، یعنی بهترین تکنولوژی تولید چند فریم رو، با سری ۵۰ معرفی میکنیم، و خواهیم دید که تو آینده میتونیم چه چیزهایی رو از سختافزارهای قدیمیتر بیرون بکشیم.
به یاد بیارید که وقتی انویدیا تولید فریم رو با کارتهای گرافیک GeForce RTX 40 معرفی کرد، خود کاتانزارو توضیح داد که این قابلیت فقط مختص GPUهای جدید اون موقعه، چون اونها شتابدهنده سختافزاری جریان نوری بسیار بهبود یافتهای نسبت به سری RTX 30 داشتن. اون موقع هم گفت که از نظر تئوری امکان انتقال اون به سختافزارهای قدیمیتر وجود داره، هرچند احتمالاً به اندازه سختافزارهای جدید مفید نخواهد بود.
با حذف شتابدهنده سختافزاری جریان نوری تو مدل جدید، به نظر میرسه که ممکنه این در باز بشه. با این حال، کاتانزارو همچنین گفت که نیاز به Tensor Core بیشتر شده و به طور واضح، معماری GPUهای قدیمیتر عملکرد Tensor Core ضعیفتری داره. خواهیم دید که آیا انویدیا واقعاً میتونه این کار رو انجام بده.
تو بخش دیگه مصاحبه، برایان کاتانزارو بر اهمیت جدا کردن اندازهگیری نرخ فریم جدید (flip metering) از پردازنده مرکزی برای کاهش تغییرات زمانی فریم (و در نتیجه بهبود ریتم فریم) تا پنج تا ده برابر نسبت به قبل، تأکید کرد. در نهایت، اون ادعا کرد که بازی کردن با Reflex 2 (که اونم مبتنی بر هوش مصنوعیه) حس “ارتباط بیشتر” رو منتقل میکنه و اون معتقد بود که به خصوص گیمرهای حساس به تاخیر، عاشقش خواهند شد.