
عملکرد ضعیف گراک ۴ در یک چالش استراتژیک واقعی؛ بهبود تواناییهای تحلیل و استدلال
این روزا مدل هوش مصنوعی گراک ۴ از شرکت xAI خیلی سر و صدا کرده، البته بیشتر بهخاطر تبلیغات بیوقفهی خود ایلان ماسک. اما وقتی بری زیر پوست ماجرا، میبینی این مدل بیشتر طوری طراحی شده که فقط توی تستهای استاندارد AI نمره بیاره، و وقتی پای یه چالش پویا و استراتژیک واقعی وسط میاد، کم میاره.
با اینکه فقط چند روز از عرضهی گراک ۴ گذشته، اما تا حالا چندتا حاشیه هم براش درست شده. مثلاً چند روز پیش سر و صدا کرد چون دقیقاً نظرات شخصی و بعضاً جنجالی ایلان ماسک دربارهی مهاجرت و بحرانهای سیاسی مختلف دنیا رو عین طوطی تکرار کرد.
ماجرا وقتی جنجالیتر شد که بهخاطر یه آپدیت توی سیستم پرامپتهاش، مدل خودش رو «مکا-هیتلر» معرفی کرد و حتی یه جورایی از آدولف هیتلر هم تعریف کرد!
ولی اصل قضیه اینجاست: توی یه رقابت بهنام Step Race که با استفاده از پازلهای «Connections» نیویورکتایمز طراحی شده تا توانایی مدلهای مختلف AI در حل مسئله و تصمیمگیری سریع رو بسنجن، Grok 4 رتبهی پنجم شد؛ حتی مدل Gemini 2.5 Flash بهتر از اون عمل کرد!
اگه اینو بذاریم کنار نمرههای بالای گراک ۴ توی تستهای استاندارد دیگه، بهنظر میرسه که این مدل بهنوعی «برای بردن توی تستها» تربیت شده؛ چیزی که بهش میگن overfitting. یعنی مدل بهجای اینکه مفهومها رو درست یاد بگیره، فقط دادههای تمرینی رو حفظ کرده.
البته اینا به این معنی نیست که هوش مصنوعی گراک بهدردنخور باشه. اتفاقاً بهنظر میاد توانایی استدلالش نسبت به قبل خیلی بهتر شده.
یکی از کاربرا بهنام tetsuoai نوشته بود که Grok 4 Heavy تو پیدا کردن ایرادهای کدنویسی از همهی مدلها بهتره. حتی نمونهای از کد JavaScript بازی خودش رو هم گذاشته بود که با کمک گراک ۴ دیباگش کرده.
همچنین یه نفر دیگه (DannyLimanseta) آخر هفته گذشته با گراک ۴ یه پروتوتایپ بازی ساخت، اول با SuperGrok Chat طراحی اولیه رو درآورد، بعد بردش توی Cursor و ادامهی کدنویسی رو با Grok 4 MAX انجام داد. تعریف میکرد که توی بازی، Grok 4 مثل یه آدم ساکت و دقیق عمل میکنه.
اما با همهی این تعریفها، هنوز اونقدر که ایلان ماسک میگه، شاهکار نیست. مثلاً روی پلتفرم پیشبینی شرطبندی Kakshi، تا الان کاربرا فقط شرطهای معمولی روش بستن؛ نه چیزی که بگه همه خیلی بهش اعتماد دارن.
از اون طرف، «فایننشال تایمز» گزارش داده که xAI (که صاحب شبکه اجتماعی ایکس هم هست) دنبال ارزشگذاری ۲۰۰ میلیارد دلاری توی یه دور جدید جذب سرمایهست. این شرکت فقط توی ماه ژوئن ۳۰۰ میلیون دلار از طریق فروش ثانویه سهام جذب کرد و اوایل جولای هم ۱۰ میلیارد دلار دیگه.
این در حالیه که گفته میشه SpaceX هم قراره ۲ میلیارد دلار از سرمایهگذاری ۵ میلیارد دلاری اخیرش رو توی xAI خرج کنه.
و در نهایت، بهنظر میرسه ایلان ماسک داره مقدمات رو فراهم میکنه تا حتی تسلا هم بیاد و توی xAI سرمایهگذاری کنه؛ یه جور بازی مالی بین شرکتهایی که همهشون یهجوری به خود ماسک وصلن.