طبق گزارشهای جدید، شرکت چینی دیپسیک قصد دارد مدل زبانی بزرگ جدید خود با نام DeepSeek-R2 را بین ۲۴ مرداد تا ۸ شهریور ۱۴۰۴ (۱۵ تا ۳۰ آگوست ۲۰۲۵) معرفی کند. این مدل که با بهرهگیری از فناوری پیشرفته و تراشههای بومی هواوی توسعه یافته، میتواند تحولی بزرگ در صنعت هوش مصنوعی ایجاد کند.
پیشرفتهای معماری و عملکرد DeepSeek-R2
دیپسیک R2 با استفاده از نسخه بهبودیافته معماری Mixture of Experts (MoE) طراحی شده و انتظار میرود جهشی چشمگیر در عملکرد داشته باشد. این مدل با حدود ۱٫۲ تریلیون پارامتر، تقریباً دو برابر مدل قبلی دیپسیک یعنی R1 با ۶۷۱ میلیارد پارامتر، قدرت پردازشی بیشتری ارائه میدهد. این افزایش مقیاس، همراه با بهینهسازیهای معماری، DeepSeek-R2 را به رقیبی جدی برای مدلهای پیشرو مانند GPT-4 تبدیل میکند.
کاهش هزینهها با تراشههای هواوی
یکی از برجستهترین ویژگیهای DeepSeek-R2، کاهش ۹۷ درصدی هزینههای آموزش در مقایسه با GPT-4 است. این دستاورد به لطف استفاده از تراشههای Ascend 910B هواوی و تکنیکهای بهینهسازی پیشرفته ممکن شده است. تراشههای هواوی با توان پردازشی ۵۱۲ پتافلاپس و بهرهوری ۸۲ درصدی، عملکردی نزدیک به ۹۱ درصد تراشههای A100 انویدیا ارائه میدهند. این رویکرد نهتنها وابستگی چین به فناوریهای غربی را کاهش داده، بلکه هزینههای توسعه را به شکل قابلتوجهی پایین آورده است.
انتشار اخبار مربوط به DeepSeek-R2 تأثیرات قابلتوجهی بر بازار داشته است. سهام شرکت کمبریکن، فعال در حوزه پردازندههای هوش مصنوعی، با ۲۰ درصد رشد به ارزش بازار ۴۹٫۷ میلیارد دلار رسیده است. این هیجان نشاندهنده پتانسیل بالای دیپسیک برای تغییر معادلات بازار هوش مصنوعی است. انتظار میرود این مدل با هزینههای عملیاتی پایینتر، رقبای بزرگی مانند OpenAI و Anthropic را تحت فشار قرار دهد.
استفاده از تراشههای بومی هواوی در آموزش DeepSeek-R2 بخشی از استراتژی چین برای کاهش وابستگی به فناوریهای خارجی است. این حرکت نهتنها از نظر اقتصادی به نفع دیپسیک بوده، بلکه نشاندهنده پیشرفتهای چشمگیر چین در توسعه زیرساختهای هوش مصنوعی مستقل است. با این حال، برخی تحلیلگران معتقدند که موفقیت این مدل در برابر رقبای جهانی به توانایی آن در ارائه عملکردی قابلمقایسه با هزینه کمتر بستگی دارد.
آینده DeepSeek-R2
دیپسیک R2 با وعده عملکرد بالا و هزینههای پایین، میتواند استانداردهای جدیدی در صنعت هوش مصنوعی تعریف کند. اگر این مدل بتواند به وعدههای خود عمل کند، ممکن است شاهد تغییراتی اساسی در رقابتهای جهانی هوش مصنوعی باشیم. با این حال، تا زمان عرضه رسمی و ارزیابی عملکرد واقعی آن، باید منتظر ماند و دید که آیا DeepSeek-R2 میتواند انتظارات را برآورده کند یا خیر.