در یک رویداد علمی ویژه که در ایالت کالیفرنیا برگزار شد، سی نفر از برجستهترین و نامآورترین ریاضیدانان جهان گرد هم آمدند تا بهطور مستقیم تواناییهای پیشرفتهترین مدل هوش مصنوعی را در حل مسائل بسیار پیچیده ریاضی محک بزنند. نتیجه این آزمون نه تنها برای خود شرکتکنندگان، بلکه برای کل جامعه علمی بسیار شگفتانگیز و قابل تحسین بود؛ چرا که مدل استدلالگر ChatGPT توانست مسائلی در سطح دکترا را به شکل کامل و دقیق حل کند.
براساس گزارش معتبر لایو ساینس، این گردهمایی محرمانه و منحصربهفرد در اواسط ماه مه سال جاری برگزار شد و هدف اصلی آن سنجش ظرفیتهای هوش مصنوعی برای حل چالشهای ریاضی بود که حتی برای ریاضیدانان حرفهای نیز بسیار دشوار و پیچیده محسوب میشد. ۳۰ ریاضیدان نخبه از سراسر دنیا طی یک آزمون دو روزه در قالب پروژهای به نام FrontierMath، که به سفارش OpenAI و توسط سازمان غیرانتفاعی Epoch AI برگزار شد، به ارزیابی عملکرد مدل استدلالگر o4-mini پرداختند.
نکته کلیدی این بود که مسائل انتخاب شده در این آزمون پیشتر هیچگاه بهصورت عمومی منتشر نشده بودند و مدل هوش مصنوعی نمیتوانست صرفاً با جستجو در اینترنت پاسخها را پیدا کند. برای حفظ محرمانگی و اطمینان از صحت آزمون، کلیه ارتباطات میان شرکتکنندگان تنها از طریق اپلیکیشن امن سیگنال انجام شد و همه آنها متعهد شدند که اطلاعات مربوط به سوالات و پاسخها را فاش نکنند.
ابتدای کار، ریاضیدانان توانستند با طرح سوالات پیچیده، هوش مصنوعی را به چالش بکشند و حتی جوایزی معادل ۷۵۰۰ دلار برای سوالاتی که مدل قادر به حل آنها نبود، در نظر گرفتند. اما با پیشرفت آزمون و مطرح شدن مسائل دشوارتر، شرایط به کلی تغییر کرد.
«کن اونو»، ریاضیدان برجسته دانشگاه ویرجینیا و یکی از داوران این رویداد، درباره تجربه خود میگوید: در ابتدا نسبت به عملکرد هوش مصنوعی تردید داشت، اما وقتی مسئلهای پیچیده در حوزه نظریه اعداد، که سالها حل نشده بود، را مطرح کرد، همه چیز دگرگون شد. مدل در کمتر از ده دقیقه توانست به تمام منابع علمی مرتبط دسترسی پیدا کند، پس از مطالعه دقیق، ابتدا یک نسخه سادهتر از مسئله را حل کرد تا بر موضوع مسلط شود، و سپس راهحل کامل و درستی برای مسئله اصلی ارائه داد.
پروفسور اونو این عملکرد را «گستاخانه» توصیف میکند و میگوید: «این مدل به قدری پیشرفته است که نیازی به ارجاع به منابع ندارد و خود مستقلاً مسئله را حل میکند.» همچنین برخی از همکاران وی معتقدند که این مدلها به سطح نبوغ ریاضی نزدیک شدهاند.
مدل o4-mini، برخلاف مدلهای زبانی معمولی که صرفاً پیشبینی کلمه بعدی را انجام میدهند، یک مدل زبان بزرگ (LLM) استدلالگر است که با مجموعه دادههای تخصصی و بازخوردهای انسانی بسیار قویتر آموزش دیده است. این رویکرد منحصربهفرد باعث شده تا این مدلها بتوانند به جای تکرار صرف اطلاعات، فرآیندهای پیچیده استدلال را مرحله به مرحله انجام داده و درک عمیقی از مسائل داشته باشند.
این پیشرفت نویدبخش تحولی بزرگ در حوزه هوش مصنوعی و ریاضیات است که میتواند مسیر تحقیق و حل مسائل پیچیده علمی را به طور اساسی دگرگون کند.