ChatGPT در آزمون ورودی برترین دانشگاه‌های ژاپن انسان‌ها را شکست داد

ChatGPT

شرکت LifePrompt در تحقیق جدیدی مدل ChatGPT 5.2 Thinking را در آزمون‌های ورودی سال ۲۰۲۶ دانشگاه توکیو و دانشگاه کیوتو آزمایش کرده است. نتیجه این ارزیابی نشان می‌دهد ChatGPT 5.2 Thinking در آزمون علوم طبیعی دانشگاه توکیو ۵۰۳ امتیاز از ۵۵۰ امتیاز ممکن را کسب کرده، درحالی‌که بالاترین نمره انسانی ۴۵۳ بوده است. این مدل همچنین در ریاضیات نمره کامل را گرفته است.

در دانشگاه کیوتو نیز ChatGPT در آزمون دانشکده حقوق نمره ۷۷۱ را ثبت کرده؛ درحالی‌که بالاترین نمره انسانی ۷۳۴ بوده است. این مدل در آزمون دانشکده پزشکی هم ۱۱۷۶ امتیاز گرفته که از نمره ۱۰۹۸ بهترین داوطلب انسانی بیشتر است.

این نتیجه در شرایطی به دست آمده که ۲ سال پیش، GPT-4 در همین آزمون دانشگاه توکیو حتی نتوانسته بود به حداقل نمره قبولی برسد. LifePrompt نتیجه سال ۲۰۲۴ را بخش مهمی از این روند می‌داند؛ زیرا نشان می‌دهد عملکرد هوش مصنوعی در مدت کوتاهی جهش چشمگیری داشته است. به گفته این شرکت، ChatGPT در ژانویه ۲۰۲۶ نیز در ۱۵ درس آزمون سراسری ورودی دانشگاه‌ها امتیاز ۹۷ درصد را به دست آورده و در ۹ درس نمره کامل گرفته بود و نتایج آوریل ۲۰۲۶ نشان می‌دهد این روند صعودی ادامه پیدا کرده است.

عملکرد ضعیف ChatGPT در پرسش‌های تشریحی

درعین‌حال، گزارش LifePrompt به نقاط ضعف هوش مصنوعی هم اشاره می‌کند. ضعیف‌ترین بخش عملکرد ChatGPT به «پرسش‌های تشریحی» مربوط بوده است. این مدل در آزمون زبان انگلیسی امتیاز ۹۰ درصد گرفته اما در پرسش‌های تشریحی درس‌هایی مانند تاریخ جهان فقط امتیاز ۲۵ درصد کسب کرده است.

البته در این ارزیابی، پاسخ‌های تشریحی به‌جای سیستم‌های خودکار، توسط معلمان مؤسسات آموزشی تصحیح شده‌اند. گزارش حاضر می‌گوید ریاضیات، شیمی، فیزیک و انفورماتیک، یعنی درس‌های ساختارمند با پاسخ مشخص، حوزه‌هایی هستند که AI در آنها به سطحی فراتر از انسان رسیده، اما در ترکیب‌کردن ایده‌ها، استدلال و تفسیر، فاصله کمتر می‌شود.

Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

بیش از ۶۰ درصد مردم برای مشاوره روانی از هوش مصنوعی کمک می‌گیرند

با افزایش آمار ابتلا به اضطراب، استرس و افسردگی در سراسر جهان،…

1405-03-15

مدل بعدی OpenAI را هوش مصنوعی توسعه می‌دهد

«ماسایوشی سان»، مدیرعامل سافت‌بانک، می‌گوید مدل بعدی OpenAI توسط یک مدل هوش…

1405-03-15

OpenAI پذیرفت مدل‌ها پیش از انتشار زیر ذره‌بین کاخ سفید قرار بگیرند

شرکت OpenAI اعلام کرده که از فرمان اجرایی جدید ترامپ، مبنی‌بر نظارت…

1405-03-15