در این مقاله، یاد خواهید گرفت که چگونه GPT-5 استدلال ریاضی متوسط تا پیشرفته، از جمله حل سیستم های معادلات و ساختن برهان های روشن به سبک کتاب درسی را مدیریت می کند.
موضوعاتی که به آنها خواهیم پرداخت عبارتند از:
- گرم کردن سریع و روشمند برای حل یک سیستم خطی 2×2.
- شواهد یکنواختی و دامنه عملکردها، به وضوح و دقیق نوشته شده است.
- بحث در مورد کیفیت پاسخ، لحن، و مناطقی که مدل هنوز مکانیکی به نظر می رسد.
یک راست بریم سر اصل مطلب.

آیا ChatGPT-5 قادر به ارائه اثبات برای ریاضیات پیشرفته است؟
تصویر توسط ناشر
مقدمه
یکی از ادعاهای OpenAI در مورد آخرین مدل آن، GPT-5یک پیشرفت بزرگ در استدلال ریاضی و منطقی است، با توانایی “فکر کردن” عمیق تر زمانی که یک درخواست از تجزیه و تحلیل دقیق سود می برد. این شامل پارامترهای استدلالی پیچیده و شبیه انسان مانند کدگذاری، سؤالات علمی، خلاصه کردن اطلاعات یا تجزیه و تحلیل داده های مالی است. در ریاضیات، مدل به میزان موفقیت 94.6 درصد در حل مسائل ریاضی در سطح دست یافته است. کنفرانس بین المللی AIME 2025بدون توسل به ابزارهای خارجی، پیشرفت های قابل توجهی را نسبت به نسخه های قبلی نشان می دهد.
این مقاله نشان میدهد – از طریق مثالهایی از استدلال ریاضی متوسط تا پیشرفته – چگونه آخرین نسخه ChatGPT با مشکلات پیچیده ریاضی با دقت بسیار و یک رویکرد تحلیلی بهویژه روشمند مقابله میکند. ما همچنین بحث مختصری از رفتار نشان داده شده در پاسخ های به دست آمده ارائه می دهیم.
سلب مسئولیت: اگرچه در اینجا قصد این نیست که تا آنجا که این نشان می دهد پیش برویم پست Reddit که ادعا می کند ChatGPT-5 با ایجاد “ریاضیات جدید” نوآوری کرده است، ما به طور مختصر توانایی های مدل را برای ساختن شواهد دقیق و قوی برای مسائل مختلف تجزیه و تحلیل خواهیم کرد.
گرم کردن: حل یک سیستم معادلات خطی
قبل از اینکه به یک مسئله پیچیدهتر برویم، با چیزی ملایم و کاملاً روششناختی شروع میکنیم: حل یک سیستم از دو معادله خطی در دو متغیر، x و y.
سیستم به شرح زیر است (برگرفته از این یادداشت های دوره):
5x − 2y = 7 −2x + y = 3
5 برابر – 2 سال = 7 –2 برابر + بله = 3 |
و اعلان ساده است و مدل را در انتخاب روش استدلال خود باز می گذارد:
سیستم معادلات خطی زیر را حل کنید: (به دنبال سیستم فوق به عنوان مثال)
در اینجا پاسخی است که ChatGPT برمی گرداند:

تصویر توسط نویسنده
نه تنها این مدل سیستم را به درستی حل کرد، با x = 13 و y = 29 مانند راه حل واقعی – همچنین یک روش گام به گام واضح را نشان داد (مثلاً جایگزینی یا حذف) و جبر را مرتب نگه داشت.
جالب است که اگر از ChatGPT نیز بخواهیم کارآمدترین روش را از بین روشهای موجود برای حل سیستم انتخاب کند – و این انتخاب را توجیه کند – میتواند (و در مورد من انجام داد) دو پاسخ ممکن را ارائه دهد و به شما اجازه دهد کدام یک را ترجیح میدهید.

تصویر توسط نویسنده
هر دو پاسخ از روش یکسانی استفاده می کنند – حذف – که نشان می دهد چگونه ChatGPT به جای “خلاقانه” به خاطر خود (مثلاً تولید عمدی دو روش مختلف) سریع گرا و منطقی سازگار است. استدلال گام به گام نیز در هر دو مورد مشابه است، با تفاوت اصلی در سبک مورد استفاده برای توجیه حذف.
کمی چالش بیشتر: نمونه هایی از اثبات های ریاضی
با حرکت به سمت ریاضیات سطح دانشگاهی پیشرفتهتر، از ChatGPT خواستیم تا بدون ارائه نمونههایی از توابع خاص، اثبات بسازد:
نشان دهید که ترکیب هر دو تابع کاهشی در حال افزایش است.
بدون فعال کردن صریح یکی از جدیدترین روشهای ChatGPT، به نام بیشتر فکر کن مد، این برنامه پاسخ قانعکنندهای ارائه کرد که به عنوان مدرکی مستقل خوانده میشود.

تصویر توسط نویسنده
با استفاده از راه حل های موجود در وب، مانند این مثال– که GPT-5 به درستی با این چالش روبرو شد.
در اینجا یک مثال دیگر است.
فرض کنید g(x) = 2x + 3x برای |x| ≤ 1. (بنابراین دامنه g است [−1, 1].) نشان دهید که وسعت g دقیقاً است [5/6, 5].

تصویر توسط نویسنده
و اثبات واقعاً بسیار دقیق است! هیچ مشکلی در این مورد وجود ندارد و چیز زیادی برای شکایت وجود ندارد. به طور کلی، ساختار اثبات کامل است و به طور منطقی جریان دارد. علاوه بر این، ویژگی های کلیدی g(x) را به درستی شناسایی می کند: یکنواختی، پیوستگی و تمایز پذیری. اگر بخواهیم ضربه زننده باشیم، روایت تا حدودی مکانیکی و غیرجذاب باقی می ماند (برای مثال، می تواند شامل تابلوهای راهنما دوستانه ای مانند “این قسمت مشکل است” یا “مرحله بعدی آسان است هضم شود”). با این حال، منصفانه، لحن رسمی و خنثی اغلب هنگام ارائه شواهد مناسب است. فراتر از لحن، از نقطه نظر ریاضی چیز زیادی برای سوال کردن وجود ندارد.
نتیجه گیری
این مقاله استدلال ریاضی متوسط تا پیشرفته و حل مسئله را از طریق آخرین مدل OpenAI، GPT-5 نشان میدهد. از طریق چند مثال، دقت و عمق روشمند مدل نشان داده شد و به دنبال آن بازتاب های مختصری در مورد نتایج آن و رویکرد مورد استفاده برای تولید آنها ارائه شد.
