OpenAI، پیشگام سری GPT، به تازگی از سری جدیدی از مدل های هوش مصنوعی رونمایی کرده است. دوبله o1، قبل از اینکه پاسخ دهند می توانند مدت بیشتری «فکر کنند». این مدل برای انجام وظایف پیچیده تر، به ویژه در علوم، کدنویسی و ریاضیات توسعه یافته است. اگرچه OpenAI بسیاری از عملکردهای این مدل را مخفی نگه داشته است، برخی از سرنخها بینشی در مورد قابلیتهای آن و آنچه ممکن است در مورد استراتژی در حال تکامل OpenAI نشان دهد، ارائه میکند. در این مقاله، آنچه را که راهاندازی o1 ممکن است در مورد جهتگیری این شرکت و پیامدهای گستردهتر برای توسعه هوش مصنوعی نشان دهد، بررسی میکنیم.
رونمایی از o1: سری جدید مدلهای استدلال OpenAI
o1 نسل جدید مدلهای هوش مصنوعی OpenAI است که برای اتخاذ رویکردی متفکرانهتر برای حل مشکلات طراحی شده است. این مدل ها برای اصلاح تفکر، کشف استراتژی ها و درس گرفتن از اشتباهات آموزش دیده اند. OpenAI گزارش می دهد که o1 به دستاوردهای چشمگیری در استدلال دست یافته است و 83٪ از مسائل را در آزمون مقدماتی المپیاد ریاضی بین المللی (IMO) حل کرده است – در مقایسه با 13٪ توسط GPT-4o. این مدل در کدنویسی نیز عالی است و در مسابقات Codeforces به صدک 89 رسیده است. طبق گفته OpenAI، بهروزرسانیهای آینده در این مجموعه با دانشجویان دکترا در موضوعاتی مانند فیزیک، شیمی و زیستشناسی برابری میکند.
استراتژی توسعه هوش مصنوعی OpenAI
OpenAI از زمان آغاز به کار بر مدلهای مقیاسبندی بهعنوان کلید باز کردن قابلیتهای پیشرفته هوش مصنوعی تاکید کرده است. با GPT-1OpenAI که دارای 117 میلیون پارامتر بود، پیشگام انتقال از مدل های کوچکتر و مختص کار به سیستم های گسترده و همه منظوره بود. هر مدل بعدی – GPT-2، GPT-3، و آخرین GPT-4 با 1.7 تریلیون پارامتر – نشان داد که چگونه افزایش اندازه مدل و داده ها می تواند منجر به بهبود قابل توجهی در عملکرد شود.
با این حال، تحولات اخیر نشان دهنده تغییر قابل توجهی در استراتژی OpenAI برای توسعه هوش مصنوعی است. در حالی که این شرکت به بررسی مقیاس پذیری ادامه می دهد، همچنین در حال چرخش به سمت ایجاد مدل های کوچکتر و همه کاره تر است، به عنوان نمونه ChatGPT-4o mini. معرفی «تفکر طولانیتر» نشاندهنده انحراف از اتکای انحصاری به قابلیتهای تشخیص الگوی شبکههای عصبی به سمت پردازش شناختی پیچیده است.
از واکنش های سریع تا تفکر عمیق
OpenAI بیان می کند که مدل o1 به طور خاص طراحی شده است تا قبل از ارائه پاسخ، زمان بیشتری را برای فکر کردن صرف کند. به نظر می رسد این ویژگی o1 با اصول آن همخوانی دارد نظریه فرآیند دوگانهیک چارچوب کاملاً تثبیت شده در علوم شناختی که بین دو شیوه تفکر تمایز قائل می شود-سریع و آهسته.
در این تئوری، سیستم 1 بیانگر تفکر سریع و شهودی، تصمیم گیری به صورت خودکار و شهودی، بسیار شبیه به تشخیص چهره یا واکنش به یک رویداد ناگهانی است. در مقابل، سیستم 2 با تفکر آهسته و عمدی مرتبط است که برای حل مشکلات پیچیده و تصمیم گیری متفکرانه استفاده می شود.
از نظر تاریخی، شبکههای عصبی – ستون فقرات اکثر مدلهای هوش مصنوعی – در تقلید از تفکر سیستم 1 برتری داشتهاند. آنها سریع، مبتنی بر الگو هستند و در کارهایی که نیاز به پاسخ های سریع و شهودی دارند، عالی هستند. با این حال، زمانی که به استدلال منطقی و عمیقتر نیاز است، اغلب کوتاه میآیند، محدودیتی که به بحثهای مداوم در جامعه هوش مصنوعی دامن زده است: آیا ماشینها واقعاً میتوانند فرآیندهای آهستهتر و روشمندتر سیستم 2 را تقلید کنند؟
برخی از دانشمندان هوش مصنوعی، مانند جفری هینتون، پیشنهاد میکنند که با پیشرفت کافی، شبکههای عصبی در نهایت میتوانند رفتار متفکرانهتر و هوشمندانهتری از خود نشان دهند. دانشمندان دیگر، مانند گری مارکوس، برای یک رویکرد ترکیبی استدلال می کنند، که شبکه های عصبی را با استدلال نمادین ترکیب می کند تا پاسخ های سریع، شهودی و تفکر تحلیلی سنجیده تر را متعادل کند. این رویکرد در حال حاضر در مدل هایی مانند آزمایش شده است هندسه آلفا و AlphaGoکه از استدلال عصبی و نمادین برای مقابله با مسائل پیچیده ریاضی و انجام موفقیت آمیز بازی های استراتژیک استفاده می کند.
مدل o1 OpenAI منعکس کننده این علاقه فزاینده به توسعه مدلهای سیستم 2 است که نشاندهنده تغییر از هوش مصنوعی مبتنی بر الگو به ماشینهای متفکرانهتر و حلکننده مشکل است که قادر به تقلید از عمق شناختی انسان هستند.
آیا OpenAI استراتژی عصبی نمادین گوگل را اتخاذ می کند؟
برای سالها، گوگل این مسیر را دنبال میکند و مدلهایی مانند AlphaGeometry و AlphaGo را برای برتری در کارهای استدلالی پیچیده مانند آنچه در المپیاد بینالمللی ریاضیات (IMO) و بازی استراتژیک Go ایجاد میکند. این مدلها تشخیص الگوی بصری شبکههای عصبی مانند مدلهای زبان بزرگ (LLM) را با منطق ساختاریافته موتورهای استدلال نمادین ترکیب میکنند. نتیجه یک ترکیب قدرتمند است که در آن LLM ها بینش های سریع و شهودی ایجاد می کنند، در حالی که موتورهای نمادین افکار کندتر، عمدی تر و منطقی تر را ارائه می دهند.
حرکت گوگل به سمت عصبی نمادین سیستمها با دو چالش مهم انگیزه داشتند: در دسترس بودن محدود مجموعه دادههای بزرگ برای آموزش شبکههای عصبی در استدلال پیشرفته و نیاز به ترکیب شهود با منطق دقیق برای حل مسائل بسیار پیچیده. در حالی که شبکه های عصبی در شناسایی الگوها و ارائه راه حل های ممکن استثنایی هستند، اغلب در ارائه توضیحات یا مدیریت عمق منطقی مورد نیاز برای ریاضیات پیشرفته شکست می خورند. موتورهای استدلال نمادین این شکاف را با ارائه راهحلهای ساختاریافته و منطقی – البته با برخی معاوضهها در سرعت و انعطافپذیری، برطرف میکنند.
با ترکیب این رویکردها، گوگل با موفقیت مدل های خود را افزایش داده است و AlphaGeometry و AlphaGo را قادر می سازد تا در بالاترین سطح بدون دخالت انسان به رقابت بپردازند و به شاهکارهای قابل توجهی دست یابند، مانند کسب مدال نقره در IMO توسط AlphaGeometry و شکست قهرمانان جهان در بازی Go AlphaGo. . این موفقیتهای گوگل نشان میدهد که OpenAI ممکن است استراتژی عصبی نمادین مشابهی را اتخاذ کند، به دنبال رهبری گوگل در این حوزه در حال توسعه توسعه هوش مصنوعی.
o1 و مرز بعدی هوش مصنوعی
اگرچه عملکرد دقیق مدل o1 OpenAI فاش نشده است، اما یک چیز واضح است: این شرکت به شدت بر روی انطباق متنی تمرکز کرده است. این به معنای توسعه سیستمهای هوش مصنوعی است که میتوانند پاسخهای خود را بر اساس پیچیدگی و ویژگیهای هر مشکل تنظیم کنند. این مدلها بهجای حلکنندههای همهمنظوره، میتوانند استراتژیهای تفکر خود را برای مدیریت بهتر برنامههای مختلف، از تحقیقات گرفته تا کارهای روزمره، تطبیق دهند.
یکی از پیشرفتهای جذاب میتواند ظهور هوش مصنوعی خود انعکاسی باشد. برخلاف مدلهای سنتی که صرفاً بر دادههای موجود متکی هستند، تأکید o1 بر استدلال متفکرانهتر نشان میدهد که هوش مصنوعی آینده ممکن است از تجربیات خود بیاموزد. با گذشت زمان، این می تواند به مدل هایی منجر شود که رویکردهای حل مسئله خود را اصلاح کرده و آنها را سازگارتر و انعطاف پذیرتر می کند.
پیشرفت OpenAI با o1 نیز به تغییر در روش های آموزشی اشاره دارد. عملکرد این مدل در وظایف پیچیده ای مانند آزمون صلاحیت IMO نشان می دهد که ممکن است شاهد آموزش های تخصصی تر و متمرکز بر مشکل باشیم. این توانایی میتواند منجر به مجموعه دادههای مناسبتر و استراتژیهای آموزشی برای ایجاد تواناییهای شناختی عمیقتر در سیستمهای هوش مصنوعی شود که به آنها امکان میدهد در زمینههای عمومی و تخصصی برتر باشند.
عملکرد برجسته این مدل در زمینه هایی مانند ریاضیات و کدنویسی نیز امکانات هیجان انگیزی را برای آموزش و تحقیق ایجاد می کند. ما میتوانیم معلمان هوش مصنوعی را ببینیم که پاسخهایی ارائه میدهند و به راهنمایی دانشآموزان در فرآیند استدلال کمک میکنند. هوش مصنوعی ممکن است با کاوش در فرضیههای جدید، طراحی آزمایشها یا حتی مشارکت در اکتشافات در زمینههایی مانند فیزیک و شیمی به دانشمندان در تحقیقات کمک کند.
خط پایین
سری o1 OpenAI نسل جدیدی از مدل های هوش مصنوعی را معرفی می کند که برای انجام وظایف پیچیده و چالش برانگیز ساخته شده اند. در حالی که بسیاری از جزئیات در مورد این مدلها فاش نشده باقی میمانند، آنها منعکسکننده تغییر OpenAI به سمت پردازش شناختی عمیقتر هستند که فراتر از مقیاسگذاری صرف شبکههای عصبی است. همانطور که OpenAI به اصلاح این مدلها ادامه میدهد، ممکن است وارد مرحله جدیدی در توسعه هوش مصنوعی شویم که در آن هوش مصنوعی وظایف را انجام میدهد و در حل مسائل متفکرانه مشارکت میکند، آموزش، تحقیق و فراتر از آن را به طور بالقوه متحول میکند.