چگونه Phi-4-repesioning استدلال هوش مصنوعی را با به چالش کشیدن اسطوره “بزرگتر بهتر است” تعریف می کند


نسخه اخیر مایکروسافت از فحش فصلی یک فرض مهم در ساخت سیستم های هوش مصنوعی قادر به استدلال است. از زمان معرفی استدلال زنجیره ای از فکر در سال 2022 ، محققان معتقد بودند که استدلال پیشرفته به مدل های زبان بسیار بزرگی با صدها میلیارد پارامتر نیاز دارد. با این حال ، مدل پارامتر جدید 14 میلیارد مایکروسافت ، PHI-4-فصل ، این عقیده را زیر سوال می برد. این مدل با استفاده از یک رویکرد داده محور به جای تکیه بر قدرت محاسباتی محض ، به عملکرد قابل مقایسه با سیستم های بسیار بزرگتر دست می یابد. این موفقیت نشان می دهد که یک رویکرد داده محور می تواند به همان اندازه که برای آموزش AI معمولی است ، برای مدلهای استدلال آموزش مؤثر باشد. این امکان را برای مدل های کوچکتر هوش مصنوعی برای دستیابی به استدلال پیشرفته با تغییر نحوه آموزش توسعه دهندگان AI مدل های استدلال ، حرکت از “بزرگتر بهتر است” به “داده های بهتر بهتر است” باز می کند.

الگوی استدلال سنتی

استدلال زنجیره ای به استانداردی برای حل مشکلات پیچیده در هوش مصنوعی تبدیل شده است. این تکنیک مدل های زبان را از طریق استدلال گام به گام راهنمایی می کند و مشکلات دشوار را در مراحل کوچکتر و قابل کنترل قرار می دهد. این فکر انسان را با ساختن مدل ها “با صدای بلند” به زبان طبیعی قبل از پاسخ دادن تقلید می کند.

با این حال ، این توانایی با یک محدودیت مهم همراه بود. محققان به طور مداوم پیدا کردن این فکر زنجیره ای از فکر فقط در شرایطی که مدل های زبان بسیار بزرگ بودند ، خوب عمل کرد. به نظر می رسید توانایی استدلال به طور مستقیم با اندازه مدل مرتبط است ، و مدل های بزرگتر در کارهای استدلال پیچیده عملکرد بهتری دارند. این یافته منجر به رقابت در ساخت مدلهای بزرگ استدلال شد ، جایی که شرکت ها بر تبدیل مدل های بزرگ زبان خود به موتورهای استدلال قدرتمند متمرکز بودند.

ایده ترکیب توانایی های استدلال در مدل های هوش مصنوعی در درجه اول از این مشاهده ناشی می شود که مدل های بزرگ زبان می توانند انجام دهند یادگیری درون متنبشر محقق مشاهده شده این که وقتی مدل ها نمونه هایی از نحوه حل مشکلات مرحله به مرحله نشان داده می شوند ، یاد می گیرند که این الگوی را برای مشکلات جدید دنبال کنند. این امر منجر به این عقیده شد که مدلهای بزرگتر که بر روی داده های وسیع آموزش دیده اند به طور طبیعی استدلال پیشرفته تری ایجاد می کنند. ارتباط قوی بین اندازه مدل و عملکرد استدلال ، خرد پذیرفته شد. تیم ها با استفاده از منابع عظیم در مقیاس بندی توانایی های استدلال سرمایه گذاری کردند یادگیری تقویت کننده، با اعتقاد به اینکه قدرت محاسباتی کلید استدلال پیشرفته است.

درک رویکرد داده محور

ظهور هوش مصنوعی داده های محور ذهنیت “بزرگتر بهتر است” را به چالش می کشد. این رویکرد تمرکز را از معماری مدل به سمت مهندسی دقیق داده های مورد استفاده برای آموزش سیستم های هوش مصنوعی تغییر می دهد. به جای درمان داده ها به عنوان ورودی ثابت ، روش داده محور داده ها را به عنوان موادی می داند که می توانند برای تقویت عملکرد AI بهبود یافته و بهینه شوند.

اندرو نگ ، رهبر این زمینه ، ترویج ایجاد شیوه های مهندسی سیستماتیک برای بهبود کیفیت داده ها نه تنها تنظیم کد یا مدل های مقیاس گذاری. این فلسفه اغلب کیفیت و درمان داده ها را تشخیص می دهد مهمتر از اندازه مدل. شرکت هایی که این رویکرد را اتخاذ می کنند نشان می دهند که مدل های کوچکتر و آموزش دیده می توانند در صورت آموزش روی مجموعه داده های با کیفیت بالا و با دقت آماده تر از مدل های بزرگتر باشند.

رویکرد داده محور یک سؤال متفاوت می پرسد: “چگونه می توانیم داده های خود را بهبود بخشیم؟” به جای “چگونه می توانیم مدل را بزرگتر کنیم؟” این به معنای ایجاد مجموعه داده های بهتر آموزش ، بهبود کیفیت داده ها و توسعه مهندسی داده های سیستماتیک است. در هوش مصنوعی داده محور ، تمرکز بر درک آنچه باعث می شود داده ها برای کارهای خاص مؤثر باشد ، نه فقط جمع آوری بیشتر آن.

این رویکرد در آموزش مدلهای هوش مصنوعی کوچک اما قدرتمند با استفاده از مجموعه داده های کوچک و محاسبات بسیار کمتر ، نوید خوبی نشان داده است. مدل های PHI مایکروسافت نمونه خوبی از آموزش مدلهای زبان کوچک با استفاده از رویکرد داده محور است. این مدل ها با استفاده از آنها آموزش داده می شوند یادگیری برنامه درسی که در درجه اول از نحوه یادگیری کودکان از طریق نمونه های به تدریج سخت تر الهام گرفته شده است. در ابتدا مدل ها بر روی نمونه های آسان آموزش داده می شوند ، که به تدریج با مدل های سخت تر جایگزین می شوند. مایکروسافت همانطور که در مقاله آنها توضیح داده شده است ، یک مجموعه داده از کتاب های درسی ساخته است “کتابهای درسی همه چیزهایی است که شما نیاز دارید. ” این کمک کرد PHI-3 مدل های Outperform مانند Gemma و GPT 3.5 Google در کارهایی مانند درک زبان ، دانش عمومی ، مشکلات ریاضی مدرسه درجه و پاسخ به سوال پزشکی.

علیرغم موفقیت رویکرد داده محور ، استدلال به طور کلی از ویژگی های مدل های بزرگ هوش مصنوعی باقی مانده است. این امر به این دلیل است که استدلال به الگوهای پیچیده و دانش نیاز دارد که مدل های در مقیاس بزرگ راحت تر ضبط می کنند. با این حال ، این عقیده اخیراً با توسعه مدل فصلی PHI-4 به چالش کشیده شده است.

استراتژی دستیابی به موفقیت PHI-4-RESONING

PHI-4-repassing نشان می دهد که چگونه می توان از رویکرد داده محور برای آموزش مدلهای استدلال کوچک استفاده کرد. این مدل با تنظیم دقیق مدل پایه PHI-4 بر روی پیشبردهای “قابل آموزش” با دقت انتخاب شده و نمونه های استدلال تولید شده با O3-Mini Openai ساخته شده است. تمرکز بر کیفیت و ویژگی به جای اندازه مجموعه داده بود. این مدل با استفاده از حدود 1.4 میلیون پیش فرض با کیفیت بالا به جای میلیارد ها مورد عمومی آموزش داده می شود. محققان نمونه هایی را برای پوشش سطوح مختلف دشواری و انواع استدلال ، و اطمینان از تنوع ، فیلتر کردند. این درمان دقیق باعث شده است تا هر نمونه آموزشی هدفمند باشد ، و آموزش الگوهای استدلال خاص به جای افزایش حجم داده.

در تنظیم دقیق نظارت ، این مدل با تظاهرات کامل استدلال که شامل روند کامل تفکر است ، آموزش داده می شود. این زنجیره های استدلال گام به گام به مدل کمک کردند تا چگونه استدلال های منطقی را بسازد و مشکلات را بطور منظم حل کند. برای تقویت بیشتر توانایی های استدلال مدل ، با یادگیری تقویت در حدود 6000 مشکل ریاضی با کیفیت بالا با راه حل های تأیید شده ، تصفیه می شود. این نشان می دهد که حتی مقادیر کمی از یادگیری تقویت شده متمرکز می توانند استدلال را هنگام استفاده از داده های خوب و مناسب ، به طور قابل توجهی بهبود بخشند.

عملکرد فراتر از انتظارات

نتایج اثبات می کند که این رویکرد داده محور کار می کند. PHI-4-repeding از مدلهای بسیار بزرگتر با وزن باز مانند عمل می کند Deepseek-r1-distill-llama-70b و تقریباً با کامل مطابقت دارد Deepseek-R1، با وجود اینکه بسیار کوچکتر است. در آزمون AIME 2025 (مقدماتی المپیاد ریاضی ایالات متحده) ، PHI-4-Resing Beats Deepseek-R1 ، که 671 میلیارد پارامتر دارد.

این دستاوردها فراتر از ریاضیات به حل مسئله علمی ، برنامه نویسی ، الگوریتم ها ، برنامه ریزی و کارهای مکانی است. پیشرفت از انتقال دقیق داده های به خوبی به معیارهای عمومی ، نشان می دهد که این روش مهارت های استدلال اساسی را ایجاد می کند تا ترفندهای خاص کار.

PHI-4-repassing این ایده را به چالش می کشد که استدلال پیشرفته نیاز به محاسبات گسترده دارد. یک مدل پارامتر 14 میلیارد می تواند با عملکرد مدل ها ده ها بار بزرگتر باشد که در داده های با دقت سرنوشت آموزش دیده باشد. این کارآیی عواقب مهمی برای استقرار استدلال هوش مصنوعی در جایی که منابع محدود است ، دارد.

پیامدهای توسعه هوش مصنوعی

موفقیت Phi-4-Reseding نشانگر تغییر در نحوه ساخت مدل های استدلال هوش مصنوعی است. تیم ها به جای تمرکز بیشتر بر افزایش اندازه مدل ، می توانند با سرمایه گذاری در کیفیت و درمان داده ها نتایج بهتری کسب کنند. این امر استدلال پیشرفته را در دسترس سازمانها بدون بودجه محاسبات عظیم قرار می دهد.

روش داده محور نیز مسیرهای تحقیقاتی جدیدی را باز می کند. کار آینده می تواند بر یافتن دستورالعمل های بهتر آموزش ، تظاهرات استدلال غنی تر و درک اینکه کدام داده ها به بهترین وجه به استدلال کمک می کنند ، متمرکز شود. این دستورالعمل ها ممکن است بیشتر از ساخت مدل های بزرگتر باشد.

به طور گسترده تر ، این می تواند به دموکراتیک AI کمک کند. اگر مدلهای کوچکتر آموزش داده شده بر روی داده های سرپرستی بتوانند با مدل های بزرگ مطابقت داشته باشند ، هوش مصنوعی پیشرفته برای توسعه دهندگان و سازمان های بیشتری در دسترس قرار می گیرد. این همچنین می تواند پذیرش و نوآوری هوش مصنوعی را در مناطقی که مدلهای بسیار بزرگ عملی نیستند سرعت بخشد.

آینده مدل های استدلال

PHI-4-repasing استاندارد جدیدی را برای توسعه مدل استدلال تعیین می کند. سیستم های هوش مصنوعی آینده احتمالاً با پیشرفت های معماری ، درمان دقیق داده ها را متعادل می کنند. این رویکرد اذعان می کند که هم کیفیت داده ها و هم از نظر طراحی مدل ، اما بهبود داده ها ممکن است دستاوردهای سریعتر و مقرون به صرفه تر را به دست آورد.

این همچنین مدل های استدلال تخصصی را که روی داده های خاص دامنه آموزش دیده اند ، امکان پذیر می کند. به جای غول های هدف کلی ، تیم ها می توانند از طریق درمان داده های هدفمند ، مدل های متمرکز را در زمینه های خاص ایجاد کنند. این کار AI کارآمدتر را برای مصارف خاص ایجاد می کند.

با پیشرفت هوش مصنوعی ، درسهایی از فصلی PHI-4 نه تنها آموزش مدل استدلال بلکه در کل توسعه هوش مصنوعی را تحت تأثیر قرار می دهد. موفقیت در مورد محدودیت های محدودیت داده ها حاکی از آن است که پیشرفت آینده در ترکیب نوآوری مدل با مهندسی داده های هوشمند نهفته است ، نه اینکه فقط معماری های بزرگتر ایجاد شود.

خط پایین

فصلی فصلی مایکروسافت این باور مشترک را تغییر می دهد که استدلال پیشرفته هوش مصنوعی به مدلهای بسیار بزرگی احتیاج دارد. این مدل به جای تکیه بر اندازه بزرگتر ، از یک رویکرد داده محور با داده های آموزشی با کیفیت بالا و با دقت انتخاب شده استفاده می کند. PHI-4-Passing تنها 14 میلیارد پارامتر دارد اما در کارهای استدلال دشوار و همچنین مدلهای بسیار بزرگتر را اجرا می کند. این نشان می دهد که تمرکز روی داده های بهتر فقط از افزایش اندازه مدل مهمتر است.

این روش جدید آموزش باعث می شود هوش مصنوعی پیشرفته کارآمدتر و در دسترس سازمانهایی باشد که منابع محاسباتی زیادی ندارند. موفقیت فصلی PHI-4 به جهت جدیدی در توسعه هوش مصنوعی اشاره دارد. این تمرکز بر بهبود کیفیت داده ها ، آموزش هوشمند و مهندسی دقیق به جای بزرگتر کردن مدل ها است.

این رویکرد می تواند به پیشرفت سریعتر ، کاهش هزینه ها کمک کند و به افراد و شرکت های بیشتری اجازه دهد از ابزارهای قدرتمند هوش مصنوعی استفاده کنند. در آینده ، هوش مصنوعی احتمالاً با ترکیب مدل های بهتر با داده های بهتر رشد خواهد کرد و هوش مصنوعی پیشرفته را در بسیاری از مناطق تخصصی مفید می کند.



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *