OpenAI به تازگی آنچه را که آنها «هوشمندترین مدل خود در جهان» می نامند، عرضه کرده است. این با قیمت ماهانه 200 دلار عرضه می شود و وعده می دهد که سخت تر فکر کنید، بیشتر کار کنید و مشکلات پیچیده تری را از هر چیزی که قبلا دیده ایم حل کند. اما در دنیایی که به نظر میرسد هر هفته اعلامیههای هوش مصنوعی کاهش مییابد، این یکی شایسته نگاه دقیقتر است.
جدید ChatGPT Pro، طراحی شده توسط مدل o1، فقط یک ارتقاء معمولی دیگر نیست. در حالی که ChatGPT معمولی به چاقوی ارتش سوئیس برای ابزارهای هوش مصنوعی تبدیل شده است، این پیشنهاد جدید بیشتر شبیه تجهیزات جراحی تخصصی است – فوق العاده قدرتمند، اما نه برای همه.
آنچه که o1 واقعاً سر میز می آورد
اجازه دهید از طریق تبلیغات و بررسی آنچه که o1 متفاوت است. این مدل اعداد قابل توجهی را نشان می دهد، اما آنچه مهم است این است که این پیشرفت ها واقعاً در کجا تفاوت ایجاد می کنند.
در تست دنیای واقعی، o1 در سه حوزه کلیدی پیشرفت هایی را نشان می دهد:
- حل مسائل فنی عمیق: این مدل در مسائل مسابقه ریاضی AIME 2024 دقت 50 درصدی را به دست میآورد – از 37 درصد در نسخههای قبلی. اما مهمتر از آن، این عملکرد را به طور مداوم حفظ می کند. هنگامی که از نظر قابلیت اطمینان آزمایش می شود (دریافت پاسخ مناسب 4 از 4 بار)، حالت o1 pro به طور قابل توجهی بهتر از پیشینیان خود عمل می کند.
- استدلال علمی: در سؤالات علمی سطح دکترا، o1 74٪ درصد موفقیت را نشان می دهد، با دستاوردهای چشمگیرتر در ثبات. آنچه جالب است این است که چگونه این به کاربردهای تحقیقاتی واقعی ترجمه می شود – ما می بینیم که محققان از آن برای طراحی آزمایش های بیولوژیکی پیچیده استفاده می کنند.
- برنامه نویسی و تحلیل فنی: شاید مهمتر از همه، o1 در چالشهای برنامهنویسی پیشرفته به نرخ قبولی ۶۲ درصدی دست مییابد، که قدرت خاصی را در حل مسائل پیچیده و چند مرحلهای نشان میدهد. با این حال – و این بسیار مهم است – در واقع با کارهای ساده تر و تکراری که نیاز به گفتگوی رفت و برگشتی دارند، دست و پنجه نرم می کند.

تصویر: OpenAI
نوآوری واقعی در اینجا فقط عملکرد خام نیست – قابلیت اطمینان است. زمانی که مدل نیاز دارد بیشتر درباره یک مشکل فکر کند، در واقع این کار را انجام میدهد و زمان بیشتری برای پردازش و اعتبارسنجی پاسخهای آن صرف میکند.
اما یک راه حل وجود دارد: تمام این “تفکر” اضافی با معاوضه هایی همراه است. این مدل به طور قابل توجهی کندتر است، گاهی اوقات به زمان قابل توجهی بیشتری برای تولید پاسخ نیاز دارد. و برای بسیاری از کارهای روزمره، این اسب بخار اضافی فقط غیر ضروری نیست – ممکن است در واقع نتیجه معکوس داشته باشد.
با این قدرت محاسباتی زیاد چه اتفاقی می افتد؟
بیایید در مورد آنچه واقعاً اتفاق می افتد صحبت کنیم وقتی یک هوش مصنوعی با قدرت محاسباتی بیشتر شارژ می کنید. صحبت های بازاریابی را فراموش کنید – چیزی که با o1 می بینیم جذاب است زیرا طرز تفکر ما را در مورد کمک هوش مصنوعی کاملاً تغییر می دهد.
به آن مانند تفاوت بین یک چت سریع با یک همکار در مقابل یک جلسه استراتژی عمیق فکر کنید. مدلهای استاندارد هوش مصنوعی برای آن چتهای سریع عالی هستند – آنها سریع، مفید هستند و کار را انجام میدهند. اما o1؟ مانند داشتن یک کارشناس ارشد است که وقت خود را صرف می کند، به مسائل فکر می کند و گاهی اوقات با بینش هایی که شما حتی فکر نکرده اید باز می گردد.
در واقع چه چیزی در مورد این رویکرد انقلابی است؟
- “تفکر” عمیق تر: وقتی به یک مدل هوش مصنوعی زمان بیشتری برای «فکر کردن» میدهید، نه تنها بیشتر فکر میکند بلکه متفاوت فکر میکند. زوایای متعدد را بررسی می کند و موارد لبه را در نظر می گیرد. به همین دلیل است که محققان آن را به ویژه برای طراحی تجربی و تولید فرضیه ارزشمند میدانند.
- قابلیت اطمینان: اینجا چیزی است که هیچ کس در مورد آن صحبت نمی کند: ثبات ممکن است ابرقدرت واقعی O1 باشد. در حالی که مدلهای دیگر ممکن است یک بار مشکل پیچیده را حل کنند و سه بار بعدی شکست بخورند، o1 در استدلال سطح بالای خود ثبات قابل توجهی را نشان میدهد. برای متخصصانی که روی مشکلات حیاتی کار می کنند، این ضریب قابلیت اطمینان یک معامله بزرگ است.
راهنمای خریدار هوشمند برای ابزارهای برقی هوش مصنوعی
ما باید یک گفتگوی صادقانه در مورد آن برچسب قیمت 200 دلاری داشته باشیم. آیا واقعا ارزشش را دارد؟ خوب، این کاملاً به نحوه فکر شما در مورد کمک هوش مصنوعی در گردش کار بستگی دارد.
جالب توجه است، افرادی که ممکن است بیشترین سود را از o1 ببرند، لزوماً کسانی نیستند که روی پیچیده ترین مشکلات کار می کنند – آنها کسانی هستند که روی مشکلاتی کار می کنند که اشتباه کردن آنها بسیار پرهزینه است. مگر اینکه در موقعیتهای خاصی مانند این باشید، این قدرت اضافی ممکن است شما را کند کند.
استفاده موثر از o1 مستلزم یک تغییر اساسی در نحوه برخورد با تعامل هوش مصنوعی است:
- عمق بیش از سرعت
- به جای تبادل سریع رفت و برگشت، آن را به عنوان ایجاد پرس و جوهای تحقیقاتی خوب فکر کنید.
- برای زمان پاسخگویی طولانی تر برنامه ریزی کنید اما انتظار تحلیل جامع تری را داشته باشید
- کیفیت بر کمیت
- روی مشکلات پیچیده و با ارزش تمرکز کنید
- از مدل های استاندارد برای کارهای روتین استفاده کنید
- استقرار استراتژیک
- o1 را با سایر ابزارهای هوش مصنوعی برای یک گردش کار بهینه ترکیب کنید
- قدرت محاسباتی سنگین را برای جایی که بیشترین اهمیت را دارد ذخیره کنید
o1 سعی نمی کند همه چیز برای همه باشد. در عوض، ما را وادار می کند تا استراتژیک تر در مورد نحوه استفاده از ابزارهای هوش مصنوعی فکر کنیم. شاید نوآوری واقعی در اینجا فقط فناوری نباشد، بلکه روشی است که ما را وادار میکند در رویکرد خود به کمک هوش مصنوعی تجدید نظر کنیم.
به جعبه ابزار هوش مصنوعی خود مانند یک آشپزخانه حرفه ای فکر کنید. بله، شما میتوانید از تجهیزات صنعتی برای همه چیز استفاده کنید، اما سرآشپزهای چیره دست دقیقاً میدانند چه زمانی از دستگاه سوسوی فانتزی استفاده کنند و چه زمانی یک تابه ساده این کار را بهتر انجام میدهد.
قبل از ورود به آن اشتراک 200 دلاری، این را امتحان کنید: گزارشی از تعاملات هوش مصنوعی خود برای یک هفته نگه دارید. مشخص کنید کدام یک واقعاً به تفکر عمیقتر در مقابل پاسخهای سریع نیاز دارند. این به شما بیشتر از هر معیاری در مورد نیاز به o1 می گوید.
چیزی که من را بیشتر در مورد o1 هیجان زده می کند این نیست که امروز چه کاری می تواند انجام دهد، بلکه چیزی است که درباره فردا به ما می گوید. ما شاهد تکامل هوش مصنوعی هستیم و از ابزاری که تلاش میکند همه چیز را انجام دهد به ابزاری که دقیقاً میداند در چه کاری بهترین است، حرکت میکنیم.
فرقی نمیکند که شما در مسیر اول قرار بگیرید یا نه، یک چیز مسلم است: نحوه تفکر و استفاده ما از هوش مصنوعی در حال تکامل است، و این چیزی است که ارزش توجه دارد.