استنادها: آیا ویژگی جدید Anthropic می تواند مشکل اعتماد AI را حل کند؟


تأیید هوش مصنوعی مدتی است که مسئله جدی بوده است. در حالی که مدل های بزرگ زبان (LLMS) با سرعت باورنکردنی پیشرفت کرده اند ، چالش اثبات صحت آنها حل نشده است.

وابسته به انسان شناسی در تلاش است تا این مشکل را حل کند و از بین همه شرکت های بزرگ هوش مصنوعی ، فکر می کنم آنها بهترین عکس را دارند.

این شرکت آزاد شده است استنادها، یک ویژگی جدید API برای آن مدلهای کلود این تغییر می کند که چگونه سیستم های AI پاسخ های خود را تأیید می کنند. این فناوری به طور خودکار اسناد منبع را به بخش های قابل هضم تقسیم می کند و هر بیانیه AI ایجاد شده را به منبع اصلی خود پیوند می دهد-شبیه به نحوه استناد مقالات دانشگاهی به منابع خود.

استنادها در تلاش است تا یکی از مداوم ترین چالش های هوش مصنوعی را حل کند: اثبات این که محتوای تولید شده دقیق و قابل اعتماد است. سیستم به جای نیاز به مهندسی سریع سریع یا تأیید دستی ، سیستم به طور خودکار اسناد را پردازش می کند و تأیید منبع در سطح جمله را برای هر ادعایی که ارائه می دهد فراهم می کند.

داده ها نتایج امیدوارکننده را نشان می دهد: بهبود 15 ٪ در دقت استناد در مقایسه با روش های سنتی.

چرا این مسئله در حال حاضر مهم است

اعتماد AI به مانعی مهم برای پذیرش شرکت (و همچنین پذیرش فردی) تبدیل شده است. با حرکت سازمانها فراتر از استفاده از AI آزمایشی به عملیات اصلی ، عدم توانایی در تأیید خروجی های AI به طور مؤثر ، تنگنای قابل توجهی ایجاد کرده است.

سیستم های تأیید فعلی یک مشکل واضح را نشان می دهند: سازمان ها مجبور می شوند بین سرعت و دقت انتخاب کنند. فرآیندهای تأیید دستی مقیاس نمی شوند ، در حالی که خروجی های AI تأیید نشده خطر زیادی دارند. این چالش به ویژه در صنایع تنظیم شده حاد است که در آن دقت فقط ترجیح داده نمی شود – لازم است.

زمان استناد به یک لحظه مهم در توسعه هوش مصنوعی می رسد. هرچه مدل های زبان پیچیده تر می شوند ، نیاز به تأیید داخلی به طور متناسب افزایش یافته است. ما باید سیستمهایی بسازیم که بتوانند با اطمینان در محیط های حرفه ای مستقر شوند که دقت آن غیر قابل مذاکره باشد.

تجزیه معماری فنی

جادوی استنادها در رویکرد پردازش اسناد آن نهفته است. استناد مانند سایر سیستم های سنتی هوش مصنوعی نیست. اینها اغلب اسناد را به عنوان بلوک های متن ساده رفتار می کنند. با استناد ، این ابزار مواد منبع را به آنچه انسان شناسی “تکه ها” می نامد ، تجزیه می کند. اینها می توانند جملات فردی یا بخش های تعریف شده توسط کاربر باشند که یک پایه گرانول برای تأیید ایجاد می کنند.

در اینجا تجزیه فنی است:

پردازش و رسیدگی به سند

استنادها اسناد را بر اساس قالب آنها متفاوت می کند. برای پرونده های متنی ، اساساً هیچ محدودیتی فراتر از کلاه استاندارد 200،000 برای درخواست های کل وجود ندارد. این شامل زمینه ، اعلان ها و خود اسناد است.

دست زدن به PDF پیچیده تر است. سیستم PDF ها را به صورت بصری ، نه فقط به عنوان متن ، پردازش می کند ، و منجر به برخی محدودیت های کلیدی می شود:

  • حد اندازه پرونده 32 مگابایت
  • حداکثر 100 صفحه در هر سند
  • هر صفحه 1500-3000 نشانه مصرف می کند

مدیریت

اکنون به سمت عملی این محدودیت ها روی می آورید. هنگامی که با استناد کار می کنید ، باید بودجه نشانه خود را با دقت در نظر بگیرید. در اینجا نحوه تجزیه آن آمده است:

برای متن استاندارد:

  • حد درخواست کامل: 200،000 نشانه
  • شامل: متن + درخواست + اسناد
  • هیچ هزینه جداگانه ای برای خروجی استناد وجود ندارد

برای pdfs:

  • مصرف بیشتر در هر صفحه
  • پردازش بصری بالای سر
  • محاسبه توکن پیچیده تر مورد نیاز است

استنادها در مقابل RAG: تفاوت های کلیدی

استنادها یک نیست بازیابی نسل افزوده (RAG) سیستم – و این تمایز اهمیت دارد. در حالی که سیستم های RAG بر یافتن اطلاعات مربوطه از یک پایگاه دانش تمرکز می کنند ، استناد بر روی اطلاعاتی که قبلاً انتخاب کرده اید کار می کند.

به این روش فکر کنید: راگ تصمیم می گیرد که از چه اطلاعاتی استفاده می شود ، در حالی که استنادها تضمین می کند که از اطلاعات به طور دقیق استفاده می شود. این بدان معنی است:

  • پارچه: بازیابی اطلاعات
  • استنادها: مدیریت تأیید اطلاعات
  • پتانسیل ترکیبی: هر دو سیستم می توانند با هم کار کنند

این انتخاب معماری به معنای استناد به دقت در زمینه های ارائه شده است ، در حالی که استراتژی های بازیابی را به سیستم های مکمل ترک می کند.

مسیرهای ادغام و عملکرد

تنظیم مستقیم است: استنادها از طریق API استاندارد انسان شناسی، این بدان معناست که اگر در حال حاضر از کلود استفاده می کنید ، در نیمه راه در آنجا هستید. این سیستم به طور مستقیم با API پیام ها ادغام می شود و نیاز به ذخیره فایل جداگانه یا تغییرات پیچیده زیرساخت ها را از بین می برد.

ساختار قیمت گذاری از مدل مبتنی بر توکن Anthropic با یک مزیت کلیدی پیروی می کند: در حالی که شما برای نشانه های ورودی از اسناد منبع پرداخت می کنید ، هیچ هزینه اضافی برای خود خروجی های استناد وجود ندارد. این یک ساختار هزینه قابل پیش بینی را ایجاد می کند که با استفاده از آن مقیاس می یابد.

معیارهای عملکرد یک داستان قانع کننده را بیان می کنند:

  • 15 ٪ بهبود در دقت استناد کلی
  • حذف کامل توهم منبع (از 10 ٪ وقوع تا صفر)
  • تأیید سطح جمله برای هر ادعا

سازمانها (و افراد) با استفاده از سیستم های AI تأیید نشده ، خود را در معرض ضرری قرار می دهند ، به خصوص در صنایع تنظیم شده یا محیط های پر سر و صدا که دقت آن بسیار مهم است.

با نگاه به جلو ، ما به احتمال زیاد می بینیم:

  • ادغام ویژگی های مشابه استناد به استاندارد تبدیل می شود
  • تکامل سیستم های تأیید فراتر از متن به رسانه های دیگر
  • تدوین استانداردهای تأیید صنعت خاص

کل صنعت واقعاً نیاز به تجدید نظر در اعتماد و تأیید اعتبار هوش مصنوعی دارد. کاربران باید به جایی برسند که بتوانند هر ادعایی را با سهولت تأیید کنند.



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *