مهندسی سریع برای تحلیل سری های زمانی




در این مقاله، الگوهای مهندسی سریع عملی را خواهید آموخت که مدل های زبان بزرگ را برای تحلیل و پیش بینی سری های زمانی مفید و قابل اعتماد می کند.

موضوعاتی که به آنها خواهیم پرداخت عبارتند از:

  • نحوه قاب بندی زمینه زمانی و استخراج سیگنال های مفید
  • چگونه استدلال LLM را با مدل های آماری کلاسیک ترکیب کنیم
  • نحوه ساختار داده ها و درخواست ها برای پیش بینی ها، ناهنجاری ها و محدودیت های دامنه

بدون هیچ مقدمه ای، بیایید شروع کنیم.

مهندسی سریع برای تحلیل سری های زمانی

مهندسی سریع برای تحلیل سری های زمانی
تصویر توسط ناشر

مقدمه

هر چقدر هم که عجیب به نظر برسد، مدل های زبان اصلی (LLM) می تواند برای وظایف تجزیه و تحلیل داده ها، از جمله سناریوهای خاص مانند تجزیه و تحلیل سری های زمانی، مورد استفاده قرار گیرد. کلید این است که به درستی مهارت های مهندسی سریع خود را به سناریوی تجزیه و تحلیل خاص ترجمه کنید.

این مقاله هفت مورد را شرح می دهد استراتژی های مهندسی سریع که می توان از آن برای بهره برداری استفاده کرد تجزیه و تحلیل سری های زمانی وظایف با LLM ها

مگر در مواردی که غیر از این ذکر شده باشد، توصیف این استراتژی‌ها با مثال‌های گویا همراه است که حول سناریوی داده‌های خرده‌فروشی می‌چرخند، به‌ویژه با در نظر گرفتن مجموعه داده‌های سری زمانی متشکل از فروش روزانه در طول زمان برای تجزیه و تحلیل آن.

1. ساختار زمانی را زمینه سازی کنید

اول، یک دستور موثر برای به دست آوردن یک نتیجه مدل مفید باید به آن کمک کند تا ساختار زمانی مجموعه داده سری زمانی را درک کند. این شامل ذکر احتمالی روندهای صعودی/نزولی، فصلی، چرخه های شناخته شده مانند تبلیغات یا تعطیلات، و غیره می شود. این اطلاعات زمینه ای به LLM شما کمک می کند، به عنوان مثال، نوسانات زمانی را به عنوان – خوب، فقط این را تفسیر کند: نوسانات، به جای نویز. به طور خلاصه، توصیف واضح ساختار مجموعه داده در زمینه همراه با درخواست‌های شما، اغلب فراتر از دستورالعمل‌های استدلال پیچیده موجود در دستورات است.

اعلان مثال:
در اینجا فروش روزانه (بر حسب واحد) در 365 روز گذشته آمده است. داده‌ها فصلی بودن هفتگی (فروش بیشتر در تعطیلات آخر هفته) را نشان می‌دهد، روندی بلندمدت که به تدریج افزایش می‌یابد، و در پایان هر ماه به دلیل تبلیغات روز پرداخت به اوج خود می‌رسد.. از این دانش هنگام پیش بینی 30 روز آینده استفاده کنید.

2. استخراج ویژگی و سیگنال

به جای اینکه از مدل خود بخواهید از اعداد خام پیش بینی های مستقیم کند، چرا ابتدا برخی از ویژگی های کلیدی را استخراج نکنید؟ این می تواند شامل الگوهای نهفته، ناهنجاری ها و همبستگی ها باشد. درخواست از LLM برای استخراج ویژگی ها و سیگنال ها و گنجاندن آنها در اعلان (به عنوان مثال، از طریق آمار خلاصه یا تجزیه) به آشکار شدن دلایل پیش بینی ها یا نوسانات آینده کمک می کند.

اعلان مثال:
“با استفاده از داده‌های 365 روز گذشته فروش، میانگین فروش روزانه، انحراف استاندارد را محاسبه کنید، روزهایی را که فروش از میانگین به علاوه دو برابر انحراف استاندارد فراتر رفت، شناسایی کنید و هر گونه روند هفتگی یا ماهانه تکرار شونده را یادداشت کنید. سپس عواملی را تفسیر کنید که ممکن است روزهای فروش بالا یا افت را توضیح دهد، و هر گونه ناهنجاری غیرعادی را گزارش کنید.”

3. ترکیبی LLM + گردش کار آماری

بیایید واقع بین باشیم: LLM ها به صورت مجزا اغلب برای انجام وظایفی که نیاز به دقت عددی دارند و برای گرفتن وابستگی های زمانی در سری های زمانی با مشکل مواجه می شوند. به همین دلیل، ترکیب ساده استفاده از آنها با مدل های آماری کلاسیک فرمولی برای دستیابی به نتایج بهتر است. چگونه یک گردش کار ترکیبی را به این شکل تعریف کنیم؟ ترفند تزریق استدلال LLM – تفسیر سطح بالا، فرمول‌بندی فرضیه و درک زمینه – در کنار مدل‌های کمی مانند ARIMA، ETS یا موارد دیگر است.

به عنوان مثال، LeMoLE (ترکیب خبره خطی پیشرفته LLM) نمونه ای از یک رویکرد ترکیبی است که مدل های خطی را با ویژگی های مشتق شده از اعلان ها غنی می کند.

نتیجه ترکیبی از استدلال زمینه‌ای و دقت آماری است: بهترین هر دو جهان.

4. نمایش داده های مبتنی بر طرحواره

در حالی که مجموعه داده‌های سری زمانی خام عموماً فرمت‌های مناسبی برای ارسال به عنوان ورودی LLM هستند، استفاده از طرح‌واره‌های ساختاریافته مانند JSON یا جداول فشرده می‌تواند کلیدی باشد که به LLM اجازه می‌دهد تا این داده‌ها را با اطمینان بیشتری تفسیر کند، همانطور که مطالعات متعدد نشان داده‌اند.

نمونه ای از یک قطعه JSON برای ارسال با یک اعلان:

درخواست همراه کردن داده‌های JSON با:
با توجه به داده‌ها و ابرداده‌های JSON فوق، سری زمانی را تجزیه و تحلیل کنید و فروش 30 روز آینده را پیش‌بینی کنید.

5. مدل های پیش بینی پیشنهادی

طراحی و ساختاربندی مناسب مدل‌های پیش‌بینی در فواصل زمانی – مانند افق‌های کوتاه‌مدت یا بلندمدت یا شبیه‌سازی سناریوهای خاص what-if- می‌تواند به هدایت مدل برای تولید پاسخ‌های قابل استفاده‌تر کمک کند. این رویکرد در ایجاد بینش بسیار عملی برای تجزیه و تحلیل درخواستی موثر است.

مثال:

6. درخواست تشخیص ناهنجاری

این یکی بیشتر مختص کار است و بر طراحی مناسب اعلان‌ها تمرکز می‌کند که می‌تواند نه تنها به پیش‌بینی LLM کمک کند، بلکه می‌تواند به تشخیص ناهنجاری‌ها – در ترکیب با روش‌های آماری – و دلایل احتمالی آنها کمک کند، یا حتی پیشنهاد کند که کدام موارد بررسی شود. نکته کلیدی این است که یک بار دیگر با پیش پردازش با ابزارهای سری زمانی سنتی شروع کنید و سپس مدل را فریب دهید تا نتایج را تفسیر کند.

اعلان مثال:
“با استفاده از داده های فروش JSON، ابتدا هر روزی را که فروش بیش از 2 برابر انحراف استاندارد هفتگی از میانگین هفتگی انحراف داشته باشد، گزارش دهید. سپس، برای هر روز گزارش شده، دلایل احتمالی را توضیح دهید (مانند موجودی، تبلیغات، رویدادهای خارجی) و توصیه کنید که آیا بررسی شود (مثلاً بررسی سیاهه های موجودی، کمپین بازاریابی، میزان بازدید از فروشگاه).

7. استدلال مبتنی بر دامنه

آگاهی از حوزه‌هایی مانند الگوهای فصلی خرده‌فروشی، اثرات تعطیلات، و غیره، بینش‌های ارزشمندی را نشان می‌دهد، و ادغام آنها در اعلان‌ها به LLM کمک می‌کند تا تحلیل‌ها و پیش‌بینی‌های معنادارتر و همچنین قابل تفسیرتری داشته باشند. این به معنای استفاده از ارتباط “زمینه مجموعه داده”، هم از نظر معنایی و هم از نظر دامنه خاص، به عنوان چراغ راهنمایی است که استدلال مدل را هدایت می کند.

درخواستی مانند این می تواند به LLM کمک کند تا جهش های پایان ماه یا کاهش فروش به دلیل تخفیف های تعطیلات را بهتر پیش بینی کند:
“این داده‌های فروش روزانه یک زنجیره خرده‌فروشی است. فروش در پایان هر ماه افزایش می‌یابد (مشتریان حقوق دریافت می‌کنند)، در تعطیلات کاهش می‌یابد، و در طول رویدادهای تبلیغاتی افزایش می‌یابد. همچنین گه‌گاهی وجود دارد که موجودی‌های آن از بین می‌رود که منجر به کاهش برای SKU‌های خاص می‌شود. از این دانش دامنه هنگام تجزیه و تحلیل سری‌ها و پیش‌بینی استفاده کنید.”

نتیجه گیری

این مقاله هفت استراتژی مختلف را توصیف می‌کند که عمدتاً توسط مطالعات اخیر پایه‌گذاری شده و پشتیبانی می‌شوند، برای ایجاد اعلان‌های مؤثرتر برای تجزیه و تحلیل سری‌های زمانی به کمک LLM و وظایف پیش‌بینی.







منبع:aitoolsclub.com/