در این مقاله، الگوهای مهندسی سریع عملی را خواهید آموخت که مدل های زبان بزرگ را برای تحلیل و پیش بینی سری های زمانی مفید و قابل اعتماد می کند.
موضوعاتی که به آنها خواهیم پرداخت عبارتند از:
- نحوه قاب بندی زمینه زمانی و استخراج سیگنال های مفید
- چگونه استدلال LLM را با مدل های آماری کلاسیک ترکیب کنیم
- نحوه ساختار داده ها و درخواست ها برای پیش بینی ها، ناهنجاری ها و محدودیت های دامنه
بدون هیچ مقدمه ای، بیایید شروع کنیم.

مهندسی سریع برای تحلیل سری های زمانی
تصویر توسط ناشر
مقدمه
هر چقدر هم که عجیب به نظر برسد، مدل های زبان اصلی (LLM) می تواند برای وظایف تجزیه و تحلیل داده ها، از جمله سناریوهای خاص مانند تجزیه و تحلیل سری های زمانی، مورد استفاده قرار گیرد. کلید این است که به درستی مهارت های مهندسی سریع خود را به سناریوی تجزیه و تحلیل خاص ترجمه کنید.
این مقاله هفت مورد را شرح می دهد استراتژی های مهندسی سریع که می توان از آن برای بهره برداری استفاده کرد تجزیه و تحلیل سری های زمانی وظایف با LLM ها
مگر در مواردی که غیر از این ذکر شده باشد، توصیف این استراتژیها با مثالهای گویا همراه است که حول سناریوی دادههای خردهفروشی میچرخند، بهویژه با در نظر گرفتن مجموعه دادههای سری زمانی متشکل از فروش روزانه در طول زمان برای تجزیه و تحلیل آن.
1. ساختار زمانی را زمینه سازی کنید
اول، یک دستور موثر برای به دست آوردن یک نتیجه مدل مفید باید به آن کمک کند تا ساختار زمانی مجموعه داده سری زمانی را درک کند. این شامل ذکر احتمالی روندهای صعودی/نزولی، فصلی، چرخه های شناخته شده مانند تبلیغات یا تعطیلات، و غیره می شود. این اطلاعات زمینه ای به LLM شما کمک می کند، به عنوان مثال، نوسانات زمانی را به عنوان – خوب، فقط این را تفسیر کند: نوسانات، به جای نویز. به طور خلاصه، توصیف واضح ساختار مجموعه داده در زمینه همراه با درخواستهای شما، اغلب فراتر از دستورالعملهای استدلال پیچیده موجود در دستورات است.
اعلان مثال:
در اینجا فروش روزانه (بر حسب واحد) در 365 روز گذشته آمده است. دادهها فصلی بودن هفتگی (فروش بیشتر در تعطیلات آخر هفته) را نشان میدهد، روندی بلندمدت که به تدریج افزایش مییابد، و در پایان هر ماه به دلیل تبلیغات روز پرداخت به اوج خود میرسد.. از این دانش هنگام پیش بینی 30 روز آینده استفاده کنید.
2. استخراج ویژگی و سیگنال
به جای اینکه از مدل خود بخواهید از اعداد خام پیش بینی های مستقیم کند، چرا ابتدا برخی از ویژگی های کلیدی را استخراج نکنید؟ این می تواند شامل الگوهای نهفته، ناهنجاری ها و همبستگی ها باشد. درخواست از LLM برای استخراج ویژگی ها و سیگنال ها و گنجاندن آنها در اعلان (به عنوان مثال، از طریق آمار خلاصه یا تجزیه) به آشکار شدن دلایل پیش بینی ها یا نوسانات آینده کمک می کند.
اعلان مثال:
“با استفاده از دادههای 365 روز گذشته فروش، میانگین فروش روزانه، انحراف استاندارد را محاسبه کنید، روزهایی را که فروش از میانگین به علاوه دو برابر انحراف استاندارد فراتر رفت، شناسایی کنید و هر گونه روند هفتگی یا ماهانه تکرار شونده را یادداشت کنید. سپس عواملی را تفسیر کنید که ممکن است روزهای فروش بالا یا افت را توضیح دهد، و هر گونه ناهنجاری غیرعادی را گزارش کنید.”
3. ترکیبی LLM + گردش کار آماری
بیایید واقع بین باشیم: LLM ها به صورت مجزا اغلب برای انجام وظایفی که نیاز به دقت عددی دارند و برای گرفتن وابستگی های زمانی در سری های زمانی با مشکل مواجه می شوند. به همین دلیل، ترکیب ساده استفاده از آنها با مدل های آماری کلاسیک فرمولی برای دستیابی به نتایج بهتر است. چگونه یک گردش کار ترکیبی را به این شکل تعریف کنیم؟ ترفند تزریق استدلال LLM – تفسیر سطح بالا، فرمولبندی فرضیه و درک زمینه – در کنار مدلهای کمی مانند ARIMA، ETS یا موارد دیگر است.
به عنوان مثال، LeMoLE (ترکیب خبره خطی پیشرفته LLM) نمونه ای از یک رویکرد ترکیبی است که مدل های خطی را با ویژگی های مشتق شده از اعلان ها غنی می کند.
نتیجه ترکیبی از استدلال زمینهای و دقت آماری است: بهترین هر دو جهان.
4. نمایش داده های مبتنی بر طرحواره
در حالی که مجموعه دادههای سری زمانی خام عموماً فرمتهای مناسبی برای ارسال به عنوان ورودی LLM هستند، استفاده از طرحوارههای ساختاریافته مانند JSON یا جداول فشرده میتواند کلیدی باشد که به LLM اجازه میدهد تا این دادهها را با اطمینان بیشتری تفسیر کند، همانطور که مطالعات متعدد نشان دادهاند.
نمونه ای از یک قطعه JSON برای ارسال با یک اعلان:
{“فروش”: [
{“date”: “2024-12-01”, “units”: 120},
{“date”: “2024-12-02”, “units”: 135},
…,
{“date”: “2025-11-30”, “units”: 210}
]”متاداده”: { “فرکانس”: “روزانه”، “فصلی”: [“weekly”, “monthly_end”]”domain”: “retail_sales” } }
{ “فروش”: [ {“date”: “2024-12-01”, “units”: 120}, {“date”: “2024-12-02”, “units”: 135}, ..., {“date”: “2025-11-30”, “units”: 210} ]، “فراداده”: { “فرکانس”: “هر روز”، “فصلی بودن”: [“weekly”, “monthly_end”]، “دامنه”: “خرده_فروشی” } } |
درخواست همراه کردن دادههای JSON با:
با توجه به دادهها و ابردادههای JSON فوق، سری زمانی را تجزیه و تحلیل کنید و فروش 30 روز آینده را پیشبینی کنید.
5. مدل های پیش بینی پیشنهادی
طراحی و ساختاربندی مناسب مدلهای پیشبینی در فواصل زمانی – مانند افقهای کوتاهمدت یا بلندمدت یا شبیهسازی سناریوهای خاص what-if- میتواند به هدایت مدل برای تولید پاسخهای قابل استفادهتر کمک کند. این رویکرد در ایجاد بینش بسیار عملی برای تجزیه و تحلیل درخواستی موثر است.
مثال:
وظیفه A – کوتاه مدت (7 روز آینده): فروش مورد انتظار را پیش بینی کنید. وظیفه B – بلند مدت (30 روز آینده): یک پیش بینی پایه به اضافه دو سناریو ارائه دهید: – سناریو 1 (شرایط عادی) – سناریو 2 (با انتظار ارتقاء در روزهای 10-15) علاوه بر این، یک فاصله اطمینان 95٪ برای هر دو سناریو ارائه دهید.
لکه دار کردن الف – کوتاه–مدت (دنبال کردن 7 روز): پیش بینی انتظار می رود فروش. لکه دار کردن ب – طولانی–مدت (دنبال کردن 30 روز): فراهم کند الف خط پایه پیش بینی بیشتر دو سناریوها: – سناریو 1 (عادی شرایط) – سناریو 2 (با الف پیش بینی شده است ارتقاء در روز 10–15)
در علاوه بر این، فراهم کند الف 95% اعتماد فاصله برای هر دو سناریوها. |
6. درخواست تشخیص ناهنجاری
این یکی بیشتر مختص کار است و بر طراحی مناسب اعلانها تمرکز میکند که میتواند نه تنها به پیشبینی LLM کمک کند، بلکه میتواند به تشخیص ناهنجاریها – در ترکیب با روشهای آماری – و دلایل احتمالی آنها کمک کند، یا حتی پیشنهاد کند که کدام موارد بررسی شود. نکته کلیدی این است که یک بار دیگر با پیش پردازش با ابزارهای سری زمانی سنتی شروع کنید و سپس مدل را فریب دهید تا نتایج را تفسیر کند.
اعلان مثال:
“با استفاده از داده های فروش JSON، ابتدا هر روزی را که فروش بیش از 2 برابر انحراف استاندارد هفتگی از میانگین هفتگی انحراف داشته باشد، گزارش دهید. سپس، برای هر روز گزارش شده، دلایل احتمالی را توضیح دهید (مانند موجودی، تبلیغات، رویدادهای خارجی) و توصیه کنید که آیا بررسی شود (مثلاً بررسی سیاهه های موجودی، کمپین بازاریابی، میزان بازدید از فروشگاه).
7. استدلال مبتنی بر دامنه
آگاهی از حوزههایی مانند الگوهای فصلی خردهفروشی، اثرات تعطیلات، و غیره، بینشهای ارزشمندی را نشان میدهد، و ادغام آنها در اعلانها به LLM کمک میکند تا تحلیلها و پیشبینیهای معنادارتر و همچنین قابل تفسیرتری داشته باشند. این به معنای استفاده از ارتباط “زمینه مجموعه داده”، هم از نظر معنایی و هم از نظر دامنه خاص، به عنوان چراغ راهنمایی است که استدلال مدل را هدایت می کند.
درخواستی مانند این می تواند به LLM کمک کند تا جهش های پایان ماه یا کاهش فروش به دلیل تخفیف های تعطیلات را بهتر پیش بینی کند:
“این دادههای فروش روزانه یک زنجیره خردهفروشی است. فروش در پایان هر ماه افزایش مییابد (مشتریان حقوق دریافت میکنند)، در تعطیلات کاهش مییابد، و در طول رویدادهای تبلیغاتی افزایش مییابد. همچنین گهگاهی وجود دارد که موجودیهای آن از بین میرود که منجر به کاهش برای SKUهای خاص میشود. از این دانش دامنه هنگام تجزیه و تحلیل سریها و پیشبینی استفاده کنید.”
نتیجه گیری
این مقاله هفت استراتژی مختلف را توصیف میکند که عمدتاً توسط مطالعات اخیر پایهگذاری شده و پشتیبانی میشوند، برای ایجاد اعلانهای مؤثرتر برای تجزیه و تحلیل سریهای زمانی به کمک LLM و وظایف پیشبینی.