یادگیری از طریق انجام بهترین راه برای تسلط بر مهارت های ضروری برای تبدیل شدن به یک مهندس یادگیری ماشین است. به جای تمرکز بر مدل های طبقه بندی ساده و رگرسیون.
در این وبلاگ، ما بر روی پروژه های یادگیری ماشینی پیشرفته تمرکز خواهیم کرد که بر رزومه شما تأثیر می گذارد و استخدام کنندگان و مدیران استخدام را جذب می کند. ما در مورد پروژه های بینایی کامپیوتری، تشخیص گفتار، پیش بینی قیمت سهام، تنظیم دقیق Stable Diffusion و Llama 3، برنامه های کاربردی عامل هوش مصنوعی چند مرحله ای و یادگیری تقویتی خواهیم آموخت. همچنین ابزارها و مفاهیم مختلفی را برای ایجاد و بهینه سازی این پروژه ها کشف خواهید کرد.
1. شرح خودکار تصویر
زیرنویس خودکار تصویر یک پروژه جذاب است که بینایی کامپیوتری و پردازش زبان طبیعی را ترکیب می کند. هدف تولید زیرنویس های توصیفی برای تصاویر است. این پروژه از شبکههای عصبی کانولوشنال (CNN) برای استخراج ویژگی تصویر و شبکههای عصبی تکراری (RNN) برای تولید زیرنویس استفاده میکند. اجرای این پروژه توانایی شما را در کار با معماری های پیچیده شبکه عصبی و مدیریت داده های چندوجهی نشان می دهد.
2. تشخیص خودکار صدا
سیستم های تشخیص خودکار گفتار (ASR) زبان گفتاری را به متن تبدیل می کند. اگر با زبانی کمتر رایج کار می کنید، این پروژه می تواند به ویژه چشمگیر باشد. این محبوب ترین پروژه ای است که من روی آن کار کرده ام. شما حتی می توانید آن را برای خودتان با کلیک بر روی لینک مشاهده کنید kingabzpro/wav2vec2-large-xls-r-300m-urdu و تعداد دانلودها را بررسی کنید.
در این پروژه یاد می گیرید که چگونه متن و صدا را پردازش کنید و سپس مدل wav2vec2 را به زبان مورد نظر خود اصلاح کنید. اگر به دنبال کد منبع و راهنما هستید، می توانید آن را بررسی کنید kingabzpro/urdu-ASR-SOTA مخزن DagsHub.
پس از صیقل دادن الگو، می توانید آن را در Hugging Face ذخیره کنید و سپس یک برنامه ASR بلادرنگ ایجاد کنید تا در فضای Hugging Face اجرا شود، همانطور که در زیر نشان داده شده است.
3. پیش بینی قیمت سهام
پیش بینی قیمت سهام این شامل پیش بینی قیمت سهام آتی با استفاده از داده های تاریخی است. این پروژه را می توان با استفاده از تکنیک های مختلف یادگیری ماشین مانند تحلیل سری های زمانی، مدل های رگرسیون و حتی مدل های یادگیری عمیق مانند LSTM (شبکه های حافظه کوتاه مدت بلند مدت و در کوتاه مدت) پیاده سازی کرد. حتی میتوانید از آموختههای این پروژه برای ایجاد ربات معاملاتی خود با ادغام API صرافی استفاده کنید.
4. تنظیم دقیق Stable Diffusion XL
Stable Diffusion XL یک مدل قدرتمند برای تولید تصاویر با کیفیت بالا است. توسعه این مدل استفاده از تکنیک هایی مانند DreamBooth و LoRA (انطباق با رتبه پایین) می تواند به شما در ایجاد مدل های تولید تصویر سفارشی کمک کند. در این پروژه من با استفاده از 5 تصویر خود قالب را تغییر دادم و نتایج شگفت انگیز است.
میتوانید آن را با شخصیتهای کارتونی خاص تنظیم کنید و کمیک خود را با استفاده از هوش مصنوعی مولد طراحی کنید. این پروژه تخصص شما را در کار با مدل های مولد پیشرفته و توانایی شما در سفارشی سازی و بهینه سازی آنها برای کارهای خاص را به نمایش می گذارد.
5. تنظیم Llama 3 و استفاده محلی
آموزش ”تنظیم لاما 3 و استفاده محلی” پروژه ساخت جدیدترین مدل منبع باز پیشرفته، Llama 3، بر روی مجموعه داده های پزشکی را پوشش می دهد. هدف ایجاد یک ربات چت است که در آن کاربران می توانند سوالات خود را از یک پزشک هوش مصنوعی بپرسند.
در طول این آموزش، نحوه پردازش داده ها، استفاده از تکنیک های LoRA، بهینه سازی مدل و حافظه، سرعت بخشیدن به مدل با استفاده از GPU و استفاده از ابزارهای مختلف برای ادغام، تبدیل و تعیین کمیت مدل را خواهید آموخت.
در پایان مدل کوانتیزه شده را دانلود کرده و با استفاده از اپلیکیشن Jan از آن به صورت محلی استفاده می کنید. این پروژه نه تنها سرگرم کننده است، بلکه یک فرصت یادگیری عالی است که از طریق آن به درک عمیقی از نحوه حل مشکلات مختلف مربوط به اصلاح مدل های زبان بزرگ دست خواهید یافت.
6. با استفاده از LangChain یک عامل هوش مصنوعی چند مرحله ای بسازید
یک عامل هوش مصنوعی در چند مرحله ایجاد کنید شامل ایجاد سیستمی است که قادر به انجام یک سری وظایف به طور مستقل است. با استفاده از چارچوبهایی مانند LangChain، میتوانید عوامل هوش مصنوعی را توسعه دهید که میتوانند جریانهای کاری پیچیده را مدیریت کنند.
در این پروژه، شما یک برنامه هوش مصنوعی ایجاد خواهید کرد که درخواست کاربر را برای جستجوی وب با استفاده از Tavily API می گیرد و همچنین کد پایتون را برای استفاده از داده ها تولید می کند. سپس برنامه از Python REPL برای اجرای کد و بازگرداندن تجسم درخواست شده توسط کاربر استفاده می کند. قبل از شروع پروژه، Cohere API و عملکردهای مختلف آن را کشف خواهید کرد.
7. ایجاد MLAgent برای بازی فوتبال 2v2
یادگیری تقویتی یک تکنیک قدرتمند برای آموزش عوامل برای تصمیم گیری در محیط های پیچیده است. ساخت MLAgent برای یک مسابقه فوتبال 2v2 این بازی شامل ایجاد یک محیط، تعیین پاداش و آموزش عوامل با استفاده از الگوریتم های یادگیری تقویتی است. Hugging Face آموزش های عملی برای چنین پروژه هایی را در دوره DeepRL ارائه می دهد که می توانید به صورت رایگان در آنها شرکت کنید. این پروژه تخصص شما را در یادگیری تقویتی و توسعه بازی و توانایی شما در ایجاد عوامل هوشمند قادر به یادگیری و تطبیق را به نمایش می گذارد.
نتیجه گیری
کار بر روی این پروژه های پیشرفته یادگیری ماشینی مهارت های فنی شما را بهبود می بخشد و رزومه شما را برای استخدام کنندگان و مدیران استخدام برجسته می کند. هر پروژه جنبه های مختلفی از یادگیری ماشین را پوشش می دهد، از بینایی کامپیوتر و پردازش زبان طبیعی گرفته تا یادگیری تقویتی و مدل های مولد. با نشان دادن توانایی خود در مدیریت پروژه های پیچیده و مجموعه داده های متنوع، شانس خود را برای یافتن شغلی پردرآمد در یادگیری ماشینی به میزان قابل توجهی افزایش خواهید داد.