10 الگوریتم یادگیری ماشین که با استفاده از قیاس های دنیای واقعی توضیح داده شده اند


10 الگوریتم یادگیری ماشین که با استفاده از قیاس های دنیای واقعی توضیح داده شده اند

10 الگوریتم یادگیری ماشین که با استفاده از قیاس های دنیای واقعی توضیح داده شده اند

وقتی در دبیرستان بودم و مسائل پیچیده ریاضی را مطالعه می کردم، همیشه فکر می کردم که چرا آنها را مطالعه می کنیم یا چرا مفید هستند. من قادر به درک و استفاده از آنها در دنیای واقعی نبودم. از آنجایی که یادگیری ماشین نیز یک موضوع پرطرفدار است که بسیاری از مردم مایل به کشف آن هستند، ریاضیات پیچیده و انتزاع در پشت الگوریتم‌های یادگیری ماشین، درک و یادگیری استفاده از آن را برای مبتدیان دشوار می‌کند.

اینجاست یادگیری آنالوگ به شما امکان می دهد قیاس های دنیای واقعی را با مفاهیم پیچیده مرتبط کنید که به شما کمک می کند کنجکاو بمانید و خلاقانه فکر کنید. وقتی واقعاً این الگوریتم‌ها را برای حل مسائل دنیای واقعی بعداً اعمال می‌کنید، این واقعاً به شما کمک می‌کند. با الهام از این رویکرد، قصد دارم 10 الگوریتم رایج یادگیری ماشین را با جفت کردن آنها با قیاس های دنیای واقعی توضیح دهم، پس بیایید شروع کنیم.

1. رگرسیون خطی

رگرسیون خطی یک الگوریتم یادگیری ماشینی نظارت شده است که سعی می‌کند بهترین خط مستقیم را بین ویژگی‌های شما و متغیر هدف شما قرار دهد تا تفاوت بین مقدار واقعی و مقدار پیش‌بینی‌شده تا حد امکان کوچک باشد.

مقایسه: فرض کنید شما یک باغبان هستید و می خواهید مقدار ایده آل کودی را که باید به گیاه بدهید تا رشد آن را افزایش دهید آزمایش کنید. برای این کار مقدار کود (متغیر مشخص/مستقل) را ثبت می کنید و همچنین رشد گیاه مربوطه (متغیر وابسته یا هدف) را برای یک ماه اندازه گیری می کنید. حالا شما اطلاعات را در اختیار دارید و آن را روی نمودار پراکنده رسم می کنید و سعی می کنید بهترین خط مستقیمی را که از این نقاط می گذرد مشخص کنید به طوری که انحراف همه نقاط از خط حداقل باشد. هنگامی که این خط را دارید، می توانید رشد گیاه آینده را بر اساس میزان کود مصرفی پیش بینی کنید.

2. رگرسیون لجستیک

این تا حدودی شبیه به رگرسیون خطی و یک مسئله یادگیری نظارت شده است، اما رگرسیون خطی متغیر هدف پیوسته را پیش‌بینی می‌کند در حالی که رگرسیون لجستیک برای مسائل طبقه‌بندی دودویی استفاده می‌شود، جایی که احتمال یک نتیجه باینری مانند احتمال بله یا خیر، درست یا نادرست را پیش‌بینی می‌کند. .

مقایسه: به عنوان مثال، اگر شما استعدادهای آمریکایی را تماشا کنید، می دانیم که تنها دو انتخاب وجود دارد: یا شرکت کننده برای دور بعدی انتخاب می شود یا انتخاب نمی شود. بنابراین شما عوامل مختلفی مانند عملکرد فعلی، تجربیات گذشته، اعم از منحصر به فرد بودن یا نبودن آن‌ها را در نظر می‌گیرید و بر اساس آن تصمیم می‌گیرید که نامزد چقدر توانایی موفقیت در دور بعدی را دارد. بسته به این، یا دکمه قرمز (رد) یا دکمه سبز (پذیرفتن) را فشار دهید.

3. درخت تصمیم

درخت تصمیم یک الگوریتم یادگیری نظارت شده است که به صورت بازگشتی داده های شما را بر اساس مقادیر ویژگی به زیر مجموعه ها تقسیم می کند. هر تقسیم بر روی گره در واقع تصمیمی است که جهت سفر را تعیین می کند و به پیش بینی کمک می کند.

مقایسه: آیا تا به حال بازی “20 سوال” را با دوست خود بازی کرده اید؟ درخت های تصمیم دقیقاً اینگونه عمل می کنند. اجازه دهید به شما بگویم که در این بازی دوست شما به چیزی فکر می کند که شما باید حدس بزنید و تنها کاری که می توانید انجام دهید این است که از او سؤالات بله/خیر بپرسید تا پاسخ های ممکن را محدود کنید. هر پاسخ به شما در تصمیم گیری کمک می کند و تا زمانی که پاسخ صحیح را حدس بزنید گزینه ها را حذف می کند.

4. الگوریتم جنگل تصادفی

جنگل تصادفی یک تکنیک یادگیری گروهی است که از درخت‌های تصمیم‌گیری متعددی استفاده می‌کند که بر روی بخش‌های مختلف داده آموزش داده شده‌اند. سپس پیش‌بینی‌های هر درخت را ترکیب می‌کند تا تصمیم نهایی را بگیرد.

مقایسه: کمیته ای متشکل از سرمایه گذاران و سهامداران یک شرکت را تصور کنید که باید در مورد یک معامله جدید تصمیم بگیرند. هر کس فرآیند فکری و تجربیات خود را دارد. هر کدام بر اساس تحلیل خود قضاوت می کنند. در پایان، تمام قضاوت ها برای تصمیم گیری نهایی ترکیب می شوند.

5. ماشین بردار پشتیبانی (SVM)

SVM یک الگوریتم یادگیری ماشینی نظارت شده است که کلاس ها را با استفاده از یک خط مستقیم (هایپرپلن) تقسیم می کند به طوری که فاصله بین آنها حداکثر باشد. وقتی یک نقطه داده جدید می رسد، تشخیص اینکه به کدام گروه/کلاس تعلق دارد آسان تر است.

مقایسه: اگر اهل ورزش باشید متوجه رقابت هواداران دو تیم مقابل در زمین خواهید شد. بنابراین سعی کنید تا حد امکان این دو گروه را از هم جدا کنید، به عنوان مثال با بستن روبان قرمز، و زمانی که فرد جدیدی به شما ملحق شد، بر اساس ویژگی هایی مانند پیراهنی که می پوشد یا تیمی که از آن حمایت می کند، می توانید آن را تهیه کنید. چیدمان صندلی بر این اساس

6. الگوریتم ساده بیز

این یک الگوریتم یادگیری ماشینی نظارت شده بر اساس قضیه بیز است و فرض می کند که ویژگی ها مستقل هستند. احتمال هر کلاس را با در نظر گرفتن برخی اطلاعات قبلی محاسبه می کند و سپس کلاسی که بیشترین احتمال را دارد انتخاب می شود. این عمدتا برای مشکلات طبقه بندی استفاده می شود.

مقایسه: همه ما از هرزنامه ها آگاه هستیم، درست است؟ اساساً، فیلتر به دنبال کلمات رایجی مانند “رایگان”، “تخفیف”، “زمان محدود” یا “اینجا کلیک کنید” بدون در نظر گرفتن زمینه ای که این کلمات در آن ظاهر می شوند، می گردد. اگرچه این ممکن است برخی از موارد را به اشتباه طبقه‌بندی کند، اما هنگام برخورد با هزاران ایمیل باعث صرفه‌جویی در زمان می‌شود. این کلمات هرزنامه را به عنوان ویژگی های مستقل در نظر می گیرد تا احتمال اسپم بودن یا نبودن یک ایمیل را مشخص کند.

7. الگوریتم K-Nearest Neighbors (KNN).

KNN یک الگوریتم یادگیری نظارت شده است که فرض می‌کند نقاط داده مشابه در فضای ویژگی به یکدیگر نزدیک‌تر خواهند بود (درست مانند دوستان نزدیکی که در کلاس کنار هم می‌نشینند). پیش‌بینی‌هایی درباره برچسب یک نقطه داده ناشناخته با استفاده از K نزدیک‌ترین همسایه‌های شناخته شده‌اش انجام می‌دهد، جایی که یک فراپارامتر است و تعداد همسایگان رای‌دهنده را نشان می‌دهد.

مقایسه: فرض کنید می خواهید رستوران های جدید را امتحان کنید و چندین گزینه دارید. بنابراین از دوستان خود (همسایگان KNN) توصیه می کنید. هر کدام از آنها مکان مورد علاقه خود را که بازدید کرده اند توصیه می کنند، و مکانی که اکثریت آرا را کسب می کند همان جایی است که شما تصمیم می گیرید از آن بازدید کنید.

8. K-mean

K-means یک الگوریتم یادگیری بدون نظارت است که نقاط داده را بر اساس موقعیت آنها به خوشه های منحصر به فرد اختصاص می دهد. با مقداردهی اولیه تصادفی مرکزها و محاسبه فاصله هر نقطه تا این مرکزها شروع می شود. سپس هر نقطه به نزدیکترین خوشه مرکزی اختصاص داده می شود. نقاط داده جدید از هر خوشه برای یافتن مرکزهای جدید به طور میانگین محاسبه می شود. این فرآیند تا زمانی تکرار می شود که مرکزها دیگر تغییر نکنند، به این معنی که نقاط داده کاملاً در خوشه ها طبقه بندی شده اند.

مقایسه: تصور کنید شما بخشی از یک جامعه کتابخوانی هستید و آنها باید 3 گروه از مثلاً 18 دانش آموز ایجاد کنند. در ابتدا آنها را به صورت تصادفی به 3 گروه 6 نفره تقسیم می کنند. سپس، در تکرار دوم، افراد را بر اساس علایق جمع‌آوری‌شده از یک فرم، تغییر می‌دهند. سپس پس از تعامل، تغییراتی ایجاد می کنند مگر اینکه گروه های نهایی با افراد دارای علایق مشترک ایجاد شوند.

9. تجزیه و تحلیل اجزای اصلی

PCA یک الگوریتم یادگیری بدون نظارت است. این یک تکنیک کاهش ابعاد است که اجزای اصلی (مهم) داده ها را شناسایی می کند و آنها را در فضایی با ابعاد پایین تر ترسیم می کند و تجزیه و تحلیل آنها را آسان تر می کند.

مقایسه: بسیاری از ما به جایی سفر کرده‌ایم و می‌دانم که چمدان‌هایشان با دردسر است. فرض کنید فقط یک چمدان داریم، پس چه کنیم؟ ابتدا آن را با موارد مهم پر می کنیم، سپس سعی می کنیم راهی برای فشرده سازی موارد کم اهمیت یا حذف آنها از کیف خود پیدا کنیم. این دقیقاً نحوه عملکرد PCA است، با شناسایی عناصر مهم و متراکم کردن یا حذف عناصر کمتر مرتبط.

10. افزایش گرادیان

این یک الگوریتم یادگیری گروهی است که چندین مدل ضعیف را برای ایجاد یک مدل قوی ترکیب می کند. به طور مکرر کار می کند و هر مدل سعی می کند اشتباهات مدل قبلی را بهبود بخشد و در نتیجه عملکرد کلی را افزایش دهد.

مقایسه: آیا تا به حال در یک موضوع در ابتدا مشکل داشته اید، اما به تدریج پیشرفت کرده اید؟ معمولاً در این شرایط رویکرد کلی چیست؟ شما در یک آزمون شرکت می کنید، نمرات را دریافت می کنید، سپس روی خلأها یا موضوعاتی که نمی فهمید کار می کنید. این فرآیند به تدریج عملکرد کلی شما را در این موضوع بهبود می بخشد.

این من را به پایان مقاله ام می رساند. من واقعاً دوست دارم این مفاهیم را با استفاده از تشبیهات توضیح دهم و امیدوارم که آنها را مانند من مفید بیابید. اگر این روش را دوست داشتید یا اگر پیشنهادی برای موضوعات دیگر دارید، در نظرات به من بگویید!



منبع:aitoolsclub.com/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *