

تصویر توسط نویسنده | ایدئوگرام
5 کتاب رایگان در کامپیوتر ویژن
بینایی کامپیوتر شاخه ای از هوش مصنوعی (AI) است که مطالعه می کند چگونه ماشین ها می توانند اطلاعات بصری، مانند تصاویر و ویدئوها را تفسیر و درک کنند. امروزه، بیشتر مدلهای بینایی کامپیوتری مبتنی بر معماریهای یادگیری عمیق مانند شبکههای عصبی کانولوشنال (CNN) هستند که در وظایفی مانند طبقهبندی تصویر، تشخیص اشیا و تقسیمبندی برتری دارند. با این حال، مبانی مورد نیاز برای درک عمیق این رشته به دوران قبل برمی گردد.
برای کمک به شما در تسلط بر این حوزه پرکاربرد هوش مصنوعی، این مقاله پنج کتاب را فهرست میکند که میتوانید به صورت رایگان بخوانید: متون کلاسیک برای کسب مبانی نظری و یادگیری تکنیکهای مرسوم، و متون جدیدتر که مدلهای پیشرفتهای مانند شبکههای عصبی عمیق را پوشش میدهند.
1. بینایی کامپیوتر: الگوریتم ها و کاربردها (R. Szeliski)
این کتاب بینایی کامپیوتر منتشر شده توسط اسپرینگر را می توانید از فروشگاه های آنلاین معتبر خریداری کنید. با این حال، آن را می توان از دانلود وب سایت نویسنده فقط برای استفاده شخصی رایگان است. این کتاب که بیش از 1200 صفحه را در بر می گیرد، یک منبع کلیدی در زمینه بینایی کامپیوتر است که طیف گسترده ای از موضوعات و کاربردها را پوشش می دهد: تشخیص اشیا، پردازش تصویر، بازسازی سه بعدی، تحلیل حرکت و غیره.
2. بینایی کامپیوتر: مدلها، یادگیری و استنتاج (SJD Prince)
یک متن مرجع کلاسیک برای دانلود در دسترس است اینجااین یک مقدمه جامع برای بینایی کامپیوتر ارائه میکند و مفاهیم اساسی مدلها و تکنیکهای یادگیری ماشینی را که در اکثر سیستمهای بینایی کامپیوتری استفاده میشوند، برجسته میکند. همچنین مقدمهای عمیق بر مدلهای احتمالی و گرافیکی را پوشش میدهد که برای بسیاری از رویکردهای بینایی رایانه ضروری است.
3. بینش کامپیوتر: مبانی و کاربردها (یادداشت های سخنرانی استانفورد)
این مجموعه عالی توسط Rankay Krishna یادداشت های سخنرانی از دوره ای به همین نام در دانشگاه استنفورد را گرد هم می آورد. خواندنی مختصرتر اما جامعتر با تمرکز بر ابهام زدایی از مفاهیم و تعاریف این حوزه. نسخه pdf را می توان در بخش چشم انداز استانفورد مشاهده کرد اینجا.
4. برنامه نویسی کامپیوتر ویژن با پایتون (JE Solem)
این کتاب تحت مجوز Creative Commons، تمرکز بر اجرای عملی سیستمهای بینایی کامپیوتری در پایتون، با استفاده از رویکردها و کتابخانههای سنتی است. از صفحه 1 شروع میشود، به نمونههای مبتنی بر پایتون برای پردازش تصویر میپردازد و به دنبال آن برنامههای مختلفی مانند واقعیت افزوده، خوشهبندی تصویر و طبقهبندی تصویر را دنبال میکند. این کتاب تکنیکهای بینایی کامپیوتری سنتی را بدون درگیر شدن شبکههای عصبی یا معماریهای یادگیری عمیق پوشش میدهد و در عوض بر روی ریاضیات، هندسه و رویکردهای کلاسیک یادگیری ماشین تمرکز میکند.
5. یادگیری عمیق، MIT Press (I. Godfellow et al.)
کتاب محبوب Deep Learning منتشر شده توسط MIT Press را نمی توان برای توزیع در قالب PDF دانلود کرد، اما فصل های آن به صورت عمومی برای خواندن در قالب HTML در وب سایت کتاب در دسترس است. وب سایت. اگرچه این کتاب صرفاً بر روی بینایی رایانه متمرکز نیست، اما فصلهای ضروری برای درک سیستمهای بینایی مدرن مبتنی بر معماریهای CNN (فصل 9)، برنامههای بینایی رایانه (فصل 12)، و مدلسازی احتمالی دادههای بدون ساختار مانند تصاویر (فصل 16) ارائه میکند. فقط چند مورد را نام ببرم. چند. این فصلها پس از کسب اصول بینایی کامپیوتری از طریق کارهایی که قبلاً ذکر شد، ادامه ایدهآلی برای خوانندگان پیشرفته است.