برای نخستین بار آقای آرتور ساموئل اصطلاح یادگیری ماشین را در سال 1995 تعریف کرد، که به عنوان ” زمینه تحصیلی که به رایانه ها امکان یادگیری بدون برنامه ریزی صریح را می دهد” اطلاق می شد و این آغاز یادگیری ماشین بود. اکنون یادگیری ماشین از محبوب ترین گزینه های شغلی است. مهندس یادگیری ماشین بهترین شغل در سال 2019 با رشد 344 درصد و میانگین پایه ای حقوق 146هزار دلار در سال است.

اما یادگیری ماشین دقیقاً چیست و چگونه شروع به یادگیری آن کنیم؟

این مقاله به اصول یادگیری ماشین و همچنین مسیری که می توانید دنبال کنید تا در نهایت به یک مهندس تمام عیار یادگیری ماشین تبدیل شوید، می پردازد.

نکته
مقاله پیشنهادی: الگوریتم چیست؟

یادگیری ماشین چیست؟

یادگیری ماشین، استفاده ازهوش مصنوعی به منظور فعال کردن ماشین ها برای یادگیری یک کار بدون استفاده از برنامه نویسی، است. شروع این فرآیند با تغذیه داده های با کیفیت و پس از آن آموزش ماشین ها با ساخت مدل های مختلف یادگیری ماشین با استفاده از داده ها و الگوریتم های مختلف می باشد. انتخاب الگوریتم به این بستگی دارد که چه نوع داده هایی داریم و چه کاری را برای اتوماسیون کردن می خواهیم انجام دهیم.

یادگیری ماشین, machine learning , یادگیری پایتون, پایتون ,اصطلاحات یادگیری ماشین, منابع یادگیری ماشین, انواع یادگیری ماشین, مسابقات ML

چگونه یادگیری ML را شروع کنیم؟

برای تبدیل شدن به یک مهندس با استعداد یادگیری ماشین می توانید نقشه راه زیر را دنبال کنید، اگرچه همیشه می توان مراحل را تا رسیدن به هدف نهایی، مطابق با نیاز اصلاح کرد:

مرحله اول: درک پیش نیازها

به طور معمول برای یادگیری ML پیش نیازهایی وجود دارد که شامل: جبر خطی – محاسبات چند متغیر – آمار و پایتون است. اگر موارد ذکر شده را نمی دانید برای شروع به یک درک اساسی نیاز دارید.

  • جبر خطی و محاسبات چند متغیره را یاد بگیرید.

جبر خطی و محاسبات چند متغیره در یادگیری ماشین بسیار مهم هستند. میزان نیاز شما به این موارد به نقش شما به عنوان دانشمند داده بستگی دارد. اگر می خواهید روی R&D در یادگیری ماشین تمرکز کنید تسلط بر جبر خطی و محاسبات چند متغیره مهم است زیرا باید بسیاری از الگوریتم های ML را از ابتدا پیاده سازی کنید.

  • یادگیری آمار

داده ها نقش بسیار زیادی در یادگیری ماشین دارند. در واقع حدود 80درصد از زمان شما به عنوان یک متخصص ML برای جمع آوری و تمیز کردن داده ها صرف می شود. آمار زمینه ای است که به جمع آوری، تجزیه و تحلیل و ارائه داده ها می پردازد.

برخی از موارد در آمار که دارای اهمیت بالایی هستند عبارتند از: اهمیت آماری – توزیع احتمال –  فرضیه آزمون– رگرسیون خطی – و همچنین قضیه بیض بخش مهمی از  ML است که به مفاهیم مختلف احتمال شرطی و پیروزی و حداکثر احتمال و .. می پردازد.

  • یادگیری پایتون

تنها مرحله ای که کاملا نمی توانید از آن پرش کنید یادگیری پایتون است در حالی که زبان های دیگر هم برای Machine Learning نظیر R,Scala وجود دارند. در حال حاضر پایتون محبوب ترین زبان برای یادگیری ماشین است. کتابخانه های بسیار زیادی در پایتون وجود دارند که به طور خاص به مباحث هوش مصنوعی و یادگیریی ماشین می پردازند و برخی از آنها عبارتند از: Keras , TensorFlow , Scikit-Learn. اگر می خواهید یک مهندس یادگیری ماشین شوید حتما پایتون را فرا بگیرید.

مرحله دوم – مفاهیم یادگیری ماشین را یاد بگیرید.

اکنون که پیش نیازهای شما تمام شد می توانید یادگیری ML را ادامه دهید. بهتر است با اصول اولیه شروع کنید، سپس به سمت موارد پیچیده تری بروید. برخی از مفاهیم اساسی در ML عبارتند از:

  • اصطلاحات یادگیری ماشین

مدل: یک مدل نمایشی خاص است که با استفاده از الگوریتم های یادگیری ماشین از داده ها آموخته می شود. یک  مدل نیز فرضیه نامیده می شود.

ویژگی: در واقع خاصیت اندازه گیری فردی از داده ها را ویژگی می گویند. مجموعه ای از ویژگی عددی را به راحتی می توان توسط یک بردار ویژگی توصیف کرد. بردارهای ویژگی به عنوان ورودی به مدل ها تغذیه می شوند. به عنوان مثال:  برای پیش بینی یک میوه ممکن است ویژگی هایی مانند: رنگ و بو و مزه وجود دشته باشد.

برچسب: متغیر هدف یا برچسب مقداری است که توسط مدل ما قابل پیش بینی است. برای مثال میوه ای که در بخش قبل بحث شد برچسب یا مجموعه ای از ورودی ، نام میوه هایی مانند: سیب و موز و پرتقال وغیره خواهد بود.

آموزش: ایده آن است که مجموعه ای از ویژگی ها را ارائه دهیم و خروجی مورد انتظار برچسب ها باشد. بنابراین پس از آموزش یک مدل فرضیه خواهیم داشت که سپس داده های جدید را به یکی از دسته های آموزش داده شده نقشه می کند.

پیش بینی: پش از آماده شدن مدل می توان مجموعه ای از ورودی هایی را که خروجی پیش بینی شده آنها را تامین می کند، تغذیه کرد.

  • انواع یادگیری ماشین

یادگیری با نظارت: شامل یادگیری از مجموعه داده های آموزشی با داده های دارای برچسب با استفاده از مدل های طبقه بندی و رگرسیون است. این فرآیند یادگیری تا رسیدن به سطح عملکرد مورد نیاز ادامه می یابد.

یادگیری بدون نظارت: شامل استفاده از داده های بدون مجوز و سپس یافتن ساختار اساسی در داده ها به منظور کسب اطلاعات بیشتر در مورد خود داده ها با استفاده از مدل های تحلیلی عاملی و خوشه ای است.

یادگیری نیمه نظارتی: شامل استفاده از دادها بدون برچسب با مقدار کمی داده های دارای برچسب است. استفاده از داده های دارای برچسب دقت یادگیری را افزایش می دهد. و همچنین مقرون به صرفه تر از یادگیری نظارتی است.

تقویت آموزش: شامل یادگیری اقدامات بهینه از طریق آزمون و خطا است. بنابراین اقدام بعدی با یادگیری رفتارهایی که مبتنی بر وضعیت فعلی هستند تصمیم گرفته می شود و باعث افزایش پاداش در آینده می شود.

  • چگونه یادگیری ماشین را تمرین کنیم.

بیشترین زمان در ML صرف جمع آوری داده ها، ادغام، تمیز کردن و پیش پردازش می شود. بنابراین حتما با این کار تمرین را شروع کنید. زیرا به داده های با کیفیت بالا نیاز دارید، اما مقادیر زیادی از داده ها اغلب کثیف هستند. بنابراین در این بخش بیشترین وقت صرف خواهد شد.

مدل های مختلف را بیاموزید و روی داده های واقعی تمرین کنید. به شما کمک خواهد کرد تا شهود خود را در مورد انواع مدل های مناسب درموقعیت های مختلف ایجاد کنید. در کنار این مراحل، درک چگونگی تفسیر نتایج بدست آمده با استفاده از مدل های مختلف مهم است. در صورت درک پارامترهای مختلف، تنظیم و روشهای نظم دهی که در مدل های مختلف استفاده می شود کار را ساده تر می کند.

  • منابع یادگیری ماشین

منابع مختلف آنلاین و آفلاین با هزینه و رایگان وجود دارند که می توانید برای یادگیری ماشین از آنها استفاده کنید که برخی از مهمترین آنها عبارتند از:

دوره آموزشی یادگیری ماشین استنفورد آقای اندرو نگ کاملا محبوب است و بر یادگیری ماشین – داده کاوی – شناسائی الگوهای آماری تاکید دارد. دوره آموزش یادگیری ماشین تصادفی از گوگل برای شما بسیار محبوب است.

مرحله سوم: در مسابقات ML شرکت کنید.

پس از اینکه اصول اولیه یادگیری ماشین را فهمیدید، می توانید به قسمت دیوانه کننده مسابقات بروید!!