ماشین لرنینگ به زبان ساده (یادگیری ماشین) + هر چیزی که باید ازش بدونین

0

ماشین لرنینگ به زبان ساده چی میشه؟ آیا از ماشین لرنینگ چیزی میدانید؟ تو این مطلب از دنیای فناوری قرار هست درباره این موضوع بیشتر برای شما بگم. پس در ادامه همراه با رشد کسب و کار باشید.

یادگیری ماشین رو میشه پرکاربرد ترین شاخه‌ی هوش مصنوعی دانست که در تمام سطوح زندگی روزمره گسترش یافته و درک یادگیری ماشین میتونه به درک بهتر دنیای آینده کمک کنه.

هوش مصنوعی (AI) همه جا حضور داره، ممکنه همین حالا در حال استفاده از اون باشین و خودتون اطلاعی نداشته باشین. یکی از محبوب‌ ترین کاربرد های AI در زمینه‌ی توسعه‌ی نرم‌ افزار سفارشی، یادگیری ماشین (ML) هست. کامپیوترها، نرم‌افزارها و دستگاه‌ های یادگیری ماشین عملکردی مشابه مغز انسان دارن و از طریق شناخت وظایف رو انجام میدن.

ماشین لرنینگ به زبان ساده

بر اساس تعریفی دقیق، یادگیری ماشین شاخه‌ ای از هوش مصنوعی (AI) متمرکز بر ساخت برنامه‌ هاییست که از داده‌ های یاد میگیرن و دقت‌ آنها به مرور زمان و بدون نیاز به برنامه‌ نویس افزایش پیدا میکنه. در علوم داده‌ ای، الگوریتم شامل یک توالی از مراحل پردازش آماری به حساب میاد.

در یادگیری ماشین، الگوریتم‌ ها برای یافتن الگوها و مشخصات در مقادیر انبوه داده‌ ها آموزش داده میشه تا بتونن تصمیم‌ ها و پیش‌بینی‌ هایی رو بر اساس داده‌ های جدید اتخاذ کنن. هر چقدر الگوریتمی بهتر باشه، تصمیم‌ ها و پیش‌بینی‌ های خروجی دقیق‌ تر خواهند بود.

پیش‌ بینی‌ های یادگیری ماشین میتونه شامل پاسخ به پرسش‌ هایی مثل تشخیص یه میوه در تصویر، تشخیص افراد در حال عبور از خیابان، تشخیص گفتار دقیق برای تولید کپشن‌ های ویدئوی یوتیوب یا تفکیک ایمیل و اسپم باشه. تفاوت کلیدی یادگیری ماشین با نرم‌ افزار کامپیوتری قدیمی اینه که توسعه‌ دهنده‌ی انسانی کد یادگیری ماشین رو نمینویسه.

بلکه مدل یادگیری ماشین چگونگی تفکیک بین عناصر در مجموعه‌ی انبوهی از داده‌ ها رو فرا میگیره. کلید اصلی یادگیری ماشین همون مقدار انبوه داده‌ هاست که امکان یادگیری رو برای اون فراهم میکنه.

ماشین لرنینگ به زبان سادهتفاوت هوش مصنوعی و ماشین لرنینگ چیست؟

یادگیری ماشین اخیرا به موفقیت زیادی رسیده؛ اما فقط یکی از شاخه‌ های هوش مصنوعی هست. در ابتدای ظهور هوش مصنوعی در دهه‌ی ۱۹۵۰ این تعریف برای آن ارائه شد:

هر ماشینی که قادر به اجرای وظایفی هست و نیاز به هوش انسانی داره

هر کدوم از سیستم‌ های هوش مصنوعی دارای یک یا چند عدد از این ویژگی‌ ها هستن:

  • برنامه‌ ریزی
  • یادگیری
  • استنتاج
  • حل مسئله
  • ارائه‌ی اطلاعات
  • درک
  • حرکت
  • دستکاری اطلاعات
  • هوش اجتماعی
  • خلاقیت

در کنار یادگیری ماشین، روش‌ های متعدد دیگه ای برای ساخت سیستم‌ های هوش مصنوعی وجود دارن از جمله این روش‌ ها میشه به محاسبات تکاملی اشاره کرد که در اون الگوریتم‌ ها دست خوش جهش‌ های تصادفی میشن و برای راه‌ حل‌ های بهینه‌ به تکامل میرسونن.

نوع دیگه هوش مصنوعی سیستم‌ های خبره هستن؛ در سیستم‌ های خبره، کامپیوترها با قوانینی برنامه‌ نویسی میشن که امکان تقلید از رفتار انسان در حوزه‌ ای مشخص مثل سیستم‌ های هدایت خودکار هواپیما رو میدن.

بهبود دیتاسنترها با ماشین لرنینگ (یادگیری ماشین)

از یادگیری ماشین میشه برای بهبود مراکز داده‌ ای یا دیتاسنترها استفاده کرد. چهار گام اصلی برای ساخت اپلیکیشن یا مدل یادگیری ماشین وجود داره، دانشمندان داده‌ ای در همکاری نزدیک با کارشناسان تجاری به توسعه‌ ای این مراحل میپردازن:

مرحله‌ ۱: انتخاب و آماده‌ سازی دیتاست آموزشی

داده‌ های آموزشی به مجموعه‌ی داده‌ ای گفته میشه که نماینده‌ی مدل یادگیری ماشین هست و برای حل مسائلی مشخص به کار میره. در برخی نمونه‌ ها، داده‌ های یادگیری از نوع برچسب‌ دار هستن تا ویژگی‌ ها و طبقه‌ بندی‌ هایی رو برای مدل فراخوانی کنن.

داده‌ های دیگه از نوع بدون برچسب هستن در این شرایط مدل باید برخی ویژگی‌ ها رو برای تخصیص طبقه‌ بندی‌ ها استخراج کنه، در هر دو نمونه داده‌ های یادگیری باید به‌ خوبی آماده بشن. فرایند آماده‌ سازی شامل تصادفی‌ سازی و بررسی انحراف‌ هاییست که بر یادگیری تأثیر میذارن. داده‌ ها در این مرحله به دو زیرم جموعه تقسیم میشن:

  1. زیر مجموعه‌ی یادگیری که برای آموزش برنامه به کار میره
  2. زیر مجموعه‌ی تکاملی که برای تست و اصلاح اون به کار برده میشه

ماشین لرنینگ به زبان سادهمرحله‌ ۲: انتخاب الگوریتمی برای اجرای مجموعه داده‌های آموزشی

انواع متداول الگوریتم‌ های یادگیری ماشین قابل استفاده با داده‌ های برچسب‌ دار عبارتند از:

  • الگوریتم‌ های رگرسیون: رگرسیون خطی و منطقی نمونه‌ هایی از الگوریتم‌ های رگرسیون به‌ کار رفته برای درک روابط بین داده‌ ها هستن. از رگرسیون خطی برای پیش‌ بینی مقدار متغیر وابسته بر اساس مقدار متغیر مستقل استفاده میشه. از رگرسیون منطقی هم زمانی استفاده میشه که متغیر وابسته ماهیتی دودویی داشته باشه.
  • درخت‌ های تصمیم: درخت‌ های تصمیم از داده‌ های طبقه‌ بندی‌ شده برای ارائه‌ی پیشنهاد بر اساس مجموعه‌ی قوانین تصمیم استفاده میکنن. برای مثال، درخت تصمیمی که شرط‌ بندی روی برد یک اسب رو توصیه کنه از این دست به حساب میاد.
  • الگوریتم‌ های مبتنی بر نمونه: مثال خوبی از الگوریتم‌ های مبتنی بر نمونه، الگوریتم K نزدیک‌ ترین همسایه یا الگوریتم k-nn هست. این الگوریتم از طبقه‌ بندی برای تخمین احتمال وجود نقطه‌ ای داده‌ ای در یک گروه استفاده میکنه.
  • الگوریتم‌ های دسته‌ بندی: دسته‌ ها رو همان گروه‌ ها تصور کنین. دسته‌ بندی متمرکز بر شناسایی گروه‌ هایی با رکورد های مشابه و برچسب‌ گذاری رکوردها بر اساس گروهیست که به اون تعلق دارن.
  • الگوریتم‌ های رابطه‌ ای: الگوریتم‌ های رابطه‌ ای به‌ دنبال الگوها و روابط در داده‌ ها میرن و روابط تکراری “اگر آنگاه” یا if-then رو شناسایی میکنن. این روابط مشابه قوانین به‌ کار رفته در داده‌ کاوی هستن.
  • شبکه‌ های عصبی: شبکه‌ی عصبی، الگوریتمی هست که شبکه‌ ای لایه‌ بندی‌ شده از محاسبات شامل لایه‌ی ورودی رو تعریف میکنه.

مرحله‌ ۳: آموزش الگوریتم برای ساخت مدل

آموزش الگوریتم فرآیندی تکراریست. این مرحله شامل اجرای متغیرها در الگوریتم، مقایسه‌ی خروجی با نتایج قابل انتظار، تنظیم وزن‌ ها و انحراف‌ های داخل الگوریتم و راه‌ اندازی مجدد متغیرهاست تا زمانیکه الگوریتم نتیجه‌ی صحیح رو بازگرداند. الگوریتم‌ آموزش‌ دیده‌ی حاصل، نوعی مدل یادگیری ماشین هست.

مرحله‌ ۴: استفاده از مدل و بهبود آن

مرحله‌ی آخر، استفاده از مدل با داده‌ های جدید و در بهترین حالت بهبود دقت و کارایی اون به مرور زمان هست. منبع داده‌ های جدید هم به نوع مسئله وابسته هست. برای مثال، مدل یادگیری ماشینی که برای شناسایی اسپم طراحی شده، پیام‌ های ایمیل رو به‌ عنوان ورودی دریافت میکنه درحالیکه مدل یادگیری ماشین که هدایت ربات جاروبرقی رو بر عهده داره داده‌ های مربوط به تعامل واقعی با اثاث منزل یا اشیای جدید داخل اتاق رو به‌ عنوان ورودی دریافت میکنه.

ماشین لرنینگ به زبان سادهانواع یادگیری ماشین

یادگیری ماشین به دو دسته‌ی اصلی تقسیم میشه: یادگیری نظارت‌ شده و بدون نظارت.

یادگیری نظارت‌ شده

در فرآیند آموزش یادگیری نظارت‌ شده، سیستم‌ ها در معرض مقادیر زیادی از داده‌ های برچسب‌ دار مثل تصاویر رقم‌ های دست‌ نویس قرار میگیرن. سیستم یادگیری نظارت‌ شده با وجود تعداد کافی نمونه‌ ها میتونه دسته‌ های پیکسل‌ ها و شکل‌ های مرتبط با هر عدد رو شناسایی کنه و اعداد دست‌ نویس رو شناسایی کنه.

با این‌ حال، آموزش سیستم‌ های یادگیری ماشین نیازمند تعداد زیادی از برچسب‌ هاست به‌ طوریکه بعضی سیستم‌ ها برای مهارت در یک وظیفه به میلیون‌ها برچسب نیاز دارن. در نتیجه دیتاست‌ ها یا مجموعه‌ های داده‌ ای به‌ کار رفته برای آموزش این سیستم‌ ها بسیار وسیع هستن. برای مثال دیتاست Open Images گوگل دارای تقریبا ۹ میلیون تصویر هست یا YouTube-8M منبعی از ویدئو های برچسب‌ دار هست که به هفت میلیون ویدئوی برچسب‌ دار متصل هستن و ImageNet هم یکی از پایگاه داده‌ های از این نوع با ۱۴ میلیون تصویر دسته‌ بندی شده هست.

یادگیری بدون نظارت

در مقابل، الگوریتم‌های یادگیری بدون نظارت با شناسایی الگوهای داده‌ ای تلاش میکنن شباهت‌ هایی رم بین آنها پیدا کنن. نمونه‌ ای از این روش سیستم دسته‌ بندی Airbnb یا Google News هست که امکان گروه‌ بندی استوری‌ هایی با موضوع مشابه رو فراهم میکنه. الگوریتم‌ های یادگیری بدون نظارت برای جداسازی انواع مشخصی از داده‌ ها طراحی نشدن بلکه صرفا به‌ دنبال داده‌ هایی دارای شباهت هستن.

یادگیری نیمه‌ نظارت‌ شده

اهمیت مجموعه‌ های بزرگ داده‌ های برچسب‌ داری برای آموزش یادگیری ماشین به مرور زمان به دلیل ظهور یادگیری نیمه‌ نظارت‌ شده کاهش می یابد. همانطور که از نام یادگیری نیمه‌ن ظارت‌شده پیداست این روش ترکیبی از یادگیری نظارت‌ شده و بدون نظارت هست.

یادگیری نیمه‌ نظارت‌ شده به مجموعه‌ی اندکی از داده‌ های برچسب‌ دار و مجموعه‌ی بزرگی از داده‌ های بدون برچسب برای آموزش سیستم‌ ها وابسته هست. از داده‌ های برچسب‌ دار برای آموزش جزئی مدل یادگیری ماشین استفاده میشه سپس از این مدل برای برچسب‌ گذاری داده‌ های بدون برچسب استفاده میشه به این فرایند شبه برچسب‌ گذاری میگن. سپس مدل بر اساس ترکیب حاصل از داده‌ های شبه برچسب‌ دار و داده‌ های برچسب‌ دار آموزش داده میشه.


تو این آموزش سعی کردم به صورت خیلی خلاصه درباره ماشین لرنینگ برای شما بگم. اگه سوالی در این رابطه دارین کامنت کنین.

دیگه چه خبر ؟
عضویت
هشدار از طریق:
guest

0 نظر
Inline Feedbacks
View all comments