মেশিন লার্নিং, ভিজ্যুয়ালাইজড

লিনিয়ার রিগ্রেশন থেকে নিউরাল নেটওয়ার্ক — ইন্টারেক্টিভ উদাহরণ সহ এমএল শিখুন।

মূল ধারণা

মেশিন লার্নিং (Machine Learning) কী?

কম্পিউটারকে গতানুগতিক বা নির্দিষ্ট কোনো নিয়ম শেখানোর বদলে বিভিন্ন উদাহরণের সাহায্যে শেখানো

মেশিন লার্নিং (Machine Learning)-এর ধরনগুলো

তিনটি ক্লাসরুম ও তিনটি শেখার ধরন — সুপারভাইজড (supervised), আনসুপারভাইজড (unsupervised) এবং রিইনফোর্সমেন্ট (reinforcement)

ফ্রিচার এবং লেবেল (Features & Labels)

রান্নার আইটেমগুলো হলো ফিচার আর খাবারের নামটি হলো লেবেল — আপনার মডেলকে শেখান যে তার কোন কোন উপাদানের দিকে নজর দিতে হবে এবং এর ওপর ভিত্তি করে কী অনুমান করতে হবে

ট্রেইন-টেস্ট স্প্লিট (Train-Test Split)

বাসার কাজ বা হোমওয়ার্ক দিয়ে প্র্যাকটিস করানো এবং নতুন প্রশ্ন দিয়ে পরীক্ষা নেওয়া — এ কারণেই আপনার ডেটাকে আলাদা করা বা স্প্লিট (split) করা খুবই জরুরি

ওভারফিটিং এবং আন্ডারফিটিং (Overfitting & Underfitting)

গোল্ডিলকস এবং তিনটি মডেল — একটি খুব সাধারণ, একটি অনেক জটিল, আর অন্যটি একদম পারফেক্ট

কোর অ্যালগরিদম

লিনিয়ার রিগ্রেশন (Linear Regression)

আপনার ডেটাগুলোর মাঝখান দিয়ে সবচেয়ে ভালো বা পারফেক্ট একটি সোজা লাইন টানুন

লজিস্টিক রিগ্রেশন (Logistic Regression)

হ্যাঁ নাকি না? এমন একটি লাইন টানুন যা এদের দুজনকে আলাদা করতে পারে

কে-নিয়ারেস্ট নেইবোরস বা প্রতিবেশীরা (K-Nearest Neighbours - KNN)

আপনার সবচেয়ে কাছের প্রতিবেশীদের জিজ্ঞাসা করুন এবং সংখ্যাগরিষ্ঠ বা মেজরিটির (majority) সাথে একমত হোন

ডিসিশন ট্রি (Decision Trees)

একটি ফ্লোচার্ট (flowchart) যা বুঝতে পারে যে ঠিক কোন প্রশ্নগুলো করা উচিত

রেন্ডম ফরেস্ট (Random Forests)

একসাথে অনেকগুলো গাছের বা ট্রিয়ের (trees) ভোট — উইজডম অফ দ্য ক্রাউড (wisdom of the crowd)

নিউরাল নেটওয়ার্ক

পারসেপ্ট্রন (Perceptron)

একটিমাত্র নিউরন — গুণ করা, যোগ করা আর সিদ্ধান্ত নেওয়া

নিউরাল নেটওয়ার্ক বেসিকস (Neural Network Basics)

লজিকের মতো নিউরনগুলো একে অপরের সাথে স্তরে স্তরে যুক্ত থাকে

ব্যাকপ্রোপাগেশন (Backpropagation)

এরর বা ভুলগুলো পেছনের দিকে প্রবাহিত হয় যাতে নেটওয়ার্কটি শিখতে পারে

অ্যাক্টিভেশন ফাংশন (Activation Functions)

ReLU, সিগময়েড (sigmoid), ট্যানএইচ (tanh) — অর্থাৎ নিউরনগুলোর অন/অফ (on/off) সুইচ

গ্রেডিয়েন্ট ডিসেন্ট (Gradient Descent)

সবচেয়ে নিচু পয়েন্ট বা বিন্দুটি খুঁজে পেতে পাহাড়ের ঢাল বেয়ে নিচে নামুন

প্রায়োগিক এমএল

বায়াস বনাম ভ্যারিয়েন্স (Bias vs Variance)

খুব সাধারণ নাকি বেশি অগোছালো — এর মাঝামাঝি একটি পারফেক্ট জায়গা (sweet spot) খুঁজে বের করুন

ক্রস-ভ্যালিডেশন (Cross-Validation)

প্রতিটি ফোল্ডে (fold) টেস্ট করুন, যাতে কোনো ডেটাই নষ্ট না হয়

কনফিউশন ম্যাট্রিক্স (Confusion Matrix)

ট্রু পজিটিভস (True positives), ফলস অ্যালার্ম (false alarms) — অর্থাৎ যে বিষয়গুলো মাপা সবচেয়ে বেশি জরুরি

ফিচার ইঞ্জিনিয়ারিং (Feature Engineering)

কাঁচা বা র (raw) ডেটাকে পরিবর্তন করে এমন ইনপুটে পরিণত করা যা কোনো মডেল আসলেই ব্যবহার করতে পারে

রেগুলারাইজেশন (Regularization)

মডেলটি যাতে সৎ থাকে সেজন্য এর কমপ্লেক্সিটিতে (complexity) পেনাল্টি (penalty) দেওয়া

আনসুপারভাইজড লার্নিং

কে-মিনস ক্লাস্টারিং (K-Means Clustering)

সেন্ট্রয়েডগুলোকে (centroids) একটু কাছে সরিয়ে এনে সাধারণ বা ন্যাচারাল (natural) গ্রুপগুলো খুঁজে বের করুন

পিসিএ (Principal Component Analysis - PCA)

১০০টি ফিচারকে (features) স্কোয়াশ (Squash) করে বা ছেঁটে নিয়ে শুধুমাত্র সবচেয়ে বেশি দরকারীগুলোকেই রাখা

মডেল ডিপ্লয়মেন্ট

এমএল পাইপলাইন (ML Pipeline)

র বা কাঁচা ডেটা (raw data) থেকে শুরু করে একেবারে প্রোডাকশনে (production) কাজের প্রেডিকশন (predictions) পর্যন্ত

মডেল ইভ্যালুয়েশন বা মূল্যায়ন (Model Evaluation)

অ্যাকুরেসি বা নির্ভুলতাই সবকিছু নয় — আসুন আরও ভালোভাবে আরওসি (ROC), এইউসি (AUC), এফ১ (F1) সম্পর্কে জেনে নিই

নৈতিকতা ও ন্যায্যতা

মেশিন লার্নিং ফেয়ারনেস (ML Fairness)

বায়াসড (Biased) বা পক্ষপাতমূলক ইনপুট দিলে, এর প্রেডিকশন বা আউটপুটও বায়াসড (biased) আসবে