এআই (AI) বনাম এমএল (ML) বনাম ডিপ লার্নিং (Deep Learning)
বুদ্ধিমত্তার রাশিয়ান পুতুল (Matryoshka)
আপনি নিশ্চয়ই আর্টিফিশিয়াল ইন্টেলিজেন্স (Artificial Intelligence), মেশিন লার্নিং (Machine Learning), আর ডিপ লার্নিং (Deep Learning) শব্দগুলো অনেকবার শুনেছেন। অনেকেই এই তিনটা শব্দ ঘুরিয়ে-ফিরিয়ে একই অর্থে ব্যবহার করেন। আর এতে কম্পিউটার সায়েন্টিস্টদের প্রচণ্ড রাগ হয় — কারণ এই তিনটা মোটেও একই জিনিস নয়!
ব্যাপারটাকে রাশিয়ান নেস্ট্রিং ডল বা ম্যাট্রিয়শকা পুতুলের মতো ভাবতে পারেন। সবচেয়ে বড় পুতুলটা হলো এআই (AI)। সেটার ভেতর থেকে বের হবে মেশিন লার্নিং (ML) পুতুলটি। আর এই এমএল পুতুল খুললে ভেতরের যে পুঁচকে পুতুলটি বের হবে, সেটাই হলো ডিপ লার্নিং (DL)।
- এআই (সবচেয়ে বড় পুতুল) — এমন যেকোনো প্রযুক্তি, যা মেশিনকে মানুষের মতো বুদ্ধিমান আচরণ করতে সাহায্য করে। পুরো বিষয়টাই এর ভেতরে পড়ে।
- এমএল (মাঝামাঝি সাইজের পুতুল) — এটি এআইয়ের একটি সাবসেট বা অংশ, যেখানে মেশিনকে ধরে ধরে প্রতিটি কাজ করার নির্দেশ না দিয়ে, ডেটার মাধ্যমে শিখিয়ে নেওয়া হয়।
- ডিল বা DL (সবচেয়ে ছোট পুতুল) — এটি আবার এমএলের একটি সাবসেট, যা অনেকগুলো লেয়ার বা স্তরের নিউরাল নেটওয়ার্ক ব্যবহার করে জটিল থেকে জটিলতর সব প্যাটার্ন শিখে নিতে পারে।
প্রতিটি ডিপ লার্নিং সিস্টেমই হলো মেশিন লার্নিং। আবার প্রতিটি মেশিন লার্নিং সিস্টেমই হলো এআই। কিন্তু সব এআই সিস্টেমই মেশিন লার্নিং নয়, ঠিক তেমনি সব এমএল সিস্টেমও ডিপ লার্নিং নয়।
একটু গোলমেলে লাগছে কি? চলুন, পুতুলগুলো এক এক করে খুলে দেখা যাক।
সবচেয়ে বড় পুতুল: আর্টিফিশিয়াল ইন্টেলিজেন্স (AI)
এআই হলো সবচেয়ে বড় আর সাধারণ বা ব্রড একটা টার্ম। এর সহজ অর্থ: যে সিস্টেমগুলো মানুষের মতো বুদ্ধির প্রয়োজন হয় এমন সব কাজ করতে পারে। ব্যস, এটুকুই। এটা কীভাবে কাজ করে তা বলা হয় না এখানে।
শুরুর দিককার এআই সিস্টেমগুলো ডেটা থেকে কিছুই শিখতে পারত না। তারা মানুষের লিখে দেওয়া নির্দিষ্ট কিছু নিয়ম বা রুল (Rules) মেনে চলত:
- এক্সপার্ট সিস্টেম বা Expert systems (১৯৮০-এর দশক) — হাজার হাজার 'যদি-তাহলে' (if-then) নিয়ম, যা মানুষ নিজের হাতে লিখে দিয়েছিল। যেমন: "যদি রোগীর জ্বর থাকে, আর সাথে কাশি এবং গলাব্যথা থাকে, তবে তাকে ফ্লু টেস্ট করার পরামর্শ দেওয়া হোক।" এখানে শেখার কোনো সুযোগ নেই — পুরোটাই মানুষের হাতে বানানো বিশাল একটা ডিসিশন ট্রি মাত্র।
- গেম এআই বা Game AI (ক্লাসিক গেমগুলোতে) — প্যাক-ম্যান গেমের ভূতগুলো কিছু সাধারণ নিয়ম মেনে চলে: খেলোয়াড়কে তাড়া করো, আবার লুকিয়ে পড়ো, আবার তাড়া করো। এটাও এআই! কিন্তু এদের মধ্যে ডেটা থেকে নিজে নিজে শেখার কোনো ক্ষমতা নেই।
- রুল-বেসড চ্যাটবট বা Rule-based chatbots — ১৯৬৬ সালের এলিজা (ELIZA) নামের চ্যাটবটটি কিওয়ার্ড মিলিয়ে মানুষের সাথে আড্ডা দিতে পারত। কেউ "আমার মন খারাপ" বললে সে উত্তর দিত "কেন মন খারাপ?" ব্যাপারটা খুব দারুণ হলেও, তার কোনো সত্যিকারের বুদ্ধি বা উপলব্ধি ছিল না।
এর সবই এআইয়ের কাতারে পড়ে — তবে এর কোনোটাই মেশিন লার্নিং নয়। এরা সবাই মানুষের তৈরি করা বা প্রোগ্রাম করা (Programmed), এদের কাউকে ডেটা দিয়ে ট্রেইন করানো (Trained) হয়নি।
মেশিন লার্নিং ছাড়াই এআই: একটি রুল-বেসড বা নিয়ম-ভিত্তিক সিস্টেম
মাঝামাঝি সাইজের পুতুল: মেশিন লার্নিং (ML)
এটাই হলো সেই বিশাল পরিবর্তনটার শুরু: আমরা যদি নিজে থেকে একগাদা নিয়ম না লিখে, ডেটার মাধ্যমে সরাসরি মেশিনকে শিখিয়ে নিই, তাহলে কেমন হয়?
এটাই হলো মেশিন লার্নিং। প্রোগ্রামারকে আর বলতে হয় না যে, "যদি ইমেইলে 'free money' লেখা থাকে তবে তাকে স্প্যামের তালিকায় ফেলো"। বরং, আমরা মেশিনকে স্প্যাম ও আসল ইমেইলের হাজার হাজার উদাহরণ দেখতে দিই, আর সে নিজেই সেখান থেকে প্যাটার্নগুলো শিখে নেয়।
মেশিন লার্নিংয়ের মূল উপাদানগুলো হলো:
- ডেটা (Data) — প্রচুর ডেটা লাগে। যত বেশি, তত ভালো।
- অ্যালগরিদম (Algorithm) — ডেটার মধ্যে প্যাটার্ন খুঁজে পাওয়ার গাণিতিক পদ্ধতি (যেমন: ডিসিশন ট্রি, লিনিয়ার রিগ্রেশন, এসভিএম ইত্যাদি)।
- ট্রেনিং (Training) — অ্যালগরিদমকে ডেটা খাইয়ে তাকে শেখানোর পদ্ধতি।
- মডেল (Model) — সব শেষের ফল। একটি ট্রেইন করানো সিস্টেম, যা নতুন ডেটা পেলে তার ওপর ভিত্তি করে ভবিষ্যদ্বাণী করতে বা ডিসিশন নিতে পারে।
মেশিন লার্নিং মূলত তিন ধরনের হয়ে থাকে:
- সুপারভাইজড লার্নিং (Supervised learning) — আমরা মেশিনকে আগে থেকেই লেবেল বা ট্যাগ করা উদাহরণ দিই। "এই যে দেখো একটা বিড়ালের ছবি (যেটাকে 'বিড়াল' হিসেবে লেবেল লাগানো আছে)। আর এটা একটা কুকুরের ছবি (যেটা 'কুকুর' হিসেবে লেবেল করা)। এবার তুমি এই নতুন ছবিটা দেখে বলো তো এটা কী?" মেশিন আমাদের দেওয়া সঠিক উত্তরগুলো দেখে দেখে শিখে নেয়।
- আনসুপারভাইজড লার্নিং (Unsupervised learning) — এর কোনো নির্দিষ্ট লেবেল থাকে না। "এই নাও ১০,০০০ গ্রাহকের ডেটা। তুমি নিজেই এর ভেতর থেকে কোনো মিল খুঁজে পাও কি না দেখো, এবং একই ধরনের গ্রাহকদের আলাদা আলাদা গ্রুপে সাজাও।" মেশিন এক্ষেত্রে নিজে নিজেই খুঁজে বের করে যে এর ভেতর কী প্যাটার্ন লুকিয়ে আছে।
- রিইনফোর্সমেন্ট লার্নিং (Reinforcement learning) — মেশিন ভুল করতে করতে নিজে নিজেই শেখে। ভালো কাজ করলে তাকে পুরস্কার দেওয়া হয় আর খারাপ কাজ করলে শাস্তি বা পেনাল্টি দেওয়া হয়। কুকুরের দারুণ কিছু করলে যেমন পুরস্কার হিসেবে বিস্কুট খেতে দিই, ব্যাপারটা অনেকটা সেরকম!
মেশিন লার্নিং: ডেটা থেকে নিজে নিজে শেখা
সবচেয়ে ছোট পুতুল: ডিপ লার্নিং (DL)
ডিপ লার্নিং হলো মেশিন লার্নিংয়ের এক দানবীয় রূপ। এটি মূলত আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক ব্যবহার করে তৈরি করা হয় — যার আইডিয়া নেওয়া হয়েছে মানুষের মস্তিষ্কের গঠন থেকে। এর ভেতরে অনেকগুলো লেয়ার বা স্তর থাকে (আর এ জন্যই এটাকে "ডিপ বা গভীর" বলা হয়)।
এই গভীরতার মানে কী? এখানকার প্রতিটা লেয়ার মূলত আগের চেয়ে আরও বেশি জটিল প্যাটার্ন শিখতে পারে:
- লেয়ার ১ — ছবির ভেতরে থাকা দাগ (edges) ও সাধারণ আকৃতি বা শেপ বের করে।
- লেয়ার ২ — এর আগের লেয়ারের ওই দাগগুলো মিলিয়ে বিভিন্ন টেক্সচার এবং পার্ট বা অংশ তৈরি করে ("এটা দেখতে অনেকটা পশমের মতো লাগছে")।
- লেয়ার ৩ — এবার এই ছোট ছোট অংশগুলো জোড়া লাগিয়ে বড় বস্তুর ধারণা তৈরি করে ("এটা তো একটা কানের মতো মনে হচ্ছে")।
- লেয়ার ১০+ — এটা এবার পুরো বস্তুটি কী, তা বুঝতে পারে ("আরে, এটা তো একটা গোল্ডেন রিট্রিভার কুকুর!")।
সম্প্রতি এআইয়ের যেসব অভাবনীয় উন্নতির কথা আপনি শুনেছেন, তার প্রায় সবগুলোর পেছনেই আছে এই ডিপ লার্নিং:
- ইমেজ রিকগনিশন (Image recognition) — কনভোলিউশনাল নিউরাল নেটওয়ার্ক (CNNs)
- ল্যাঙ্গুয়েজ আন্ডারস্ট্যান্ডিং (Language understanding) বা মানুষের ভাষা বোঝা — ট্রান্সফরমার বা Transformers (GPT, BERT, Claude)
- গেম খেলা (Game playing) — আলফাগো বা AlphaGo, আলফাজিরো বা AlphaZero
- আর্ট ও মিউজিক তৈরি (Art and music generation) — ডিফিউশন বা Diffusion মডেল, জিএএন বা GANs
- কথা শুনে বোঝা (Speech recognition) — হুইসপার (Whisper), নানা ব্রান্ডের ভয়েস অ্যাসিস্ট্যান্ট
এর একটা বড় সমস্যাও আছে। আর তা হলো, ডিপ লার্নিংয়ের ক্ষুধা অনেক বেশি। কাজ করার জন্য এর বিপুল পরিমাণ ডেটা আর প্রচুর কম্পিউটিং পাওয়ারের প্রয়োজন হয়। একটি বড় ল্যাঙ্গুয়েজ মডেল (Large Language Model) ট্রেন করাতে জিপিইউয়ের (GPU) পেছনে কয়েক মিলিয়ন বা কোটি ডলার পর্যন্ত খরচ হতে পারে। এ জন্যই, যখন আমাদের হাতে সুপারফাস্ট জিপিইউ, ইন্টারনেট থেকে পাওয়া বিশাল ডেটাসেট এবং আরও কিছু আধুনিক অপটিমাইজেশন প্রযুক্তি এল, ঠিক তখনই ডিপ লার্নিংটা এতটা জনপ্রিয় হয়ে উঠল।
ডিপ লার্নিংয়ের প্রাথমিক ধারণা: একটি ছোট্ট নিউরাল নেটওয়ার্ক
Key Metrics
এবার পুরো জিনিসটা একসাথে দেখা যাক
চলুন ইমেইলের একটা উদাহরণ দিয়ে আমাদের রাশিয়ান পুতুলের ব্যাপারটা আরেকবার বুঝে নিই:
- এআই সিস্টেম (এমএল ছাড়া): একজন প্রোগ্রামার ৫০০টা নিয়ম লিখে দিলেন। "যদি বিষয়ের জায়গায় 'FREE' লেখা থাকে, তবে সেটাকে স্প্যাম ফোল্ডারে পাঠিয়ে দাও। আর যদি স্প্যামারের ইমেইল অ্যাড্রেস কন্ট্যাক্ট লিস্টে থাকে, তবে ইনবক্সেই রাখো।" সিস্টেমটা বেশ ভালোই কাজ করবে... কিন্তু স্প্যামাররা তো চালাকি করে নতুন নতুন ফাঁদ পাততে থাকবে, তখন আপনাকেই আবার বসে বসে আরও ৫০০টি নতুন নিয়ম লিখতে হবে।
- এমএল সিস্টেম (ML approach): আপনি সিস্টেমটিকে আগে থেকেই লেবেল বা ট্যাগ করা ১ লাখ ইমেইল খেতে দিলেন। সে ওই ডেটা থেকে শিখে নিল যে, ইমেইলে নির্দিষ্ট কিছু শব্দ, স্প্যামারের ইমেইল পাঠানোর ধরন, আর ভেতরের লেখার ফরম্যাট দেখলেই সে ধরে ফেলবে কোনটা স্প্যাম আর কোনটা নয়। যখন স্প্যামাররা তাদের চাল পালটাবে, আপনি শুধু আবার নতুন ডেটা দিয়ে তাকে ট্রেইন করিয়ে নিবেন।
- ডিপ লার্নিং সিস্টেম (DL approach): আপনি সিস্টেমটিকে লাখ লাখ ইমেইল দিলেন এবং একটা নিউরাল নেটওয়ার্ককে বললেন নিজে নিজেই সবকিছু বুঝে নিতে — ভেতরে কী লেখা আছে, কোন শব্দগুলো বেশি ব্যবহার হয়েছে, আর স্প্যামারের ধরন কেমন, সবই সে একা একা বুঝে নেবে। আমরা মানুষ হয়ে হয়তো যেসব ফিচারের কথা ভাবতেও পারতাম না, সে সেগুলোও খুঁজে বের করে শিখতে পারবে।
প্রতিটি ধাপই আগেরটার চেয়ে অনেক বেশি পাওয়ারফুল। তবে একই সাথে এদের জটিলতা, ডেটার ক্ষুধা আর এদের কাজ করার ধরন বোঝাও অনেকাংশে কঠিন হয়ে যায়। প্রতিটি কাজের জন্য সঠিক এবং সবচেয়ে উপযুক্ত লেভেলটি খুঁজে নেওয়াই হলো একজন এআই ইঞ্জিনিয়ারের সবচেয়ে বড় গুণ।
এবার যখন কেউ "মেশিন লার্নিং" বোঝাতে "এআই" শব্দটি ব্যবহার করবে, তখন কিন্তু আপনি ঠিকই এর পার্থক্যটা ধরতে পারবেন। আর যদি কেউ সাধারণ ইফ-এলস (if-else)-এর চ্যাটবটকে "ডিপ লার্নিং" বলে চালিয়ে দিতে চায়, তাকেও আপনি খুব সুন্দর করে তাদের পার্থক্যটা বুঝিয়ে বলতে পারবেন।
ছোট কুইজ
পড়া চালিয়ে যান