ন্যারো এআই বনাম জেনারেল এআই (Narrow AI vs General AI)
অসাধারণ সব স্পেশালিস্ট (The Brilliant Specialist)
কল্পনা করুন এমন একজন ডাক্তারের কথা, যিনি হার্ট ট্রান্সপ্লান্ট বা হৃৎপিণ্ড প্রতিস্থাপনের দিক থেকে পৃথিবীর সেরা। তার ধারেকাছেও কেউ নেই। কিন্তু ধরুন, আপনি তাকে আপনার বেসিনের লিকের (leak) সমস্যা ঠিক করতে বললেন! তখন অবস্থাটা কেমন হবে? তিনি সম্ভবত রেঞ্চটির দিকে এমনভাবে তাকিয়ে থাকবেন যেন সেটি ভিনগ্রহের কোনো বস্তু।
এবার একজন সাধারণ মানুষের কথা ভাবুন। তারা রাতের খাবার রাঁধতে পারে, গাড়ি চালাতে পারে, ইমেইল লিখতে পারে, একটি ছোট্ট কান্নারত শিশুকে সামলাতে পারে, গিটার বাজানো শিখতে পারে, আবার সেই বেসিনের লিকও ঠিক করতে পারে — হয়তো কোনোটাই তারা খুব দারুণভাবে পারে না, কিন্তু কাজ চালানোর মতো ঠিকই পারে। এদেরকেই বলা হয় জেনারেলিস্ট (generalist)।
আর ঠিক এটিই হলো ন্যারো এআই (Narrow AI) (যাকে Weak AI বা ANI-ও বলা হয়) এবং জেনারেল এআই (General AI) (যাকে Strong AI বা AGI-ও বলা হয়)-এর মধ্যকার মূল পার্থক্য।
- ন্যারো এআই (Narrow AI) — এটি কেবল একটি নির্দিষ্ট কাজে অসম্ভব দক্ষ বা ভালো। কিন্তু এর বাইরে সে আর কিছুই করতে পারে না।
- জেনারেল এআই (General AI) — মানুষের বুদ্ধিতে কুলায় এমন যেকোনো কাজই সে সামলাতে পারে। তবে বাস্তবে এটি আজও তৈরি হয়নি।
আপনি এ যাবৎকালে যত ধরনের এআই সিস্টেম ব্যবহার করেছেন — সেটা সিরি (Siri), গুগল সার্চ (Google Search), নেটফ্লিক্স রেকমেন্ডেশন, চ্যাটজিপিটি (ChatGPT), ফেসিয়াল রিকগনিশন (facial recognition) বা স্প্যাম ফিল্টার যাই হোক না কেন — এর সবই হলো ন্যারো এআই। এদের প্রত্যেকেই ওই সার্জন বা ডাক্তারের মতো বিশেষজ্ঞ। তারা তাদের নিজস্ব কাজটিতে দুর্দান্ত, কিন্তু এর বাইরের সব বিষয়ে একেবারেই অজ্ঞ।
ন্যারো এআই (Narrow AI): যে জগতে আমাদের বাস
ন্যারো এআই এখন সব জায়গায় ছড়িয়ে আছে, আর নিজের নির্দিষ্ট গণ্ডিতে সে অবিশ্বাস্য রকমের শক্তিশালী। নিচে এর বাস্তব জীবনের কিছু উদাহরণ দেওয়া হলো:
- দাবা ইঞ্জিন (স্টকফিশ, আলফাজিরো) — এরা যেকোনো নামকরা মানব খেলোয়াড়কে পর্যুদস্ত করে দিতে পারে। কিন্তু আপনি যদি এদের জন্য আলাদা একটি সিস্টেম তৈরি না করেন, তবে এরা একটা সাধারণ টিক-ট্যাক-টো গেমও খেলতে পারবে না।
- সিরি / অ্যালেক্সা (Siri / Alexa) — এরা চমৎকারভাবে আপনার মুখের কথা বুঝতে পারে এবং প্রশ্নের উত্তর দিতে পারে। কিন্তু এরা কখনোই একটি উপন্যাস লিখতে পারবে না।
- রেকমেন্ডেশন সিস্টেম (Netflix, Spotify, YouTube) — আপনি এরপর কী দেখতে বা শুনতে চাইবেন, তা এরা অদ্ভুত নিখুঁতভাবে ধরে ফেলতে পারে। কিন্তু একটি মুভি কেন আপনাকে কাঁদাল, সেটির কারণ এরা বলতে পারবে না।
- স্প্যাম ফিল্টার — এটি আপনার ইনবক্সে আসা ৯৯.৯% আবর্জনা ইমেইল আটকে দিতে পারে। কিন্তু আপনার প্রয়োজনীয় কোনো ইমেইলের একটি সুন্দর ও অর্থপূর্ণ রিপ্লাই (reply) এরা লিখতে পারবে না।
- সেলফ-ড্রাইভিং কার (Self-driving cars) — এরা খুব সাবলীলভাবে রাস্তা চেনে, বাধা এড়িয়ে চলে এবং ট্রাফিক নিয়ম মেনে গাড়ি চালায়। কিন্তু আপনি ছুটিতে কোথায় বেড়াতে যাবেন, সেই সিদ্ধান্তটি এরা আপনাকে দিতে পারবে না।
আপনি কি এই প্যাটার্নটি খেয়াল করেছেন? এদের প্রত্যেকেই হলো সিঙ্গেল-ডোমেইন চ্যাম্পিয়ন (single-domain champion)। অর্থাৎ তাদেরকে যে কাজ শেখানো হয়েছে, তার ঠিক বাইরের কোনো কাজ করতে দিলেই এরা পুরোপুরি অকেজো হয়ে পড়ে।
ন্যারো এআই কেন এত মূল্যবান?
"ন্যারো (Narrow)" শব্দটি শুনে এদের ক্ষমতাকে ছোট করে বা সীমিত করে দেখার কিছু নেই। ন্যারো এআই সিস্টেমগুলো ইতিমধ্যে বড় বড় ইন্ডাস্ট্রিকে পুরোপুরি বদলে দিচ্ছে:
- স্বাস্থ্যসেবা (Healthcare) — এআই অনেক অভিজ্ঞ ডাক্তারের চেয়েও দ্রুত এবং নিখুঁতভাবে বিভিন্ন মেডিকেল স্ক্যান বা রিপোর্ট পড়তে পারে।
- ফাইন্যান্স (Finance) — অ্যালগরিদমিক ট্রেডিং (algorithmic trading), জালিয়াতি শনাক্তকরণ বা ফ্রড ডিটেকশন (fraud detection) এবং ক্রেডিট স্কোরিং-এর ক্ষেত্রে এআই-এর ভূমিকা অপরিসীম।
- যোগাযোগ ও পরিবহন (Transportation) — ম্যাপে সবচেয়ে ভালো রাস্তা ঠিক করা, একা একা চলতে পারা যানবাহন (autonomous vehicles) এবং ট্রাফিকের অবস্থা অনুমান করার ক্ষেত্রে এআই ব্যবহৃত হচ্ছে।
- বিনোদন (Entertainment) — মানুষের পছন্দ অনুযায়ী কন্টেন্ট সামনে আনা, গেমে এআই-এর ব্যবহার, এমনকি স্বয়ংক্রিয়ভাবে নতুন মিউজিক তৈরির বেলাতেও।
সুতরাং, কোনো কিছুর ক্ষমতা ন্যারো (Narrow) বা সরু হওয়া মানেই তা দুর্বল (weak) নয়। বরং বোঝানো হয় সেটি তার কাজে ফোকাসড (focused) বা ভীষণ মনোযোগী।
জেনারেল এআই (General AI): এক অধরা স্বপ্ন
এজিআই (AGI) বা আর্টিফিসিয়াল জেনারেল ইন্টেলিজেন্স হলো এমন একটি মেশিনের ধারণা বা স্বপ্ন, যা মানুষের বুদ্ধির পর্যায়ে থাকা যেকোনো কাজ করতে সক্ষম। এটি নিজে নিজেই নতুন দক্ষতা শিখতে পারবে বা এক পেশার জ্ঞানকে অন্য পেশায় অনায়াসেই কাজে লাগাতে পারবে। এমনকি এটি কোনো প্রসঙ্গের সূক্ষ্ম অর্থ, হিউমার (humor) বা কৌতুক এবং মানুষের আবেগও খুব ভালোভাবে বুঝতে পারবে।
একটু ভেবে দেখুন, মানুষ হিসেবে আপনি নিজে কী কী করতে পারেন। আপনি একটি ইউটিউব ভিডিও দেখে কীভাবে রান্না করতে হয় তা শিখে নিতে পারেন। আবার একটু পরেই হয়তো আপনি রান্নাঘর থেকে ফিরে এসে একটি এসে (essay) বা প্রবন্ধ লিখতে পারেন, কোডের ভুল খুঁজতে পারেন, এমনকি মন খারাপ থাকা বন্ধুর সাথে বসে অনেকটা সময় গল্পও করতে পারেন — আর এই সবকিছুই আপনি হয়তো একেকটি মাত্র বিকেলেই করে ফেলতে পারেন! আপনাকে চাইলে সম্পূর্ণ নতুন কোনো স্কিল বা দক্ষতাও (যেমন, মাটি দিয়ে কীভাবে হাঁড়ি পাতিল বানায়) শেখানো সম্ভব, আর এর জন্য আপনাকে নতুন করে আপনার মগজটিকে রিসেট করে শুরু থেকে সব শিখতে হবে না।
এটাই হলো হিউম্যান ইন্টেলিজেন্স বা মানুষের সেই বহুমুখী ও পরিবর্তনশীল হওয়ার ক্ষমতা, যা একে সাধারণ বা জেনারেল (general) করে তোলে। আর ঠিক এই কারণেই একটি সত্যিকারের এজিআই (AGI) তৈরি করা এতটা কঠিন একটি ব্যাপার!
এজিআই (AGI) তৈরি করা এত কঠিন কেন?
এজিআই তৈরির পথে সবচেয়ে বড় বাধাগুলো হলো:
- ট্রান্সফার লার্নিং (Transfer learning) — বর্তমানের এআই সিস্টেমগুলো এক ফিল্ড বা ডোমেইন থেকে শেখা জ্ঞান খুব সহজেই অন্য আরেকটি ডোমেইনে কাজে লাগাতে পারে না। যেমন, দাবা খেলতে পারা একটি সেরা এআই রান্না করা সম্পর্কে বিন্দুবিসর্গও জানে না, যদিও দুটি কাজের জন্যই কৌশল এবং পরিকল্পনার প্রয়োজন হয়।
- কমন সেন্স (Common sense) — মানুষ জন্মগতভাবেই এই বিশ্বজগৎ কীভাবে কাজ করে সে সম্পর্কে একটি সহজাত সাধারণ জ্ঞান বা কমন সেন্স নিয়ে জন্মায়। যেমন: "পানি ভেজা হয়।", "হাত থেকে কাঁচের গ্লাস পড়ে গেলে তা ভেঙে যায়।" এআই-কে এই প্রতিটি ছোট ছোট তথ্যই হয় একে একে শেখাতে হয় বা এমন অগণিত ডেটা খাইয়ে ট্রেন করাতে হয়।
- অ্যাবস্ট্রাকশন (Abstraction) — মানুষ মাত্র কয়েকটি উদাহরণ দেখেই যেকোনো জিনিসের পেছনের আসল আইডিয়া বা ধরনটা শিখে নিতে পারে, যাকে সাধারণীকরণ বা জেনারেলাইজেশন (generalization) বলা হয়। যেমন, একটি ছোট বাচ্চাকে তিনটি ভিন্ন জাতের কুকুর দেখালে সে অনায়াসেই অন্য যেকোনো জাতেরই কুকুর চিনতে পারবে। কিন্তু এই একই কাজ করতে একটি এআই-কে লাখ লাখ কুকুরের ছবি দেখাতে হয়!
- সচেতনতা এবং উপলব্ধি (Consciousness and understanding) — এআই কি সত্যিই বোঝে সে আসলে কী করছে? নাকি এটি কেবল তার ভেতরে থাকা সূক্ষ্ম কিছু নিয়ম মেনে প্যাটার্ন মেলায়? এই প্রশ্নের উত্তর আজও বিজ্ঞানীদের কাছে একটি গভীর দার্শনিক প্রশ্ন হয়েই আছে।
ন্যারো এআই ইন অ্যাকশন: একটি সেন্টিমেন্ট ক্লাসিফায়ার
সবকিছু সাদা-কালো হয় না (The Spectrum, Not a Switch)
আমরা হয়তো অনেক সময়ই ন্যারো এবং জেনারেল এআই-কে স্রেফ একটি বাইনারি সুইচ হিসেবে ভাবতে শুরু করি — অর্থাৎ একটি মেশিন হয় ন্যারো, নয়তো সেটি জেনারেল এআই। কিন্তু বাস্তবতা হলো এটি আসলে একটি স্পেকট্রাম (spectrum) বা নিরবচ্ছিন্ন বর্ণালীর মতো।
বর্তমানে জিপিটি-৪ (GPT-4) এবং ক্লড (Claude)-এর মতো আধুনিক সব লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) এই দুইয়ের মধ্যকার সীমানাকে অনেকটা ঝাপসা করে দিয়েছে। তারা কোড লিখতে পারে, কবিতা লিখতে পারে, বড় কোনো রিসার্চ পেপারের সারাংশ তৈরি করতে পারে, ছাত্রদের অঙ্ক শেখাতে পারে এবং মানুষের সাথে সম্পূর্ণ ন্যাচারাল বা প্রাকৃতিক ভাষায় সাবলীলভাবে কথোপকথন চালাতে পারে। তাহলে এরা কি এজিআই (AGI)? বেশিরভাগ গবেষকের মতে, না — এরা এখনো নতুন কোনো পরিস্থিতিতে ভেবেচিন্তে যুক্তি দাঁড় করাতে (novel reasoning) রীতিমতো হিমশিম খায়, একটি ছোট বাচ্চার মতো মাত্র একটি উদাহরণ থেকে এরা শিখতে পারে না, এবং এরা সত্যিই কোনো কিছুর অন্তর্নিহিত অর্থ "বোঝে" না।
কিন্তু এরপরও তারা যেকোনো দাবা খেলার ইঞ্জিন বা একটি সাধারণ স্প্যাম ফিল্টারের চেয়ে যে অনেক বেশি জেনারেল, তা নিয়ে কোনো সন্দেহ নেই। অর্থাৎ আমরা ধীরে ধীরে স্পেকট্রাম ধরে এগোচ্ছি, এবং বিষয়টি নিঃসন্দেহে রোমাঞ্চকর।
সত্যিকারের বা সৎ উত্তরটি হলো: আমরা জানি না কবে (বা আদতেই কি না) আমরা একটি সত্যিকার এজিআই (AGI) তৈরি করতে পারব। এর সময়কাল কারও মতে আগামী ১০ বছর, আবার কারও মতে এটি কখনোই সম্ভব নয়। তবে আমরা এটুকু অন্তত নিশ্চিতভাবেই জানি যে, ন্যারো এআই ইতিমধ্যেই পৃথিবীকে অভূতপূর্ব সব উপায়ে পাল্টে দিচ্ছে — এবং একে সব দিক থেকে গভীরভাবে বোঝার চেষ্টা করাটা অবশ্যই আমাদের সময়ের অন্যতম গুরুত্বপূর্ণ একটি কাজ।