What is AI?পড়তে ৯ মিনিট লাগবে

ন্যারো এআই বনাম জেনারেল এআই (Narrow AI vs General AI)

দাবা খেলার গ্র্যান্ডমাস্টার যিনি এক টুকরো টোস্টও বানাতে পারেন না — সংক্ষেপে এটিই হলো ন্যারো এআই

scope:ফাউন্ডেশনাল (প্রাথমিক ধারণা)difficulty:বিগিনার (Beginner)

অসাধারণ সব স্পেশালিস্ট (The Brilliant Specialist)

কল্পনা করুন এমন একজন ডাক্তারের কথা, যিনি হার্ট ট্রান্সপ্লান্ট বা হৃৎপিণ্ড প্রতিস্থাপনের দিক থেকে পৃথিবীর সেরা। তার ধারেকাছেও কেউ নেই। কিন্তু ধরুন, আপনি তাকে আপনার বেসিনের লিকের (leak) সমস্যা ঠিক করতে বললেন! তখন অবস্থাটা কেমন হবে? তিনি সম্ভবত রেঞ্চটির দিকে এমনভাবে তাকিয়ে থাকবেন যেন সেটি ভিনগ্রহের কোনো বস্তু।

এবার একজন সাধারণ মানুষের কথা ভাবুন। তারা রাতের খাবার রাঁধতে পারে, গাড়ি চালাতে পারে, ইমেইল লিখতে পারে, একটি ছোট্ট কান্নারত শিশুকে সামলাতে পারে, গিটার বাজানো শিখতে পারে, আবার সেই বেসিনের লিকও ঠিক করতে পারে — হয়তো কোনোটাই তারা খুব দারুণভাবে পারে না, কিন্তু কাজ চালানোর মতো ঠিকই পারে। এদেরকেই বলা হয় জেনারেলিস্ট (generalist)।

আর ঠিক এটিই হলো ন্যারো এআই (Narrow AI) (যাকে Weak AI বা ANI-ও বলা হয়) এবং জেনারেল এআই (General AI) (যাকে Strong AI বা AGI-ও বলা হয়)-এর মধ্যকার মূল পার্থক্য।

ন্যারো এআই (Narrow AI) — এটি কেবল একটি নির্দিষ্ট কাজে অসম্ভব দক্ষ বা ভালো। কিন্তু এর বাইরে সে আর কিছুই করতে পারে না।
জেনারেল এআই (General AI) — মানুষের বুদ্ধিতে কুলায় এমন যেকোনো কাজই সে সামলাতে পারে। তবে বাস্তবে এটি আজও তৈরি হয়নি।

আপনি এ যাবৎকালে যত ধরনের এআই সিস্টেম ব্যবহার করেছেন — সেটা সিরি (Siri), গুগল সার্চ (Google Search), নেটফ্লিক্স রেকমেন্ডেশন, চ্যাটজিপিটি (ChatGPT), ফেসিয়াল রিকগনিশন (facial recognition) বা স্প্যাম ফিল্টার যাই হোক না কেন — এর সবই হলো ন্যারো এআই। এদের প্রত্যেকেই ওই সার্জন বা ডাক্তারের মতো বিশেষজ্ঞ। তারা তাদের নিজস্ব কাজটিতে দুর্দান্ত, কিন্তু এর বাইরের সব বিষয়ে একেবারেই অজ্ঞ।

ন্যারো এআই (Narrow AI): যে জগতে আমাদের বাস

ন্যারো এআই এখন সব জায়গায় ছড়িয়ে আছে, আর নিজের নির্দিষ্ট গণ্ডিতে সে অবিশ্বাস্য রকমের শক্তিশালী। নিচে এর বাস্তব জীবনের কিছু উদাহরণ দেওয়া হলো:

দাবা ইঞ্জিন (স্টকফিশ, আলফাজিরো) — এরা যেকোনো নামকরা মানব খেলোয়াড়কে পর্যুদস্ত করে দিতে পারে। কিন্তু আপনি যদি এদের জন্য আলাদা একটি সিস্টেম তৈরি না করেন, তবে এরা একটা সাধারণ টিক-ট্যাক-টো গেমও খেলতে পারবে না।
সিরি / অ্যালেক্সা (Siri / Alexa) — এরা চমৎকারভাবে আপনার মুখের কথা বুঝতে পারে এবং প্রশ্নের উত্তর দিতে পারে। কিন্তু এরা কখনোই একটি উপন্যাস লিখতে পারবে না।
রেকমেন্ডেশন সিস্টেম (Netflix, Spotify, YouTube) — আপনি এরপর কী দেখতে বা শুনতে চাইবেন, তা এরা অদ্ভুত নিখুঁতভাবে ধরে ফেলতে পারে। কিন্তু একটি মুভি কেন আপনাকে কাঁদাল, সেটির কারণ এরা বলতে পারবে না।
স্প্যাম ফিল্টার — এটি আপনার ইনবক্সে আসা ৯৯.৯% আবর্জনা ইমেইল আটকে দিতে পারে। কিন্তু আপনার প্রয়োজনীয় কোনো ইমেইলের একটি সুন্দর ও অর্থপূর্ণ রিপ্লাই (reply) এরা লিখতে পারবে না।
সেলফ-ড্রাইভিং কার (Self-driving cars) — এরা খুব সাবলীলভাবে রাস্তা চেনে, বাধা এড়িয়ে চলে এবং ট্রাফিক নিয়ম মেনে গাড়ি চালায়। কিন্তু আপনি ছুটিতে কোথায় বেড়াতে যাবেন, সেই সিদ্ধান্তটি এরা আপনাকে দিতে পারবে না।

আপনি কি এই প্যাটার্নটি খেয়াল করেছেন? এদের প্রত্যেকেই হলো সিঙ্গেল-ডোমেইন চ্যাম্পিয়ন (single-domain champion)। অর্থাৎ তাদেরকে যে কাজ শেখানো হয়েছে, তার ঠিক বাইরের কোনো কাজ করতে দিলেই এরা পুরোপুরি অকেজো হয়ে পড়ে।

ন্যারো এআই কেন এত মূল্যবান?

"ন্যারো (Narrow)" শব্দটি শুনে এদের ক্ষমতাকে ছোট করে বা সীমিত করে দেখার কিছু নেই। ন্যারো এআই সিস্টেমগুলো ইতিমধ্যে বড় বড় ইন্ডাস্ট্রিকে পুরোপুরি বদলে দিচ্ছে:

স্বাস্থ্যসেবা (Healthcare) — এআই অনেক অভিজ্ঞ ডাক্তারের চেয়েও দ্রুত এবং নিখুঁতভাবে বিভিন্ন মেডিকেল স্ক্যান বা রিপোর্ট পড়তে পারে।
ফাইন্যান্স (Finance) — অ্যালগরিদমিক ট্রেডিং (algorithmic trading), জালিয়াতি শনাক্তকরণ বা ফ্রড ডিটেকশন (fraud detection) এবং ক্রেডিট স্কোরিং-এর ক্ষেত্রে এআই-এর ভূমিকা অপরিসীম।
যোগাযোগ ও পরিবহন (Transportation) — ম্যাপে সবচেয়ে ভালো রাস্তা ঠিক করা, একা একা চলতে পারা যানবাহন (autonomous vehicles) এবং ট্রাফিকের অবস্থা অনুমান করার ক্ষেত্রে এআই ব্যবহৃত হচ্ছে।
বিনোদন (Entertainment) — মানুষের পছন্দ অনুযায়ী কন্টেন্ট সামনে আনা, গেমে এআই-এর ব্যবহার, এমনকি স্বয়ংক্রিয়ভাবে নতুন মিউজিক তৈরির বেলাতেও।

সুতরাং, কোনো কিছুর ক্ষমতা ন্যারো (Narrow) বা সরু হওয়া মানেই তা দুর্বল (weak) নয়। বরং বোঝানো হয় সেটি তার কাজে ফোকাসড (focused) বা ভীষণ মনোযোগী।

জেনারেল এআই (General AI): এক অধরা স্বপ্ন

এজিআই (AGI) বা আর্টিফিসিয়াল জেনারেল ইন্টেলিজেন্স হলো এমন একটি মেশিনের ধারণা বা স্বপ্ন, যা মানুষের বুদ্ধির পর্যায়ে থাকা যেকোনো কাজ করতে সক্ষম। এটি নিজে নিজেই নতুন দক্ষতা শিখতে পারবে বা এক পেশার জ্ঞানকে অন্য পেশায় অনায়াসেই কাজে লাগাতে পারবে। এমনকি এটি কোনো প্রসঙ্গের সূক্ষ্ম অর্থ, হিউমার (humor) বা কৌতুক এবং মানুষের আবেগও খুব ভালোভাবে বুঝতে পারবে।

একটু ভেবে দেখুন, মানুষ হিসেবে আপনি নিজে কী কী করতে পারেন। আপনি একটি ইউটিউব ভিডিও দেখে কীভাবে রান্না করতে হয় তা শিখে নিতে পারেন। আবার একটু পরেই হয়তো আপনি রান্নাঘর থেকে ফিরে এসে একটি এসে (essay) বা প্রবন্ধ লিখতে পারেন, কোডের ভুল খুঁজতে পারেন, এমনকি মন খারাপ থাকা বন্ধুর সাথে বসে অনেকটা সময় গল্পও করতে পারেন — আর এই সবকিছুই আপনি হয়তো একেকটি মাত্র বিকেলেই করে ফেলতে পারেন! আপনাকে চাইলে সম্পূর্ণ নতুন কোনো স্কিল বা দক্ষতাও (যেমন, মাটি দিয়ে কীভাবে হাঁড়ি পাতিল বানায়) শেখানো সম্ভব, আর এর জন্য আপনাকে নতুন করে আপনার মগজটিকে রিসেট করে শুরু থেকে সব শিখতে হবে না।

এটাই হলো হিউম্যান ইন্টেলিজেন্স বা মানুষের সেই বহুমুখী ও পরিবর্তনশীল হওয়ার ক্ষমতা, যা একে সাধারণ বা জেনারেল (general) করে তোলে। আর ঠিক এই কারণেই একটি সত্যিকারের এজিআই (AGI) তৈরি করা এতটা কঠিন একটি ব্যাপার!

এজিআই (AGI) তৈরি করা এত কঠিন কেন?

এজিআই তৈরির পথে সবচেয়ে বড় বাধাগুলো হলো:

ট্রান্সফার লার্নিং (Transfer learning) — বর্তমানের এআই সিস্টেমগুলো এক ফিল্ড বা ডোমেইন থেকে শেখা জ্ঞান খুব সহজেই অন্য আরেকটি ডোমেইনে কাজে লাগাতে পারে না। যেমন, দাবা খেলতে পারা একটি সেরা এআই রান্না করা সম্পর্কে বিন্দুবিসর্গও জানে না, যদিও দুটি কাজের জন্যই কৌশল এবং পরিকল্পনার প্রয়োজন হয়।
কমন সেন্স (Common sense) — মানুষ জন্মগতভাবেই এই বিশ্বজগৎ কীভাবে কাজ করে সে সম্পর্কে একটি সহজাত সাধারণ জ্ঞান বা কমন সেন্স নিয়ে জন্মায়। যেমন: "পানি ভেজা হয়।", "হাত থেকে কাঁচের গ্লাস পড়ে গেলে তা ভেঙে যায়।" এআই-কে এই প্রতিটি ছোট ছোট তথ্যই হয় একে একে শেখাতে হয় বা এমন অগণিত ডেটা খাইয়ে ট্রেন করাতে হয়।
অ্যাবস্ট্রাকশন (Abstraction) — মানুষ মাত্র কয়েকটি উদাহরণ দেখেই যেকোনো জিনিসের পেছনের আসল আইডিয়া বা ধরনটা শিখে নিতে পারে, যাকে সাধারণীকরণ বা জেনারেলাইজেশন (generalization) বলা হয়। যেমন, একটি ছোট বাচ্চাকে তিনটি ভিন্ন জাতের কুকুর দেখালে সে অনায়াসেই অন্য যেকোনো জাতেরই কুকুর চিনতে পারবে। কিন্তু এই একই কাজ করতে একটি এআই-কে লাখ লাখ কুকুরের ছবি দেখাতে হয়!
সচেতনতা এবং উপলব্ধি (Consciousness and understanding) — এআই কি সত্যিই বোঝে সে আসলে কী করছে? নাকি এটি কেবল তার ভেতরে থাকা সূক্ষ্ম কিছু নিয়ম মেনে প্যাটার্ন মেলায়? এই প্রশ্নের উত্তর আজও বিজ্ঞানীদের কাছে একটি গভীর দার্শনিক প্রশ্ন হয়েই আছে।

ন্যারো এআই ইন অ্যাকশন: একটি সেন্টিমেন্ট ক্লাসিফায়ার

# একটি সাধারণ ন্যারো এআই: এটি কেবল একটি কাজই করে — সেন্টিমেন্ট ক্লাসিফাই করা।
# এটি কখনো দাবা খেলতে পারে না, গাড়ি চালাতে পারে না, বা মানুষের সাথে কথা বলতে পারে না।

def classify_sentiment(text):
    """একটি রুল-ভিত্তিক সেন্টিমেন্ট ক্লাসিফায়ার (ন্যারো এআই)।"""
    positive_words = {"love", "great", "amazing", "wonderful",
                      "fantastic", "good", "happy", "excellent"}
    negative_words = {"hate", "terrible", "awful", "bad",
                      "horrible", "sad", "worst", "boring"}
    
    words = text.lower().split()
    pos_count = sum(1 for w in words if w in positive_words)
    neg_count = sum(1 for w in words if w in negative_words)
    
    if pos_count > neg_count:
        return "Positive 😊"
    elif neg_count > pos_count:
        return "Negative 😞"
    else:
        return "Neutral 😐"

# এটি সেন্টিমেন্ট ধরতে দারুণ কাজ করে!
print(classify_sentiment("This movie is amazing and wonderful"))
print(classify_sentiment("Terrible film, absolutely awful"))
print(classify_sentiment("The movie was okay"))

# কিন্তু এর বাইরে অন্য কোনো কাজ দিলে এটি পুরোপুরি অকেজো:
# classify_sentiment() দাবা খেলতে পারে না
# classify_sentiment() ভাষা অনুবাদ করতে পারে না
# classify_sentiment() কোনো চেহারাও চিনতে পারে না
# এটিই হলো ন্যারো এআই — নিজের কাজে দারুন, কিন্তু বাইরের কাজে জিরো।

Output

Positive 😊
Negative 😞
Neutral 😐

Note: সুপার ইন্টেলিজেন্সের (Superintelligence) কী অবস্থা? কিছু গবেষক এবং সাই-ফাই (sci-fi) বা কল্পবিজ্ঞান লেখকদের মতে, এজিআই (AGI)-এরও ওপারে একটি স্তর আছে: যাকে বলা হয় আর্টিফিশিয়াল সুপার ইন্টেলিজেন্স (ASI) — এটি এমন এআই সিস্টেম, যা সব দিক থেকেই মানুষের বুদ্ধি ও সীমানাকে অনায়াসেই ছাড়িয়ে যায়। এক্স মেশিনা (Ex Machina) বা টার্মিনেটর (The Terminator)-এর মতো মুভিগুলোতে মূলত এই ধারণাই তুলে ধরা হয়। তবে বাস্তবে আমরা এখনো একটি এজিআই-ই তৈরি করে উঠতে পারিনি, তাই এই সুপার ইন্টেলিজেন্স বিষয়টি আপাতত কল্পনা বা জল্পনা-কল্পনার জগতেই থাকুক। দায়িত্বশীলতার দিক থেকে এটি নিয়ে আগে থেকে চিন্তা করে রাখা ভালো, তবে এটি এমন কোনো প্রযুক্তি নয় যা ইঞ্জিনিয়াররা আগামীকালই বানিয়ে ফেলবে। তাই শুধু কাল্পনিক বিষয় নিয়ে পড়ে না থেকে বরং প্রথমে ন্যারো এআই-কেই গভীরভাবে বোঝার চেষ্টা করুন — কারণ বর্তমান পৃথিবীর আসল অ্যাকশন বা পরিবর্তনগুলো ঠিক সেখানেই ঘটছে।

সবকিছু সাদা-কালো হয় না (The Spectrum, Not a Switch)

আমরা হয়তো অনেক সময়ই ন্যারো এবং জেনারেল এআই-কে স্রেফ একটি বাইনারি সুইচ হিসেবে ভাবতে শুরু করি — অর্থাৎ একটি মেশিন হয় ন্যারো, নয়তো সেটি জেনারেল এআই। কিন্তু বাস্তবতা হলো এটি আসলে একটি স্পেকট্রাম (spectrum) বা নিরবচ্ছিন্ন বর্ণালীর মতো।

বর্তমানে জিপিটি-৪ (GPT-4) এবং ক্লড (Claude)-এর মতো আধুনিক সব লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) এই দুইয়ের মধ্যকার সীমানাকে অনেকটা ঝাপসা করে দিয়েছে। তারা কোড লিখতে পারে, কবিতা লিখতে পারে, বড় কোনো রিসার্চ পেপারের সারাংশ তৈরি করতে পারে, ছাত্রদের অঙ্ক শেখাতে পারে এবং মানুষের সাথে সম্পূর্ণ ন্যাচারাল বা প্রাকৃতিক ভাষায় সাবলীলভাবে কথোপকথন চালাতে পারে। তাহলে এরা কি এজিআই (AGI)? বেশিরভাগ গবেষকের মতে, না — এরা এখনো নতুন কোনো পরিস্থিতিতে ভেবেচিন্তে যুক্তি দাঁড় করাতে (novel reasoning) রীতিমতো হিমশিম খায়, একটি ছোট বাচ্চার মতো মাত্র একটি উদাহরণ থেকে এরা শিখতে পারে না, এবং এরা সত্যিই কোনো কিছুর অন্তর্নিহিত অর্থ "বোঝে" না।

কিন্তু এরপরও তারা যেকোনো দাবা খেলার ইঞ্জিন বা একটি সাধারণ স্প্যাম ফিল্টারের চেয়ে যে অনেক বেশি জেনারেল, তা নিয়ে কোনো সন্দেহ নেই। অর্থাৎ আমরা ধীরে ধীরে স্পেকট্রাম ধরে এগোচ্ছি, এবং বিষয়টি নিঃসন্দেহে রোমাঞ্চকর।

সত্যিকারের বা সৎ উত্তরটি হলো: আমরা জানি না কবে (বা আদতেই কি না) আমরা একটি সত্যিকার এজিআই (AGI) তৈরি করতে পারব। এর সময়কাল কারও মতে আগামী ১০ বছর, আবার কারও মতে এটি কখনোই সম্ভব নয়। তবে আমরা এটুকু অন্তত নিশ্চিতভাবেই জানি যে, ন্যারো এআই ইতিমধ্যেই পৃথিবীকে অভূতপূর্ব সব উপায়ে পাল্টে দিচ্ছে — এবং একে সব দিক থেকে গভীরভাবে বোঝার চেষ্টা করাটা অবশ্যই আমাদের সময়ের অন্যতম গুরুত্বপূর্ণ একটি কাজ।

ছোট কুইজ

নিচের কোনটি ন্যারো এআই (Narrow AI)-এর উদাহরণ?

পড়া চালিয়ে যান

এআই (AI) কী?

রোবট ওয়েটার, দাবা খেলার ইঞ্জিন আর সিরি — কী এমন আছে এদের মধ্যে যা এদেরকে বুদ্ধিমান বানায়?

→

এআই (AI) বনাম এমএল (ML) বনাম ডিপ লার্নিং (Deep Learning)

রাশিয়ান পুতুলের মতো — এআই হলো সবচেয়ে বড়টা, তার ভেতরে থাকে এমএল, আর এমএলের ভেতরে থাকে ডিপ লার্নিং

→