Practical Tips & Safetyপড়তে ১২ মিনিট লাগবে

এআই হ্যালুসিনেশন

যখন এআই পুরো আত্মবিশ্বাসের সাথে বানিয়ে গল্প বলে
scope:মূল ধারণাdifficulty:শিক্ষানবিস

চ্যাটজিপিটির (ChatGPT) ওপর ভরসা করা সেই উকিলের গল্প

২০২৩ সালের জুন মাসে নিউ ইয়র্কের একজন উকিল, স্টিফেন শোয়ার্টজ, আদালতে একটি আইনি ব্রিফ জমা দিলেন। সেখানে তিনি তার যুক্তির সপক্ষে ছয়টি পুরনো মামলার উদাহরণ দিলেন। মামলার নাম, তারিখ, রায় সব একদম নিখুঁত ছিল।

কিন্তু সমস্যা ছিল একটাই: ওই ছয়টি মামলার একটিরও কোনো অস্তিত্ব ছিল না

শোয়ার্টজ আইনি গবেষণার জন্য চ্যাটজিপিটি (ChatGPT) ব্যবহার করেছিলেন। আর এআই (AI) খুব আত্মবিশ্বাসের সাথে ভুয়া জজ, ভুয়া রায় আর ভুয়া আইনি যুক্তিসহ ছয়টি আস্ত মামলা বানিয়ে দিয়েছিল। যখন প্রতিপক্ষের উকিলরা ওই মামলাগুলো খুঁজে পেলেন না, তখন জজ সাহেব শোয়ার্টজকে ভারী জরিমানা করেন এবং খবরটি দুনিয়ার সব সংবাদমাধ্যমে ছড়িয়ে পড়ে।

এটি কোনো যান্ত্রিক ক্রটি ছিল না। এটি লার্জ ল্যাঙ্গুয়েজ মডেলের (LLM) কাজ করার একটি ধরণ। একেই বলা হয় এআই হ্যালুসিনেশন (AI Hallucination)

এআই হ্যালুসিনেশন আসলে কী?

যখন একটি এআই মডেল সম্পূর্ণ ভুল বা কাল্পনিক তথ্যকে এমনভাবে প্রকাশ করে যেন সেটি ধ্রুব সত্য — তাকেই বলা হয় হ্যালুসিনেশন।

এর প্রধান বৈশিষ্ট্যগুলো হলো:

  • প্রচণ্ড আত্মবিশ্বাস: এআই কখনোই বলবে না "আমি নিশ্চিত নই"। সে ভুল তথ্যটি এমনভাবে বলবে যেন সে এটি একশ ভাগ জানে।
  • শুনতে সত্য মনে হয়: হ্যালুসিনেশন করা তথ্যগুলো ব্যাকরণগতভাবে সঠিক এবং বাস্তবসম্মত মনে হয়।
  • কোনো সতর্কতা নেই: ভুল তথ্য দেওয়ার সময় এআই আপনাকে কোনো ওয়ার্নিং দেয় না।

এটিকে এমন এক ছাত্রের সাথে তুলনা করা যায় যে পরীক্ষার প্রশ্নের উত্তর জানে না, কিন্তু খাতা ভরানোর জন্য খুব সুন্দর হাতের লেখায় ভুল উত্তর লিখে আসে যা দেখতে একদম সঠিক মনে হয়!

Note: কেন এর নাম হ্যালুসিনেশন? মনোবিজ্ঞানে হ্যালুসিনেশন মানে হলো এমন কিছু দেখা বা শোনা যা বাস্তবে নেই। এআই-ও তার ডেটার মধ্যে এমন সব প্যাটার্ন খুঁজে পায় যার আসলে কোনো বাস্তব ভিত্তি নেই। গবেষকরা অনেক সময় একে 'কনফ্যাবুলেশন' বা 'গল্প বানানো'ও বলেন।

এআই (AI) হ্যালুসিনেশন কেন হয় তা বুঝতে হলে আমাদের জানতে হবে এআই (AI) আসলে কী করে। চ্যাটজিপিটির (ChatGPT) মতো মডেলগুলো মূলত একটি নেক্সট-টোকেন প্রেডিকশন মেশিন (Next-token prediction machine)

এখানেই মূল সমস্যা: পরের শব্দটি কী হবে তা আন্দাজ করা আর সত্য কথা বলা — এই দুটি এক জিনিস নয়।

১. প্যাটার্ন খোঁজা, জ্ঞান নয়

এআই-এর কাছে কোনো তথ্যের ভাণ্ডার নেই। সে শুধু দেখেছে কোন শব্দের পর কোন শব্দ আসার সম্ভাবনা বেশি। যেমন- "ফ্রান্সের রাজধানী কী?" এর জবাবে ইন্টারনেটে কোটিবার "প্যারিস" শব্দটি এসেছে। তাই সে সেটি মনে রেখেছে। কিন্তু যখন তাকে কোনো কঠিন বা অপরিচিত প্রশ্ন করা হয়, সে তথ্যের প্যাটার্ন মেলাতে গিয়ে ভুল শব্দ বসিয়ে দেয়।

২. সত্য-মিথ্যার পার্থক্য বোঝে না

এআই ট্রেইন করা হয়েছে ইন্টারনেটের সব ধরণের লেখা দিয়ে। সেখানে যেমন সায়েন্সের বই আছে, তেমনি আছে ভুল খবর, কৌতুক আর গল্প। এআই-এর কাছে সায়েন্সের বইয়ের তথ্য আর ফেসবুকের কমেন্টের তথ্যের মধ্যে কোনো তফাৎ নেই।

৩. "জানি না" বলতে চায় না

এআই মডেলগুলোকে শেখানো হয়েছে সব সময় উত্তর দিতে। তাই যখন সে উত্তর জানে না, সে চুপ না থেকে নিজের মতো করে একটি সাজানো উত্তর বানিয়ে দেয়।

এআই কেন ভুল করে (পাইথন উদাহরণ)

import random
def next_token_prediction(prompt, knowledge_base):
"""Simplified model: predicts next tokens based on patterns.
Shows how hallucinations emerge from pattern matching."""
# The model has learned these PATTERNS (not facts):
patterns = {
"capital of France": "Paris", # Correct - seen 1M+ times
"capital of Australia": "Sydney", # WRONG - common misconception!
"wrote Romeo and Juliet": "Shakespeare", # Correct
"invented the telephone": "Alexander Graham Bell", # Debatable!
}
for pattern, completion in patterns.items():
if pattern in prompt.lower():
return completion
# When no strong pattern exists, the model STILL generates something
# This is where hallucinations come from!
fake_but_plausible = [
"According to a 2021 study by Dr. James Chen...",
"The landmark case of Thompson v. Miller (2019)...",
"Research published in Nature (Vol. 47, p. 312)...",
]
return random.choice(fake_but_plausible) # Confident, but made up!
# Well-known fact → correct
print("Q: What is the capital of France?")
print(f"A: {next_token_prediction('capital of France', {})}")
print("(Correct! Strong pattern in training data)\n")
# Common misconception → hallucination
print("Q: What is the capital of Australia?")
print(f"A: {next_token_prediction('capital of Australia', {})}")
print("(WRONG! It's Canberra. Sydney appears more often, so the model picks it)\n")
# Obscure question → fabricated answer
print("Q: What did the court rule in AI copyright cases?")
print(f"A: {next_token_prediction('AI copyright ruling details', {})}")
print("(HALLUCINATION! No strong pattern, so it generates plausible-sounding fiction)")
Output
সিডনি

হ্যালুসিনেশনের মাত্রা

  • সামান্য ভুল: কোনো সাল বা তারিখ এক বছর এদিক-ওদিক হওয়া।
  • কাল্পনিক তথ্য: কোনো পরিসংখ্যান বানিয়ে বলা (যেমন- "৭৩% মানুষ এটি পছন্দ করে" — অথচ এমন কোনো সার্ভে হয়নি)।
  • বিপজ্জনক ভুল: ভুল ওষুধের ডোজ বলে দেওয়া বা ভুয়া আইনি পরামর্শ দেওয়া।

কীভাবে হ্যালুসিনেশন থেকে বাঁচবেন?

  • তথ্যের সত্যতা যাচাই করুন: এআই-এর দেওয়া প্রতিটি জরুরি তথ্য (তারিখ, নাম, পরিসংখ্যান) ইন্টারনেটে আলাদাভাবে সার্চ করে দেখুন।
  • রেফারেন্স আছে কি না দেখুন: এআই-কে বলুন তার তথ্যের সোর্স বা সূত্র দিতে। এরপর সেই উক্তি বা সূত্রটি আসলেও ইন্টারনেটে আছে কি না যাচাই করুন।
  • একাধিক এআই ব্যবহার করুন: চ্যাটজিপিটির তথ্য ক্লড (Claude) বা জেমিনি (Gemini)-তে দিয়ে ক্রস-চেক করুন।
  • পুরনো তথ্যে সাবধান: এআই-এর লাস্ট ট্রেনিং আপডেট কবে হয়েছে তা খেয়াল রাখুন। নতুন কোনো খবর বা ঘটনা নিয়ে সে ভুল করতে পারে।
Note: একটি টিপস: আপনি যদি এআই-কে বলেন, "তুমি যদি উত্তর না জানো তবে তা স্বীকার করো," তবে হ্যালুসিনেশনের পরিমাণ অনেক কমে যায়। এটি তাকে মিথ্যা বলার থেকে বিরত রাখে।
Challenge

ছোট কুইজ

লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) কেন হ্যালুসিনেশন করে?

পড়া চালিয়ে যান