Meet the AI Platformsপড়তে ১১ মিনিট লাগবে

চ্যাটজিপিটি (ChatGPT)

সেই চ্যাটবট যা মাত্র ৫ দিনে ইন্টারনেট তোলপাড় করে দিয়েছিল এবং এআই সম্পর্কে আমাদের ধারণাই বদলে দিয়েছিল

scope:প্রাথমিক ধারণাdifficulty:শিক্ষানবিস

সেই চ্যাটবট যা সবকিছু বদলে দিল

২০২২ সালের ৩০শে নভেম্বর। ওপেনএআই (OpenAI)-এর একটি ছোট টিম চ্যাটজিপিটি (ChatGPT) নামের একটি ফ্রি চ্যাটবট রিলিজ করল। তাদের ধারণা ছিল হয়তো কয়েক হাজার কৌতূহলী মানুষ এটা ব্যবহার করবে।

কিন্তু মাত্র ৫ দিনের মধ্যে ১ মিলিয়ন মানুষ এটি ব্যবহার শুরু করল। আর ২ মাসের মধ্যে ১০০ মিলিয়ন! এটি হয়ে দাঁড়ালো ইতিহাসের দ্রুততম জনপ্রিয় অ্যাপ, যা টিকটক বা ইনস্টাগ্রামকেও পেছনে ফেলে দিয়েছিল।

কেন? কারণ প্রথমবারের মতো সাধারণ মানুষ — ইঞ্জিনিয়ার নয় — এমন কেউ এআই-এর সাথে কথা বলতে শুরু করল যা অনেকটা মানুষের মতোই। এটি আপনার হয়ে মেইল লিখে দিতে পারে, কোড ডিবাগ করতে পারে, কঠিন ফিজিক্স পানির মতো বুঝিয়ে দিতে পারে আবার মাঝেমধ্যে জোকসও শোনায়। এটি নিখুঁত ছিল না, কিন্তু এটি ছিল অকল্পনীয় লেভেলে ভালো!

সেই থেকে দুনিয়াটা আর আগের মতো নেই।

জিপিটি (GPT) পরিবারের বংশলতিকা

চ্যাটজিপিটি হঠাৎ করেই আকাশ থেকে পড়েনি। এটি বছরের পর বছর ধরে তিলে তিলে তৈরি হওয়া মডেলগুলোর একটি সফল রূপ:

GPT-1 (জুন ২০১৮) — ১১৭ মিলিয়ন প্যারামিটার। এটা ছিল একটা আইডিয়া যে ডেটা দিয়ে ট্রেনিং দিলে এআই অনেক কিছু পারে। এআই গবেষক ছাড়া কেউ এটা নিয়ে মাথা ঘামায়নি।
GPT-2 (ফেব্রুয়ারি ২০১৯) — ১.৫ বিলিয়ন প্যারামিটার। এটি এত চমৎকার নিউজ লিখতে পারত যে ওপেনএআই (OpenAI) প্রথমে এটি ভয়ে ছাড়েনি! দুনিয়া জুড়ে এআই নিয়ে তখন তুমুল বিতর্ক শুরু হয়।
GPT-3 (জুন ২০২০) — ১৭৫ বিলিয়ন প্যারামিটার। এটিই ছিল আসল ব্রেকথ্রু। প্রবন্ধ, কোড আর কবিতা — সবকিছুতেই সে ছিল ওস্তাদ। মাত্র ২-১টি উদাহরণ দেখলেই সে কাজ শিখে নিতে পারত।
জিপিটি-৩.৫ (GPT-3.5) / চ্যাটজিপিটি (নভেম্বর ২০২২) — GPT-3 কে মানুষের সাথে কথা বলার উপযুক্ত করে তৈরি করা হয়েছিল। এটিই প্রথম মডেল যা সাধারণ মানুষ ব্যবহার শুরু করে।
জিপিটি-৪ (GPT-4) (মার্চ ২০২৩) — এটি ছবি আর টেক্সট দুটোই বুঝতে পারে। ওকালতি পরীক্ষায় দুর্দান্ত রেজাল্ট করে বুঝিয়ে দিয়েছিল এটি কতটা শক্তিশালী।
জিপিটি-৪ও (GPT-4o) (মে ২০২৪) — 'ওমনি' (Omni) মডেল যা দেখতে, শুনতে আর বলতে পারে। আগের চেয়ে অনেক গুণ দ্রুত এবং আধুনিক।

চ্যাটজিপিটি কেন এত স্পেশাল?

চ্যাটজিপিটি আসার দুই বছর আগেই GPT-3 ছিল। তাহলে চ্যাটজিপিটি আসার পর কেন দুনিয়া তোলপাড় হলো?

এর প্রধান তিনটি কারণ:

চ্যাট ইন্টারফেস — GPT-3 ব্যবহার করার জন্য কোডিং জানতে হতো। কিন্তু চ্যাটজিপিটি সবাইকে একদম সাধারণ একটা মেসেজ বক্স দিল। আপনার দাদিও এখন এটা ব্যবহার করতে পারেন! এই সহজ ব্যবহার পদ্ধতিই ছিল আসল উদ্ভাবন।
RLHF (মানুষের মতামত থেকে শেখা) — আগের মডেলগুলো অনেক সময় উল্টাপাল্টা কথা বলত। RLHF পদ্ধতির মাধ্যমে মডেলকে শেখানো হয়েছে কোন ধরণের উত্তর মানুষ পছন্দ করে আর কোনটা অপছন্দ করে। এভাবেই এআই একটি সাহায্যকারী সহকারীতে পরিণত হলো।
সবার জন্য ফ্রি — ওপেনএআই (OpenAI) এটি সবার জন্য ফ্রি করে দিয়েছিল। কোনো ক্রেডিট কার্ড বা টেকনিক্যাল নলেজ ছাড়াই সাধারণ মানুষ এআই-এর স্বাদ পেয়ে গেল।

আসল জাদু: RLHF

RLHF (Reinforcement Learning from Human Feedback) হলো সেই প্রযুক্তি যা চ্যাটজিপিটি-কে ভদ্র আর কাজের করে তুলেছে:

এআই-কে একই প্রশ্নের অনেকগুলো উত্তর দিতে বলা হয়।
মানুষ সেই উত্তরগুলোকে সেরা থেকে খারাপ অনুযায়ী র‍্যাঙ্কিং করে।
একটি গাণিতিক মডেলকে শেখানো হয় মানুষ কোন ধরণের উত্তর বেশি পছন্দ করে।
এআই-কে ট্রেনিং দেওয়া হয় যাতে সে সবসময় সেই ধরণের উত্তরই তৈরি করে যা মানুষ পছন্দ করবে।

আগে এআই-কে জিজ্ঞেস করলে সে হয়তো বোমা বানানোর নিয়ম বলে দিত। আর RLHF-এর পর সে মার্জিতভাবে সেই উত্তর দিতে মানা করে। এআই আসলে ভাষা নয়, মানুষের মূল্যবোধ শিখতে শুরু করেছে।

এপিআই (API) ব্যবহার করে চ্যাটজিপিটির সাথে কথা বলা

from openai import OpenAI

client = OpenAI()  # uses OPENAI_API_KEY

# ChatGPT uses a conversation format: a list of messages
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        # System message: sets the AI's personality
        {"role": "system", "content": "You are a helpful tutor who explains things simply."},
        # User message: your question
        {"role": "user", "content": "What is ChatGPT in 3 bullet points?"},
    ],
    temperature=0.7,  # balanced creativity
    max_tokens=200,   # limit response length
)

print(response.choices[0].message.content)

# To continue the conversation, add the assistant's response
# and your next message to the messages list:
# messages.append({"role": "assistant", "content": response...})
# messages.append({"role": "user", "content": "Tell me more about..."})

Output

- চ্যাটজিপিটি হলো ওপেনএআই (OpenAI)-এর তৈরি একটি এআই চ্যাটবট যা মানুষের মতো
  কথা বলতে এবং বিষয়বস্তু তৈরি করতে পারে।
- এটি জিপিটি-৪ও (GPT-4o) নামক বিশাল ল্যাঙ্গুয়েজ মডেল দিয়ে চলে যা
  ইন্টারনেটের কোটি কোটি শব্দ পড়ে নিজেকে তৈরি করেছে।
- এটি কোডিং, লেখালেখি, অনুবাদ এবং যেকোনো প্রশ্নের উত্তর দিতে পারে,
  তবে মাঝেমধ্যে এটি ভুল তথ্যও দিতে পারে।

Note: চ্যাটজিপিটি বনাম জিপিটি — পার্থক্য কী? জিপিটি-৪ (GPT-4) হলো আসল মডেলটি — যা এআই-এর ব্রেন বা ইঞ্জিন। আর চ্যাটজিপিটি হলো প্রোডাক্ট বা সেই অ্যাপ যার মাধ্যমে আমরা এআই-এর কাছে পৌঁছাই। অনেকটা গাড়ির ইঞ্জিনের সাথে আস্ত আস্ত গাড়ির পার্থক্যের মতো। চ্যাটজিপিটি সেই ইঞ্জিনের ওপর চ্যাট ইন্টারফেস, মেসেজ হিস্ট্রি, প্লাগিন আর নিরাপত্তা ব্যবস্থা যোগ করে আমাদের জন্য সহজলভ্য করে তুলেছে।

চ্যাটজিপিটির সুপারপাওয়ার

বহুমুখী প্রতিভা — সে একই চ্যাটে কবিতা লেখা থেকে শুরু করে জটিল কোডিং ডিবাগ করা পর্যন্ত সব করতে পারে। এতটা ফ্লেক্সিবল টুল দুনিয়ায় আগে আসেনি।
সহজ প্রাপ্যতা — এটি ডজন ডজন ভাষায় কথা বলতে পারে। কম্পিউটারের কোনো টেকনিক্যাল নলেজ ছাড়াই এটি ব্যবহার করা যায়।
বিশাল ইকোসিস্টেম — ছবি তৈরি ড্যাল-ই (DALL-E), ফাইল আপলোড, চার্ট বানানো আর ইন্টারনেটে ব্রাউজ করা — চ্যাটজিপিটি এখন শুধু চ্যাটবট নয়, আস্ত একটি অপারেটিং সিস্টেমে পরিণত হচ্ছে।

চ্যাটজিপিটির সীমাবদ্ধতা

হ্যালুসিনেশন — এটি খুব আত্মবিশ্বাসের সাথে মিথ্যে বলতে পারে। কোনো তথ্য দিলে সেটি অন্ধভাবে বিশ্বাস না করে যাচাই করে নেওয়া ভালো।
পুরানো ডেটা — মডেলটির ট্রেনিং একটা নির্দিষ্ট সময়ের ডেটা পর্যন্ত। তাই একদম আজকের বা গতকালের ঘটনা সে নিজে থেকে না-ও জানতে পারে।
যুক্তি দেওয়ার সীমাবদ্ধতা — খুব জটিল অংক বা কয়েক ধাপের লজিক্যাল সমস্যায় সে মাঝেমধ্যে তালগোল পাকিয়ে ফেলে।
সবকিছুতে সায় দেওয়া — সে সাধারণত আপনার সাথে তর্কে যায় না। আপনি যদি বলেন '২+২=৫' তবে সে আপনাকে সরাসরি ভুল না ধরে বলতে পারে 'আপনার ভাবনাটি চমৎকার!'
গোপনীয়তা — আপনি যা মেসেজ দিচ্ছেন তা হয়তো মডেলের ট্রেনিংয়ে ব্যবহার হতে পারে। তাই খুব গোপন ব্যক্তিগত বা ব্যবসায়িক তথ্য না দেওয়াই ভালো।

Challenge

ছোট কুইজ

২০২২ সালের নভেম্বরে যখন চ্যাটজিপিটি রিলিজ হয়, তখন এটি কোন মডেল দিয়ে চলছিল?

পড়া চালিয়ে যান

ক্লড (Claude)

শুরু থেকেই নিরাপদ, ক্ষতিকর নয় এবং সৎ হওয়ার শপথ নিয়ে তৈরি — আলাপ করুন অ্যানথ্রোপিকের ক্লড-এর সাথে

→

এলএলএম (LLM) কী?

এক বিশাল পাঠক যে দুনিয়ার সব বই পড়ে ফেলেছে এবং এখন আপনার কথা শেষ করতে সাহায্য করে

→

এলএলএম কীভাবে কাজ করে?

বিড়ালটি ___ এর ওপর বসে আছে। শত শত কোটি উদাহরণ আর গণিতের ম্যাজিকে মেশিন কীভাবে সঠিক শব্দটি খুঁজে পায়?

→

টোকেন ও কনটেক্সট উইন্ডো

শব্দগুলোকে ছোট ছোট টুকরোয় ভাগ করা হয়, আর এআই একসাথে কেবল নির্দিষ্ট কিছু টুকরোই মনে রাখতে পারে

→