চ্যাটজিপিটি (ChatGPT)
সেই চ্যাটবট যা সবকিছু বদলে দিল
২০২২ সালের ৩০শে নভেম্বর। ওপেনএআই (OpenAI)-এর একটি ছোট টিম চ্যাটজিপিটি (ChatGPT) নামের একটি ফ্রি চ্যাটবট রিলিজ করল। তাদের ধারণা ছিল হয়তো কয়েক হাজার কৌতূহলী মানুষ এটা ব্যবহার করবে।
কিন্তু মাত্র ৫ দিনের মধ্যে ১ মিলিয়ন মানুষ এটি ব্যবহার শুরু করল। আর ২ মাসের মধ্যে ১০০ মিলিয়ন! এটি হয়ে দাঁড়ালো ইতিহাসের দ্রুততম জনপ্রিয় অ্যাপ, যা টিকটক বা ইনস্টাগ্রামকেও পেছনে ফেলে দিয়েছিল।
কেন? কারণ প্রথমবারের মতো সাধারণ মানুষ — ইঞ্জিনিয়ার নয় — এমন কেউ এআই-এর সাথে কথা বলতে শুরু করল যা অনেকটা মানুষের মতোই। এটি আপনার হয়ে মেইল লিখে দিতে পারে, কোড ডিবাগ করতে পারে, কঠিন ফিজিক্স পানির মতো বুঝিয়ে দিতে পারে আবার মাঝেমধ্যে জোকসও শোনায়। এটি নিখুঁত ছিল না, কিন্তু এটি ছিল অকল্পনীয় লেভেলে ভালো!
সেই থেকে দুনিয়াটা আর আগের মতো নেই।
জিপিটি (GPT) পরিবারের বংশলতিকা
চ্যাটজিপিটি হঠাৎ করেই আকাশ থেকে পড়েনি। এটি বছরের পর বছর ধরে তিলে তিলে তৈরি হওয়া মডেলগুলোর একটি সফল রূপ:
- GPT-1 (জুন ২০১৮) — ১১৭ মিলিয়ন প্যারামিটার। এটা ছিল একটা আইডিয়া যে ডেটা দিয়ে ট্রেনিং দিলে এআই অনেক কিছু পারে। এআই গবেষক ছাড়া কেউ এটা নিয়ে মাথা ঘামায়নি।
- GPT-2 (ফেব্রুয়ারি ২০১৯) — ১.৫ বিলিয়ন প্যারামিটার। এটি এত চমৎকার নিউজ লিখতে পারত যে ওপেনএআই (OpenAI) প্রথমে এটি ভয়ে ছাড়েনি! দুনিয়া জুড়ে এআই নিয়ে তখন তুমুল বিতর্ক শুরু হয়।
- GPT-3 (জুন ২০২০) — ১৭৫ বিলিয়ন প্যারামিটার। এটিই ছিল আসল ব্রেকথ্রু। প্রবন্ধ, কোড আর কবিতা — সবকিছুতেই সে ছিল ওস্তাদ। মাত্র ২-১টি উদাহরণ দেখলেই সে কাজ শিখে নিতে পারত।
- জিপিটি-৩.৫ (GPT-3.5) / চ্যাটজিপিটি (নভেম্বর ২০২২) — GPT-3 কে মানুষের সাথে কথা বলার উপযুক্ত করে তৈরি করা হয়েছিল। এটিই প্রথম মডেল যা সাধারণ মানুষ ব্যবহার শুরু করে।
- জিপিটি-৪ (GPT-4) (মার্চ ২০২৩) — এটি ছবি আর টেক্সট দুটোই বুঝতে পারে। ওকালতি পরীক্ষায় দুর্দান্ত রেজাল্ট করে বুঝিয়ে দিয়েছিল এটি কতটা শক্তিশালী।
- জিপিটি-৪ও (GPT-4o) (মে ২০২৪) — 'ওমনি' (Omni) মডেল যা দেখতে, শুনতে আর বলতে পারে। আগের চেয়ে অনেক গুণ দ্রুত এবং আধুনিক।
চ্যাটজিপিটি কেন এত স্পেশাল?
চ্যাটজিপিটি আসার দুই বছর আগেই GPT-3 ছিল। তাহলে চ্যাটজিপিটি আসার পর কেন দুনিয়া তোলপাড় হলো?
এর প্রধান তিনটি কারণ:
- চ্যাট ইন্টারফেস — GPT-3 ব্যবহার করার জন্য কোডিং জানতে হতো। কিন্তু চ্যাটজিপিটি সবাইকে একদম সাধারণ একটা মেসেজ বক্স দিল। আপনার দাদিও এখন এটা ব্যবহার করতে পারেন! এই সহজ ব্যবহার পদ্ধতিই ছিল আসল উদ্ভাবন।
- RLHF (মানুষের মতামত থেকে শেখা) — আগের মডেলগুলো অনেক সময় উল্টাপাল্টা কথা বলত। RLHF পদ্ধতির মাধ্যমে মডেলকে শেখানো হয়েছে কোন ধরণের উত্তর মানুষ পছন্দ করে আর কোনটা অপছন্দ করে। এভাবেই এআই একটি সাহায্যকারী সহকারীতে পরিণত হলো।
- সবার জন্য ফ্রি — ওপেনএআই (OpenAI) এটি সবার জন্য ফ্রি করে দিয়েছিল। কোনো ক্রেডিট কার্ড বা টেকনিক্যাল নলেজ ছাড়াই সাধারণ মানুষ এআই-এর স্বাদ পেয়ে গেল।
আসল জাদু: RLHF
RLHF (Reinforcement Learning from Human Feedback) হলো সেই প্রযুক্তি যা চ্যাটজিপিটি-কে ভদ্র আর কাজের করে তুলেছে:
- এআই-কে একই প্রশ্নের অনেকগুলো উত্তর দিতে বলা হয়।
- মানুষ সেই উত্তরগুলোকে সেরা থেকে খারাপ অনুযায়ী র্যাঙ্কিং করে।
- একটি গাণিতিক মডেলকে শেখানো হয় মানুষ কোন ধরণের উত্তর বেশি পছন্দ করে।
- এআই-কে ট্রেনিং দেওয়া হয় যাতে সে সবসময় সেই ধরণের উত্তরই তৈরি করে যা মানুষ পছন্দ করবে।
আগে এআই-কে জিজ্ঞেস করলে সে হয়তো বোমা বানানোর নিয়ম বলে দিত। আর RLHF-এর পর সে মার্জিতভাবে সেই উত্তর দিতে মানা করে। এআই আসলে ভাষা নয়, মানুষের মূল্যবোধ শিখতে শুরু করেছে।
এপিআই (API) ব্যবহার করে চ্যাটজিপিটির সাথে কথা বলা
চ্যাটজিপিটির সুপারপাওয়ার
- বহুমুখী প্রতিভা — সে একই চ্যাটে কবিতা লেখা থেকে শুরু করে জটিল কোডিং ডিবাগ করা পর্যন্ত সব করতে পারে। এতটা ফ্লেক্সিবল টুল দুনিয়ায় আগে আসেনি।
- সহজ প্রাপ্যতা — এটি ডজন ডজন ভাষায় কথা বলতে পারে। কম্পিউটারের কোনো টেকনিক্যাল নলেজ ছাড়াই এটি ব্যবহার করা যায়।
- বিশাল ইকোসিস্টেম — ছবি তৈরি ড্যাল-ই (DALL-E), ফাইল আপলোড, চার্ট বানানো আর ইন্টারনেটে ব্রাউজ করা — চ্যাটজিপিটি এখন শুধু চ্যাটবট নয়, আস্ত একটি অপারেটিং সিস্টেমে পরিণত হচ্ছে।
চ্যাটজিপিটির সীমাবদ্ধতা
- হ্যালুসিনেশন — এটি খুব আত্মবিশ্বাসের সাথে মিথ্যে বলতে পারে। কোনো তথ্য দিলে সেটি অন্ধভাবে বিশ্বাস না করে যাচাই করে নেওয়া ভালো।
- পুরানো ডেটা — মডেলটির ট্রেনিং একটা নির্দিষ্ট সময়ের ডেটা পর্যন্ত। তাই একদম আজকের বা গতকালের ঘটনা সে নিজে থেকে না-ও জানতে পারে।
- যুক্তি দেওয়ার সীমাবদ্ধতা — খুব জটিল অংক বা কয়েক ধাপের লজিক্যাল সমস্যায় সে মাঝেমধ্যে তালগোল পাকিয়ে ফেলে।
- সবকিছুতে সায় দেওয়া — সে সাধারণত আপনার সাথে তর্কে যায় না। আপনি যদি বলেন '২+২=৫' তবে সে আপনাকে সরাসরি ভুল না ধরে বলতে পারে 'আপনার ভাবনাটি চমৎকার!'
- গোপনীয়তা — আপনি যা মেসেজ দিচ্ছেন তা হয়তো মডেলের ট্রেনিংয়ে ব্যবহার হতে পারে। তাই খুব গোপন ব্যক্তিগত বা ব্যবসায়িক তথ্য না দেওয়াই ভালো।
ছোট কুইজ
পড়া চালিয়ে যান