ক্লড (Claude)
নিরাপদ দুনিয়া গড়ার মিশন
২০২১ সালে ওপেনএআই (OpenAI)-এর কয়েকজন শীর্ষ গবেষক কোম্পানি ছেড়ে চলে আসেন। তারা মনে করেছিলেন এআই শিল্প যেদিকে যাচ্ছে সেখানে নিরাপত্তার দিকটি অবহেলিত হচ্ছে। তারা প্রতিষ্ঠা করেন অ্যানথ্রোপিক (Anthropic), আর তাদের প্রথম বড় চমক ছিল এআই অ্যাসিস্ট্যান্ট — ক্লড (Claude)।
এই নামটি হুট করে রাখা হয়নি। এটি একটি শ্রদ্ধাঞ্জলি ক্লড শ্যানন-এর প্রতি, যাকে বলা হয় 'ইনফরমেশন থিওরি'-র জনক। এই মহান গণিতবিদই প্রথম শিখিয়েছিলেন কীভাবে তথ্য পরিমাপ ও আদান-প্রদান করতে হয়, যা ছাড়া আজকের ইন্টারনেট বা এই এলএলএম তৈরি হওয়া অসম্ভব ছিল।
শুরু থেকেই অ্যানথ্রোপিকের লক্ষ্য ছিল শুধু বিজ্ঞ এআই বানানো নয়, বরং এমন এআই বানানো যা সহায়ক (Helpful), ক্ষতিকর নয় (Harmless) এবং সৎ (Honest) — যা ক্লড-এর প্রতিটা উত্তরের মূল ভিত্তি।
কোথা থেকে এলো অ্যানথ্রোপিক?
দারিও আমোদেই (CEO) এবং ড্যানিয়েলা আমোদেই (President) এই ভাই-বোন মিলে কোম্পানিটি শুরু করেন। তারা কয়েকজন তুখোড় গবেষককে সাথে নিয়ে আসেন যারা মনে করতেন যে এআই শক্তিশালী হওয়ার সাথে সাথে তার রাশ টেনে ধরার মতো মজবুত নিরাপত্তা ব্যবস্থাও থাকতে হবে।
অ্যানথ্রোপিক এআই-এর বিরোধী নয়। তারা বিশ্বাস করেন যে শক্তিশালী এআই আসবেই, আর তাই তারা চান নিরাপদভাবে এটি তৈরির সীমানায় থাকতে। একে তারা বলেন "Responsible Scaling" — অর্থাৎ উন্নতি করতে হবে, কিন্তু সাথে থাকতে হবে মজবুত সেফটি গার্ডরেল।
কনস্টিটিউশনাল এআই: এআই-কে মূল্যবোধ শেখানো
অধিকাংশ কোম্পানি RLHF পদ্ধতি ব্যবহার করে — যেখানে মানুষ মডেলের উত্তর রেটিং দেয়। তবে এতে কিছু সমস্যা আছে: মানুষ কাজ করতে ধীর, সবার মূল্যবোধ এক নয় এবং কোটি কোটি রেটিং দেওয়া বিশাল খরচের ব্যাপার।
অ্যানথ্রোপিক সম্পূর্ণ নতুন একটি পদ্ধতি আবিষ্কার করেছে: কনস্টিটিউশনাল এআই (Constitutional AI - CAI)। এটি নিচের ধাপগুলোতে কাজ করে:
- একটি সংবিধান লেখা — এআই-কে কিছু মূল নীতি লিখে দেওয়া হয়। যেমন- "এমন উত্তর বাছাই করো যা সবচেয়ে বেশি সাহায্য করে এবং যাতে কোনো ক্ষতি নেই", "বেআইনি কাজে সাহায্য করবে না", "কিছু না জানলে তা সৎভাবে বলে দাও"।
- নিজের উত্তর নিজে পরীক্ষা করা — এআই একটি উত্তর তৈরি করার পর সেই সংবিধানের আলোকে নিজের উত্তরটি নিজেই পরীক্ষা করে দেখে। সে নিজেকেই প্রশ্ন করে, "আমার এই উত্তরে কি কোনো নীতি ভঙ্গ হয়েছে? একে আরও নিরাপদ করা যায় কীভাবে?"
- সংশোধন — সে নিজেই নিজের ভুল সংশোধন করে একটি উন্নত উত্তর তৈরি করে।
- সেরা উত্তরের ওপর ট্রেনিং — মডেলটি তখন এই সংশোধিত (সেরা) উত্তরগুলো থেকে সরাসরি শিখতে শুরু করে।
এই পদ্ধতির সবচেয়ে বড় সৌন্দর্য হলো — এআই-এর মূল্যবোধ বা নীতিগুলো আপনি নিজে পড়ে দেখতে পারবেন। এটি কোনো রহস্যময় মানুষের রেটিং নয়, বরং কিছু লিখিত স্পষ্ট নীতির ওপর ভিত্তি করে তৈরি।
এপিআই (API) ব্যবহার করে ক্লড-এর সাথে কথা বলা
ক্লড কোন কাজে ওস্তাদ?
- বিশাল দস্তাবেজ বা ফাইল — ক্লড-এর ২০০ হাজার টোকেনের মেমোরি এতটাই বেশি যে সে আস্ত কয়েকটা বই বা কোডবেস একবারে পড়ে ফেলতে পারে। ১০০ পাতার কন্টাক্ট থেকে অমিল বের করে দেওয়া তার জন্য ডালভাত।
- কোডিং — কোড লেখা এবং ডিবাগিংয়ে ক্লড বর্তমানে অন্যতম সেরা। বিশেষ করে বড় কোডবেস বুঝতে এবং সেটি ব্যাখ্যা করতে সে দারুণ দক্ষ।
- ধীরস্থির চিন্তা (Reasoning) — ক্লড ধাপে ধাপে চিন্তা করে উত্তর দিতে পছন্দ করে। সে হুট করে কোনো সিদ্ধান্তে না গিয়ে সবদিক বিবেচনা করে।
- সততার সাথে 'জানি না' বলা — অনেক এআই ভুল তথ্য দিলেও ক্লড-কে এমনভাবে তৈরি করা হয়েছে যাতে সে অনিশ্চিত হলে তা স্বীকার করে। সে আন্দাজে কোনো কথা বানিয়ে বলে না।
- জটিল নির্দেশ মানা — আপনি যদি তাকে অনেকগুলো শর্ত দিয়ে লম্বা কোনো কাজ দেন, তবে ক্লড প্রতিটি শর্ত নিঁখুতভাবে মেনে চলতে পারে।
ক্লড বনাম চ্যাটজিপিটি: কাকে নেবেন?
কেউ কারো চেয়ে নিশ্চিতভাবে 'সেরা' নয় — দুজনের শক্তি আলাদা জায়গায়:
- মেমোরি — ক্লড: ২০০কে টোকেন। চ্যাটজিপিটি: ১২৮কে টোকেন। বিশাল ফাইলের জন্য ক্লড এগিয়ে।
- ইকোসিস্টেম — চ্যাটজিপিটির আছে প্লাগিন, ছবি তৈরির ক্ষমতা ড্যাল-ই (DALL-E), এবং এআই অ্যাপ স্টোর। ক্লড মূলত চ্যাট আর ফাইল অ্যানালাইসিসে বেশি মনোযোগী।
- লিখনশৈলী — ক্লড-এর লেখা সাধারণত বেশি মার্জিত এবং গোছানো হয়। অন্যদিকে চ্যাটজিপিটি অনেক উদীপ্ত আর বিস্তারিত লিখতে পছন্দ করে।
অ্যানথ্রোপিকের মূল দর্শন
অ্যানথ্রোপিক শুধু একটি চ্যাটবট বানাচ্ছে না, তারা এআই-এর সবচেয়ে কঠিন কিছু সমস্যা নিয়ে কাজ করছে:
- ইন্টারপ্রেটেবিলিটি (Interpretability) — এআই-এর ভেতরে আসলে কী ঘটছে তা বোঝার চেষ্টা করা। অধিকাংশ এআই হলো 'ব্ল্যাক বক্স' — আমরা জানি ইনপুট দিলে আউটপুট আসে, কিন্তু ভেতরে 'কেন' এই উত্তর দিল তা কেউ জানে না। অ্যানথ্রোপিক সেই রহস্য উন্মোচনে কাজ করছে।
- Alignment রিসার্চ — নিশ্চিত করা যে এআই মানুষ যা চাইছে তাই করছে, মানুষ যা বলছে তা ভুল বুঝছে না।
ক্লড, চ্যাটজিপিটি বা জেমিনি যেই সেরা হোক না কেন, অ্যানথ্রোপিকের এই নিরাপত্তা বিষয়ক গবেষণা পুরো এআই বিশ্বের জন্য আশীর্বাদ। এআই-কে নিরাপদ রাখার রহস্য যদি তারা বের করতে পারে, তবে জয় আসলে আমাদের সবারই হবে।
ক্লড-এর তিন 'H' বা তিন মূলমন্ত্র
- Helpful (সহায়ক) — প্রশ্নের সঠিক উত্তর দাও এবং কাজে সাহায্য করো।
- Harmless (ক্ষতিকর নয়) — বিপজ্জনক বা বেআইনি কাজে সাহায্য করবে না। ক্ষতিকর কোনো তথ্য বা কন্টেন্ট দিবে না।
- Honest (সৎ) — সত্যি বলো। অনিশ্চিত হলে তা স্বীকার করো। নিজেকে মানুষ হিসেবে দাবি করবে না।
মাঝেমধ্যে এই তিনটি নীতির মধ্যে দ্বন্দ্ব হতে পারে। যেমন- বিপজ্জনক কোনো প্রশ্নের উত্তর দেওয়া হয়তো Helpful হতে পারে কিন্তু তা Harmless হবে না। ক্লড তখন এমনভাবে ভারসাম্য রক্ষা করে যাতে সে নিরাপদ এবং সৎ থেকে যতটুকু সম্ভব সাহায্য করতে পারে।
ছোট কুইজ
পড়া চালিয়ে যান