Meet the AI Platformsপড়তে ১১ মিনিট লাগবে

ক্লড (Claude)

শুরু থেকেই নিরাপদ, ক্ষতিকর নয় এবং সৎ হওয়ার শপথ নিয়ে তৈরি — আলাপ করুন অ্যানথ্রোপিকের ক্লড-এর সাথে
scope:প্রাথমিক ধারণাdifficulty:শিক্ষানবিস

নিরাপদ দুনিয়া গড়ার মিশন

২০২১ সালে ওপেনএআই (OpenAI)-এর কয়েকজন শীর্ষ গবেষক কোম্পানি ছেড়ে চলে আসেন। তারা মনে করেছিলেন এআই শিল্প যেদিকে যাচ্ছে সেখানে নিরাপত্তার দিকটি অবহেলিত হচ্ছে। তারা প্রতিষ্ঠা করেন অ্যানথ্রোপিক (Anthropic), আর তাদের প্রথম বড় চমক ছিল এআই অ্যাসিস্ট্যান্ট — ক্লড (Claude)

এই নামটি হুট করে রাখা হয়নি। এটি একটি শ্রদ্ধাঞ্জলি ক্লড শ্যানন-এর প্রতি, যাকে বলা হয় 'ইনফরমেশন থিওরি'-র জনক। এই মহান গণিতবিদই প্রথম শিখিয়েছিলেন কীভাবে তথ্য পরিমাপ ও আদান-প্রদান করতে হয়, যা ছাড়া আজকের ইন্টারনেট বা এই এলএলএম তৈরি হওয়া অসম্ভব ছিল।

শুরু থেকেই অ্যানথ্রোপিকের লক্ষ্য ছিল শুধু বিজ্ঞ এআই বানানো নয়, বরং এমন এআই বানানো যা সহায়ক (Helpful), ক্ষতিকর নয় (Harmless) এবং সৎ (Honest) — যা ক্লড-এর প্রতিটা উত্তরের মূল ভিত্তি।

কোথা থেকে এলো অ্যানথ্রোপিক?

দারিও আমোদেই (CEO) এবং ড্যানিয়েলা আমোদেই (President) এই ভাই-বোন মিলে কোম্পানিটি শুরু করেন। তারা কয়েকজন তুখোড় গবেষককে সাথে নিয়ে আসেন যারা মনে করতেন যে এআই শক্তিশালী হওয়ার সাথে সাথে তার রাশ টেনে ধরার মতো মজবুত নিরাপত্তা ব্যবস্থাও থাকতে হবে।

অ্যানথ্রোপিক এআই-এর বিরোধী নয়। তারা বিশ্বাস করেন যে শক্তিশালী এআই আসবেই, আর তাই তারা চান নিরাপদভাবে এটি তৈরির সীমানায় থাকতে। একে তারা বলেন "Responsible Scaling" — অর্থাৎ উন্নতি করতে হবে, কিন্তু সাথে থাকতে হবে মজবুত সেফটি গার্ডরেল।

কনস্টিটিউশনাল এআই: এআই-কে মূল্যবোধ শেখানো

অধিকাংশ কোম্পানি RLHF পদ্ধতি ব্যবহার করে — যেখানে মানুষ মডেলের উত্তর রেটিং দেয়। তবে এতে কিছু সমস্যা আছে: মানুষ কাজ করতে ধীর, সবার মূল্যবোধ এক নয় এবং কোটি কোটি রেটিং দেওয়া বিশাল খরচের ব্যাপার।

অ্যানথ্রোপিক সম্পূর্ণ নতুন একটি পদ্ধতি আবিষ্কার করেছে: কনস্টিটিউশনাল এআই (Constitutional AI - CAI)। এটি নিচের ধাপগুলোতে কাজ করে:

  1. একটি সংবিধান লেখা — এআই-কে কিছু মূল নীতি লিখে দেওয়া হয়। যেমন- "এমন উত্তর বাছাই করো যা সবচেয়ে বেশি সাহায্য করে এবং যাতে কোনো ক্ষতি নেই", "বেআইনি কাজে সাহায্য করবে না", "কিছু না জানলে তা সৎভাবে বলে দাও"।
  2. নিজের উত্তর নিজে পরীক্ষা করা — এআই একটি উত্তর তৈরি করার পর সেই সংবিধানের আলোকে নিজের উত্তরটি নিজেই পরীক্ষা করে দেখে। সে নিজেকেই প্রশ্ন করে, "আমার এই উত্তরে কি কোনো নীতি ভঙ্গ হয়েছে? একে আরও নিরাপদ করা যায় কীভাবে?"
  3. সংশোধন — সে নিজেই নিজের ভুল সংশোধন করে একটি উন্নত উত্তর তৈরি করে।
  4. সেরা উত্তরের ওপর ট্রেনিং — মডেলটি তখন এই সংশোধিত (সেরা) উত্তরগুলো থেকে সরাসরি শিখতে শুরু করে।

এই পদ্ধতির সবচেয়ে বড় সৌন্দর্য হলো — এআই-এর মূল্যবোধ বা নীতিগুলো আপনি নিজে পড়ে দেখতে পারবেন। এটি কোনো রহস্যময় মানুষের রেটিং নয়, বরং কিছু লিখিত স্পষ্ট নীতির ওপর ভিত্তি করে তৈরি।

এপিআই (API) ব্যবহার করে ক্লড-এর সাথে কথা বলা

import anthropic
client = anthropic.Anthropic() # uses ANTHROPIC_API_KEY
# Claude uses a messages API similar to ChatGPT
message = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=200,
system="You are a helpful CS tutor. Be concise.",
messages=[
{"role": "user", "content": "What makes Claude different from ChatGPT?"}
]
)
print(message.content[0].text)
# Claude's strengths:
# - 200K token context window (read entire books)
# - Constitutional AI for safety
# - Strong at long document analysis
# - Careful about what it doesn't know
# - Less likely to hallucinate confidently
Output
তিনটি মূল পার্থক্য হলো:
১. নিরাপত্তার ধরন: আমি কনস্টিটিউশনাল এআই দিয়ে ট্রেইন করা,
   অর্থাৎ আমি মানুষের খেয়ালখুশির বদলে কিছু নির্দিষ্ট লিখিত
   নীতিমালা মেনে চলি।
২. বিশাল মেমোরি: আমি একসাথে প্রায় ২০০ হাজার টোকেন মনে
   রাখতে পারি — যা একটি আস্ত মোটা উপন্যাসের সমান।
৩. সততা: আমি কোনো তথ্য বানিয়ে বলার চেয়ে 'আমি জানি না' বা
   'আমি অনিশ্চিত' বলতে পছন্দ করি।
Note: মডেলের ধরন: ক্লড ৩টি সাইজে আসে: Haiku (ছোট ও দ্রুত — চটজলদি কাজের জন্য সেরা), Sonnet (সব কাজের ব্যালেন্সড ওস্তাদ — অধিকাংশ কাজে এটিই ব্যবহার হয়), এবং Opus (সবচেয়ে শক্তিশালী — গভীর গবেষণা ও জটিল লেখালেখির জন্য)। একে গাড়ির সাথে তুলনা করলে হাইকু হলো স্পিডবোট, সনেট হলো মজবুত সেডান আর ওপাস হলো রাজকীয় লাক্সারি কার।

ক্লড কোন কাজে ওস্তাদ?

  • বিশাল দস্তাবেজ বা ফাইল — ক্লড-এর ২০০ হাজার টোকেনের মেমোরি এতটাই বেশি যে সে আস্ত কয়েকটা বই বা কোডবেস একবারে পড়ে ফেলতে পারে। ১০০ পাতার কন্টাক্ট থেকে অমিল বের করে দেওয়া তার জন্য ডালভাত।
  • কোডিং — কোড লেখা এবং ডিবাগিংয়ে ক্লড বর্তমানে অন্যতম সেরা। বিশেষ করে বড় কোডবেস বুঝতে এবং সেটি ব্যাখ্যা করতে সে দারুণ দক্ষ।
  • ধীরস্থির চিন্তা (Reasoning) — ক্লড ধাপে ধাপে চিন্তা করে উত্তর দিতে পছন্দ করে। সে হুট করে কোনো সিদ্ধান্তে না গিয়ে সবদিক বিবেচনা করে।
  • সততার সাথে 'জানি না' বলা — অনেক এআই ভুল তথ্য দিলেও ক্লড-কে এমনভাবে তৈরি করা হয়েছে যাতে সে অনিশ্চিত হলে তা স্বীকার করে। সে আন্দাজে কোনো কথা বানিয়ে বলে না।
  • জটিল নির্দেশ মানা — আপনি যদি তাকে অনেকগুলো শর্ত দিয়ে লম্বা কোনো কাজ দেন, তবে ক্লড প্রতিটি শর্ত নিঁখুতভাবে মেনে চলতে পারে।

ক্লড বনাম চ্যাটজিপিটি: কাকে নেবেন?

কেউ কারো চেয়ে নিশ্চিতভাবে 'সেরা' নয় — দুজনের শক্তি আলাদা জায়গায়:

  • মেমোরি — ক্লড: ২০০কে টোকেন। চ্যাটজিপিটি: ১২৮কে টোকেন। বিশাল ফাইলের জন্য ক্লড এগিয়ে।
  • ইকোসিস্টেম — চ্যাটজিপিটির আছে প্লাগিন, ছবি তৈরির ক্ষমতা ড্যাল-ই (DALL-E), এবং এআই অ্যাপ স্টোর। ক্লড মূলত চ্যাট আর ফাইল অ্যানালাইসিসে বেশি মনোযোগী।
  • লিখনশৈলী — ক্লড-এর লেখা সাধারণত বেশি মার্জিত এবং গোছানো হয়। অন্যদিকে চ্যাটজিপিটি অনেক উদীপ্ত আর বিস্তারিত লিখতে পছন্দ করে।

অ্যানথ্রোপিকের মূল দর্শন

অ্যানথ্রোপিক শুধু একটি চ্যাটবট বানাচ্ছে না, তারা এআই-এর সবচেয়ে কঠিন কিছু সমস্যা নিয়ে কাজ করছে:

  • ইন্টারপ্রেটেবিলিটি (Interpretability) — এআই-এর ভেতরে আসলে কী ঘটছে তা বোঝার চেষ্টা করা। অধিকাংশ এআই হলো 'ব্ল্যাক বক্স' — আমরা জানি ইনপুট দিলে আউটপুট আসে, কিন্তু ভেতরে 'কেন' এই উত্তর দিল তা কেউ জানে না। অ্যানথ্রোপিক সেই রহস্য উন্মোচনে কাজ করছে।
  • Alignment রিসার্চ — নিশ্চিত করা যে এআই মানুষ যা চাইছে তাই করছে, মানুষ যা বলছে তা ভুল বুঝছে না।

ক্লড, চ্যাটজিপিটি বা জেমিনি যেই সেরা হোক না কেন, অ্যানথ্রোপিকের এই নিরাপত্তা বিষয়ক গবেষণা পুরো এআই বিশ্বের জন্য আশীর্বাদ। এআই-কে নিরাপদ রাখার রহস্য যদি তারা বের করতে পারে, তবে জয় আসলে আমাদের সবারই হবে।

ক্লড-এর তিন 'H' বা তিন মূলমন্ত্র

  • Helpful (সহায়ক) — প্রশ্নের সঠিক উত্তর দাও এবং কাজে সাহায্য করো।
  • Harmless (ক্ষতিকর নয়) — বিপজ্জনক বা বেআইনি কাজে সাহায্য করবে না। ক্ষতিকর কোনো তথ্য বা কন্টেন্ট দিবে না।
  • Honest (সৎ) — সত্যি বলো। অনিশ্চিত হলে তা স্বীকার করো। নিজেকে মানুষ হিসেবে দাবি করবে না।

মাঝেমধ্যে এই তিনটি নীতির মধ্যে দ্বন্দ্ব হতে পারে। যেমন- বিপজ্জনক কোনো প্রশ্নের উত্তর দেওয়া হয়তো Helpful হতে পারে কিন্তু তা Harmless হবে না। ক্লড তখন এমনভাবে ভারসাম্য রক্ষা করে যাতে সে নিরাপদ এবং সৎ থেকে যতটুকু সম্ভব সাহায্য করতে পারে।

Challenge

ছোট কুইজ

কনস্টিটিউশনাল এআই (CAI) কী এবং এটি RLHF থেকে কোথায় আলাদা?

পড়া চালিয়ে যান

চ্যাটজিপিটি (ChatGPT)
সেই চ্যাটবট যা মাত্র ৫ দিনে ইন্টারনেট তোলপাড় করে দিয়েছিল এবং এআই সম্পর্কে আমাদের ধারণাই বদলে দিয়েছিল
এলএলএম (LLM) কী?
এক বিশাল পাঠক যে দুনিয়ার সব বই পড়ে ফেলেছে এবং এখন আপনার কথা শেষ করতে সাহায্য করে
এলএলএম কীভাবে কাজ করে?
বিড়ালটি ___ এর ওপর বসে আছে। শত শত কোটি উদাহরণ আর গণিতের ম্যাজিকে মেশিন কীভাবে সঠিক শব্দটি খুঁজে পায়?
টোকেন ও কনটেক্সট উইন্ডো
শব্দগুলোকে ছোট ছোট টুকরোয় ভাগ করা হয়, আর এআই একসাথে কেবল নির্দিষ্ট কিছু টুকরোই মনে রাখতে পারে