ওপেন ওয়েট মডেল (Open Weight Models)
আপনি কি আস্ত একটি ব্রেন ডাউনলোড করতে পারেন?
আপনি যখন চ্যাটজিপিটি, ক্লড বা জেমিনি ব্যবহার করেন, তখন আপনার কথাগুলো ইন্টারনেটের মাধ্যমে বিশাল এক ডেটা সেন্টারে যায়। সেখানে আপনার চোখের আড়ালে সেগুলো প্রসেস হয় এবং একটি উত্তর ফিরে আসে। সহজ কথায়, আপনি অন্যের মস্তিষ্ক ভাড়া নিচ্ছেন। আপনি জানেন না ভেতরে আসলে কী ঘটছে। আর যদি সেই কোম্পানি কাল তাদের নিয়ম বদলে দেয় বা সার্ভিস বন্ধ করে দেয় — তবে আপনার আর কিছু করার থাকে না।
কিন্তু যদি এমন হতো যে আপনি সেই মস্তিষ্কটিই ডাউনলোড করে নিতে পারতেন? আপনার নিজের বাসায়, আপনার নিজের কম্পিউটারে কোনো ইন্টারনেট ছাড়াই সেটি চালাতে পারতেন? আপনি চাইলে তার ভেতরটা দেখতে পারতেন, নিজের মতো করে বদলে নিতে পারতেন?
এটাই হলো ওপেন ওয়েট মডেল (Open Weight Models)-এর প্রতিশ্রুতি। এগুলো এমন এআই মডেল যার ওপর ট্রেনিং দেওয়া কোটি কোটি গাণিতিক সংখ্যা (Weights) সবার জন্য উন্মুক্ত। যে কেউ চাইল সেগুলো ডাউনলোড করে নিজস্ব সার্ভারে বা পিসিতে চালাতে পারে।
ওপেন ওয়েট বনাম ওপেন সোর্স বনাম ক্লোজড
এই শব্দগুলো নিয়ে অনেক সময় তালগোল পেকে যায়। চলুন পরিষ্কার হওয়া যাক:
- ক্লোজড মডেল (Closed Models) — আপনি কেবল চ্যাটের মাধ্যমে এটি ব্যবহার করতে পারেন। আপনি এর ভেতরের কোড বা ট্রেনিং ডেটা কিছুই দেখতে পাবেন না। যেমন- জিপিটি-৪ (GPT-4), ক্লড (Claude), জেমিনি (Gemini) Ultra। সবকিছু সেই কোম্পানির নিয়ন্ত্রণে।
- ওপেন ওয়েট মডেল (Open Weight Models) — এই মডেলের মেইন 'মস্তিষ্ক' বা ওয়েটগুলো (Weights) যে কেউ ডাউনলোড করতে পারে। আপনি এটি নিজের মতো চালাতে বা মডিফাই করতে পারেন। তবে এটি কীভাবে ট্রেইন করা হয়েছে তার সব কোড বা ডেটা হয়তো শেয়ার করা হয় না। যেমন- Llama, মিস্ট্রাল (Mistral)।
- পুরোপুরি ওপেন সোর্স (Fully Open Source) — এখানে মডেলের ওয়েট, ট্রেনিং কোড, এমনকি কোন ডেটা দিয়ে ট্রেইন করা হয়েছে — সবকিছুই খোলাসা করা হয়। এটি বেশ বিরল।
বেশিরভাগ মানুষ ভুল করে 'ওপেন সোর্স' বললেও আসলে তারা 'ওপেন ওয়েট' বোঝান। কারণ ওয়েটগুলো থাকলেই আপনি আসলে মডেলটি চালাতে পারবেন।
লামা (Llama) বিপ্লব
ওপেন এআই দুনিয়ার একটি বিশাল মোড় আসে ২০২৩ সালের ফেব্রুয়ারিতে। মেটা (ফেসবুকের প্যারেন্ট কোম্পানি) তাদের শক্তিশালী মডেল Llama সবার জন্য উন্মুক্ত করে দেয়। এটি সবকিছু বদলে দিয়েছিল।
লামা আসার আগে ভালো এআই চালাতে বিশাল টাকা আর বিশাল সার্ভার লাগত। কিন্তু লামা আসার পর একজন গবেষক তার সাধারণ জিপিইউ (GPU) কার্ড ব্যবহার করেই কমার্শিয়াল মডেলগুলোর সমমানের এআই চালাতে শুরু করলেন। মেটা একের পর এক উন্নত মডেল আনতে থাকে:
- Llama 2 (জুলাই ২০২৩) — ব্যবসার কাজে ব্যবহারের জন্য উন্মুক্ত করা হয়।
- Llama 3 (এপ্রিল ২০২৪) — এর কোয়ালিটি সবাইকে চমকে দেয় এবং এটি জিপিটি-৩.৫-এর সমকক্ষ হয়ে ওঠে।
- Llama 3.1 405B — এটি একটি দানবীয় মডেল যা অনেক ক্ষেত্রে জিপিটি-৪-কেও টক্কর দেয়, অথচ এটি যে কেউ ডাউনলোড করতে পারে।
মেটার এই কৌশলটি ছিল খুব চতুর। তারা শক্তিশালী এআই ফ্রিতে দিয়ে দিল যাতে কোনো একটি কোম্পানি এই বাজার দখল করতে না পারে। সবার হাতে যদি শক্তিশালী এআই থাকে, তবে কেউ একচেটিয়া ব্যবসা করতে পারবে না।
ওপেন ওয়েট ইকোসিস্টেম
লামার সাফল্যে উদ্বুদ্ধ হয়ে আরও অনেক চমৎকার ওপেন মডেল বাজারে আসে:
- মিস্ট্রাল (Mistral) — ফ্রান্সের এক স্টার্টআপ যারা ছোট মডেল দিয়েও বাজিমাত করেছে। তাদের মিস্ত্রাল ৭বি মডেলটি অনেক বড় বড় মডেলকে হারিয়ে দিয়েছিল।
- মাইক্রোসফট (Microsoft) Phi — ছোট কিন্তু কাজের। মাইক্রোসফট দেখিয়েছে যে খুব উন্নত ডেটা দিয়ে ট্রেনিং দিলে মাত্র ৩-৪ বিলিয়ন প্যারামিটারের ছোট মডেলও অনেক শক্তিশালী হতে পারে।
- Qwen — আলিবাবার তৈরি এই মডেলটি কোডিং আর বহুভাষিক কাজের জন্য বর্তমানে অন্যতম সেরা।
- Gemma — গুগলের ওপেন ওয়েট মডেল, যা তাদের মূল জেমিনি রিসার্চ থেকে তৈরি করা হয়েছে।
নিজের কম্পিউটারে এআই চালাবেন কীভাবে?
ওপেন ওয়েট মডেলের আসল মজা হলো আপনি এটি নিজে চালাতে পারেন। তার জন্য নিচের এই জিনিসগুলো জনপ্রিয়:
- Ollama — সবচেয়ে সহজ উপায়। এটি ইন্সটল করে কমান্ড প্রম্পটে
ollama run llama3লিখলেই আপনি এআই-এর সাথে কথা বলতে পারবেন। কোনো ইন্টারনেটের দরকার নেই। - LM Studio — এটি একটি চমৎকার ডেস্কটপ অ্যাপ। আপনি ক্লিক করে মডেল ডাউনলোড করে ওখানেই চ্যাট করতে পারবেন।
- Hugging Face — একে বলা হয় এআই মডেলের 'গিটহাব'। এখানে হাজার হাজার মডেল জমা আছে যা আপনি ডাউনলোড করতে পারেন।
লোকাল কম্পিউটারে এআই চালানো
ভালো-মন্দ: ওপেন বনাম ক্লোজড
ওপেন ওয়েট মডেলের সুবিধা:
- গোপনীয়তা (Privacy) — আপনার ডেটা আপনার কম্পিউটারেই থাকে। কোনো কোম্পানি আপনার পার্সোনাল কথা দেখার সুযোগ পায় না।
- খরচ নেই — একবার মডেল ডাউনলোড করলে যতো খুশি ব্যবহার করুন, কোনো টাকা দিতে হবে না (শুধু কারেন্ট বিল)।
- অফলাইন ব্যবহার — ইন্টারনেটের দরকার নেই। বিমানে বা গ্রামে যেখানে নেট নেই সেখানেও এটি চলবে।
- কোনো সেন্সরশিপ নেই — আপনি চাইলে এর সবকিছু নিজের মতো কন্ট্রোল করতে পারেন।
অসুবিধা:
- শক্তিশালী কম্পিউটার লাগে — ভালো মডেল চালাতে অনেক বেশি র্যাম (RAM) আর গ্রাফিক্স কার্ড (GPU) লাগে।
- একটু পিছিয়ে — জিপিটি-৪ বা ক্লড ৩.৫-এর মতো আস্ত দুনিয়ার ব্রেন এখনো পুরোপুরি ওপেন বক্সে পাওয়া যায় না।
- ঝামেলা বেশি — অ্যাপের মতো সরাসরি ব্যবহার করা যায় না, মাঝেমধ্যে একটু টেকনিক্যাল সেটআপ করতে হয়।
ছোট কুইজ
পড়া চালিয়ে যান