লার্জ ল্যাঙ্গুয়েজ মডেলে (LLMs) "L" বিশাল স্কেল প্রস্তাব করে, বাস্তবতা আরও সূক্ষ্ম। কিছু এলএলএম ট্রিলিয়ন প্যারামিটার ধারণ করে, এবং অন্যরা কার্যকরভাবে কাজ করে অনেক কম।
কয়েকটি বাস্তব-বিশ্বের উদাহরণ এবং বিভিন্ন মডেলের আকারের ব্যবহারিক প্রভাব দেখুন।
এলএলএম সাইজ এবং সাইজ ক্লাস
ওয়েব ডেভেলপার হিসাবে, আমরা একটি সম্পদের আকারকে এটির ডাউনলোড আকার হিসাবে ভাবি। একটি মডেলের নথিভুক্ত আকার পরিবর্তে এর পরামিতিগুলির সংখ্যা বোঝায়। উদাহরণস্বরূপ, Gemma 2B 2 বিলিয়ন প্যারামিটার সহ জেমাকে বোঝায়।
এলএলএম-এর কয়েক লক্ষ, লক্ষ লক্ষ, বিলিয়ন বা এমনকি ট্রিলিয়ন প্যারামিটার থাকতে পারে।
বৃহত্তর এলএলএম-এ তাদের ছোট অংশের তুলনায় অনেক বেশি প্যারামিটার থাকে, যা তাদের আরও জটিল ভাষার সম্পর্ক ক্যাপচার করতে এবং সূক্ষ্ম প্রম্পটগুলি পরিচালনা করতে দেয়। তারা প্রায়শই বড় ডেটাসেটে প্রশিক্ষণপ্রাপ্ত হয়।
আপনি হয়তো লক্ষ্য করেছেন যে নির্দিষ্ট মডেলের আকার, যেমন 2 বিলিয়ন বা 7 বিলিয়ন, সাধারণ। উদাহরণস্বরূপ, জেমা 2 বি, জেমা 7 বি বা মিস্ট্রাল 7 বি । মডেল আকার ক্লাস আনুমানিক গ্রুপিং হয়. উদাহরণস্বরূপ, Gemma 2B এর আনুমানিক 2 বিলিয়ন প্যারামিটার রয়েছে, কিন্তু ঠিক নয়।
মডেল সাইজ ক্লাস LLM কর্মক্ষমতা পরিমাপ করার জন্য একটি ব্যবহারিক উপায় অফার করে। বক্সিং-এ তাদের ওজন ক্লাসের মতো মনে করুন: একই আকারের ক্লাসের মধ্যে মডেলগুলি আরও তুলনামূলক। দুটি 2B মডেল অনুরূপ কর্মক্ষমতা প্রদান করা উচিত.
এটি বলেছে, একটি ছোট মডেল নির্দিষ্ট কাজের জন্য একটি বড় মডেলের সমান পারফরম্যান্সের সমান হতে পারে ।