شیائومی میگوید که MiLM آماده ادغام با محصولات خود ازجمله گوشیهای هوشمند، دستگاههای هوشمند خانگی و حتی خودروهای شیائومی است. این اعلامیه همچنین به امکان باز کردن قابلیتهای MiLM برای کاربران گستردهتر در آینده اشاره کرد.
MiLM برای اولین بار در آگوست ۲۰۲۳ در پلتفرمهای بنچمارک C-Eval و CMMLU بهصورت عمومی ظاهر شد، جایی که به نتایج چشمگیری دست یافت.
این مدل جایگاه اول را در رده پارامترهای خود در تابلوی امتیازات C-Eval درحالیکه رتبه ۱۰ را درمجموع کسب کرده است، بهدست آورد. اطلاعات از صفحه GitHub پروژه نشان میدهد که MiLM-6B، مدل خاص موردبحث، دارای ۶.۴ میلیارد پارامتر است.
تفکیک موضوعی C-Eval قدرت MiLM-6B را در زمینههای STEM (علم، فناوری، مهندسی و ریاضیات) برجسته میکند. این مدل در تمامی ۲۰ موضوع STEM، ازجمله اندازهشناسی، فیزیک، شیمی و زیستشناسی، به نمرات دقت بالایی دست یافت.
درحالیکه MiLM-6B در اکثر موضوعات هنرهای لیبرال نیز عملکرد امیدوارکنندهای دارد، بهنظر میرسد حوزههایی که به «تفکر انتزاعی» مانند قانون، ریاضیات، برنامهنویسی و نظریه احتمال نیاز دارند، زمینههایی هستند که نیاز به بهبود بیشتر داند.
علوم اجتماعی حوزه دیگری است که نتایج متفاوتی دارد. MiLM-6B در هشت موضوع از ده موضوع علوم اجتماعی، بهاستثنای آموزش و جغرافیا، دقت خوبی بهدست آورد. درنهایت، وقتی صحبت از علوم انسانی بهمیان میآید، این مدل در تاریخ و حقوق عملکرد خوبی دارد، درحالیکه دقت سایر موضوعات باید مشخص شود.
MiLM-6B اکنون آماده است تا در محصولات مختلف شیائومی ادغام شود. درحالیکه عملکرد آن در موضوعات مختلف متفاوت است، نویدبخش بهبود تجربیات کاربر در حوزههای مختلف میباشد.
انتهای پیام