شیائومی از مدل هوش مصنوعی متن باز MiMo-7B رونمایی کرد!

شرکت چینی شیائومی با معرفی مدل زبان بزرگ (LLM) جدید خود به نام MiMo-7B، گامی مهم در حوزه هوش مصنوعی برداشته است. این مدل متن‌باز با تمرکز بر استدلال ریاضی و تولید کد، عملکردی فراتر از مدل‌های مشابه از شرکت‌های OpenAI و علی‌بابا ارائه می‌دهد.

MiMo-7B: مدل زبان قدرتمند و متن‌باز

MiMo-7B با ۷ میلیارد پارامتر، توسط تیم جدید Big Model Core Team توسعه یافته است. با وجود حجم کمتر نسبت به مدل‌های بزرگ‌تر، این مدل در آزمون‌های استدلال ریاضی (AIME 24-25) و تولید کد (LiveCodeBench v5) عملکرد بهتری نسبت به مدل‌های o1-mini از OpenAI و Qwen-32B-Preview از علی‌بابا داشته است.

فناوری‌های نوین در آموزش و بهینه‌سازی

شیائومی برای آموزش MiMo-7B از مجموعه داده‌ای با ۲۰۰ میلیارد توکن مرتبط با استدلال و مجموعاً ۲۵ تریلیون توکن در سه مرحله آموزشی استفاده کرده است. همچنین، به جای پیش‌بینی توکن بعدی، از هدف پیش‌بینی چندتوکنی بهره برده تا زمان استنتاج کاهش یابد بدون اینکه کیفیت خروجی تحت تأثیر قرار گیرد.

در فرآیند پس‌آموزش، از تکنیک‌های یادگیری تقویتی و بهبودهای زیرساختی استفاده شده است. الگوریتم اختصاصی Test Difficulty Driven Reward برای مقابله با سیگنال‌های پاداش پراکنده و روش Easy Data Re-Sampling برای پایداری آموزش به کار گرفته شده‌اند. همچنین، سیستم Seamless Rollout برای کاهش زمان بیکاری GPU و افزایش سرعت آموزش به میزان ۲.۲۹ برابر و بهبود عملکرد اعتبارسنجی نزدیک به دو برابر توسعه یافته است.

نسخه‌های مختلف و دسترسی آزاد

چهار نسخه عمومی از MiMo-7B ارائه شده است:

  • Base: مدل پیش‌آموزش‌دیده خام

  • SFT: نسخه تنظیم‌شده با داده‌های نظارت‌شده

  • RL-Zero: نسخه یادگیری تقویتی از مدل پایه

  • RL: نسخه پیشرفته با دقت بالاتر بر پایه SFT

نسخه RL در آزمون MATH-500 امتیاز ۹۵.۸٪ و در مجموعه داده AIME 2024 بیش از ۶۸٪ کسب کرده است. در تولید کد، امتیاز ۵۷.۸٪ در LiveCodeBench v5 و نزدیک به ۵۰٪ در نسخه ۶ به دست آمده است.

MiMo-7B اکنون به صورت متن‌باز در پلتفرم Hugging Face در دسترس است و مستندات و نقاط بازرسی مدل در GitHub منتشر شده‌اند.

گامی مهم برای شیائومی در حوزه هوش مصنوعی

معرفی MiMo-7B نشان‌دهنده تعهد شیائومی به توسعه فناوری‌های هوش مصنوعی و ارتقاء قابلیت‌های محصولات خود است. این مدل می‌تواند نقش مهمی در بهبود سیستم‌های هوشمند و افزایش توانمندی‌های دستگاه‌های مختلف ایفا کند.

منابع:

  • Xiaomi launches MiMo-7B, its first open-source LLM for reasoning and coding. Gizmochina. 2 مه 2025. لینک

  • Xiaomi unveils latest advancements in LLM, with a focus on lightweight applications. TechNode. 15 آگوست 2023. لینک

  • Xiaomi takes shot at premium AI phone sector. China Daily. 16 آگوست 2023. لینک

 
0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها