این روزها که بین مدلهای هوش مصنوعی شرکتهای بزرگ رقابت پایاپایی برقرار است مایکروسافت نسخه بعدی هوش مصنوعی سبک وزن خود را با نام Phi-3 مینی معرفی کرده است. مجموعه کوچک جدید این کمپانی شامل 3 Mini با 3.8 میلیارد پارامتر، Phi-3 Small با 7 میلیارد پارامتر و Phi-3 Medium با 14 میلیارد پارامتر میشود.در دسامبر 2023 مایکروسافت مدل Phi-2 خود را معرفی کرد. این مدل عملکرد خوبی را ارائه داد و حتی توانست از رقیبان هم رده خود مانند خانواده متا Llama-3 پیشی بگیرد.
بیشتر بخوانید: مایکروسافت رسما تبلیغات در منوی استارت ویندوز 11 را آغاز کرد
مدل جدید 3.8 میلیارد پارامتری نسبت به مدل قبلی Phi-2 خود ارتقا یافته و از منابع کمتری نسبت به مدلهای زبانی بزرگتر استفاده میکند. طبق معیارهای خود مایکروسافت، مدل جدید با تنها 3.8 میلیارد پارامتر، Phi-3 مینی از هر دو پارامتر 8 میلیاردی متا Llama و پارامتر 3.5 میلیاردی OpenAI GPT-3 بهتر است.
در بیانیه این شرکت آمده که: «ما Phi-3 مینی را معرفی میکنیم. یک مدل با 3.8 میلیارد پارامتر که بر روی 3.3 تریلیون توکن آموزش دیده است. عملکرد کلی این مدل، به عنوان مقایسه با مدلهایی همچون Mixtral 8x7B و GPT-3.5، با اندازهگیری از طریق استانداردهای علمی و آزمایشهای داخلی، رقیبی قابل توجه است. این مدل، با وجود اینکه به اندازهی کوچکی است که بر روی یک گوشی قابل استفاده باشد، نتایج بسیار قابل توجهی کسب کرده است (به عنوان مثال، عملکرد phi-3-mini ۶۹٪ بر روی MMLU و ۸.۳۸ بر روی MT-bench است).
همچنین، نتایج اولیهی مقیاس پارامتر را با مدلهای 7B و 14B که بر روی 4.8T توکن آموزش دیدهاند، فراهم کرده است. این مدلها با نامهای phi-3-small و phi-3-medium، هر دو قابلیتهای بسیار بیشتری نسبت به phi-3-mini دارند (به عنوان مثال، به ترتیب 75٪ و 78٪ بر روی MMLU و 8.7 و 8.9 بر روی MT-bench).
خانواده Phi-3 به دلیل اندازه کوچکتر، برای دستگاههای کم مصرف در مقایسه با مدلهای بزرگتر بهینه شده است. اریک بوید، معاون مایکروسافت در مصاحبه خود با The Verge گفت: «مدل جدید قادر به پردازش زبان طبیعی پیشرفته به طور مستقیم در تلفن هوشمند است. این باعث میشود که Phi-3 Mini برای برنامههای جدید که در هر مکانی به کمک هوش مصنوعی نیاز دارند، مناسب باشد.»
به هر حال باید بدانید که این مدل کوچک فقط عملکرد بهتری از رقبای هم وزن و هم رده خود دارد، نمیتواند با وسعت دانش مدلهای عظیم آموزش داده شده در اینترنت برابری کند. با این حال معاون مایکروسافت خاطرنشان کرد که مدلهای کوچکتر و باکیفیت بهتر عمل میکنند زیرا مجموعه دادههای داخلی اغلب در مقیاس محدودتر هستند.
بیشتر بخوانید:
- طراحی لوگو با هوش مصنوعی
- سایت ساخت عکس با هوش مصنوعی
- بهترین سایت های هوش مصنوعی
- بهترین ابزارهای هوش مصنوعی برای تولید متن
- بهترین ابزارهای هوش مصنوعی برای تولید محتوا
- بهترین ابزارهای هوش مصنوعی برای تولید موسیقی
لطفا دیدگاه خود را دربارهی Phi-3 مینی مایکروسافت در بخش کامنت با تکراتو در میان بگذارید و اخبار تکنولوژی ایران و جهان را با ما دنبال کنید.
منبع:neowin