مدل هوش مصنوعی تبدیل متن به تصویر متا معرفی شد. شرکت مادر شبکه اجتماعی تردز مدعی است که مدل هوش مصنوعی جدیدش، بهترین در نوع خود خواهد بود.
مدل هوش مصنوعی تبدیل متن به تصویر متا بهنام “CM3Leon” معرفی شد. مالک برترین شبکههای اجتماعی جهان مدتی میشود که بسیار پرکار شده و از زمان آغاز تب هوش مصنوعی تاکنون چند مدل هوش مصنوعی معرفی کرده است. اما متا برای هوش مصنوعی جدیدش ادعا کرده است که CM3Leon بهترین و کاملترین در نوع خود است و بالاتر از رقبای معروفی چون میدجرنی و دالی-ای قرار میگیرد.
بیشتر بخوانید: هوش مصنوعی جامع ایلان ماسک به اساسیترین سوالات بشر میپردازد!
مدل هوش مصنوعی تبدیل متن به تصویر متا معرفی شد
متا از مدل هوش مصنوعی جدیدی به نام CM3Leon (یا همان Chameleon یا «آفتابپرست») رونمایی کرده و میگوید این سیستم میتواند در تبدیل متن به تصویر بهترین عملکرد را به نمایش بگذارد. این مدل همچنین یکی از اولین مدلهایی است که میتواند برای تصاویر توضیح یا کپشن بنویسد.
CM3Leon یک مدل مبدل یا «ترنسفورمر» است که با استفاده از مکانیزمی موسوم به «توجه» (Attention) سعی میکند ارتباط دادههای موجود ازجمله متن یا تصاویر به یکدیگر را ارزیابی کند. این توجه در کنار دیگر ویژگیهای مربوط به معماری در مدلهای ترنسفورمر میتواند سرعت آموزش مدلها را افزایش دهد. ساخت مدلهای ترنسفورمر بزرگتر با افزایش توان پردازشی ممکن میشود.
متا ادعا میکند که CM3Leon از اکثر مدلهای ترنسفورمر بهینهتر است، چون به پنجبرابر توان پردازشی کمتر نیاز دارد و میتواند با پایگاه کوچکتری از دادهها آموزش داده شود. این شرکت برای آموزش مدل خود از میلیونها تصویر از شرکت Shutterstock استفاده کرده است.
قویترین نسخه از CM3Leon حدود 7 میلیارد پارامتر دارد که تقریباً دوبرابر مدل DALL-E 2 از شرکت OpenAI است. یکی از قابلیتهای کلیدی مدل هوش مصنوعی جدید متا که به افزایش قدرت آن کمک کرده، تکنیکی موسوم به «بهینهسازی نظارتی» (SFT) است. این تکنیک قبلاً در مدلهای متنی مثل ChatGPT استفاده شده بود و حالا در مدلهای تصویری هم خود را ثابت کرده است.
مدل CM3Leon متا میتواند فرمانهای مربوط به ویرایش تصاویر موجود را نیز درک کند. علاوهبراین، همانطور که گفتیم، این مدل قادر است برای تصاویر توضیح کوتاه یا بلند بنویسد. عملکرد CM3Leon در این زمینه حتی از مدلهای مخصوص خلق کپشن برای تصاویر مثل Flamingo و OpenFlamingo هم بهتر است.
متا هنوز اعلام نکرده که قصد عرضه عمومی مدل هوش مصنوعی CM3Leon را دارد یا نه و اگر پاسخ این سؤال مثبت است، این اتفاق چه زمانی خواهد افتاد.
بیشتر بخوانید:
- قبولی چت بات هوش مصنوعی گوگل در آزمون مجوز پزشکی آمریکا
- بیل گیتس: هوش مصنوعی خطرناک اما قابل کنترل است!
- پشتیبانی از زبان فارسی به چت بات هوش مصنوعی گوگل بارد افزوده شد
- بیاعتمادی گوگل به ساخته خود ؛ از چت بات بارد دوری کنید!
نظر شما درباره مدل هوش مصنوعی تبدیل متن به تصویر متا چیست؟ دیدگاه خود را در بخش کامنتها با تکراتو در میان بگذارید و اخبار تکنولوژی را با ما دنبال کنید.