coinex
راهنمای خرید تکراتو

مدل هوش مصنوعی تبدیل متن به تصویر متا معرفی شد؛ بهتر از DALL-E 2 و میدجورنی!

مدل هوش مصنوعی تبدیل متن به تصویر متا معرفی شد. شرکت مادر شبکه اجتماعی تردز مدعی است که مدل هوش مصنوعی جدیدش، بهترین در نوع خود خواهد بود.

مدل هوش مصنوعی تبدیل متن به تصویر متا به‌نام “CM3Leon” معرفی شد. مالک برترین شبکه‌های اجتماعی جهان مدتی می‌شود که بسیار پرکار شده و از زمان آغاز تب هوش مصنوعی تاکنون چند مدل هوش مصنوعی معرفی کرده است. اما متا برای هوش مصنوعی جدیدش ادعا کرده است که CM3Leon بهترین و کامل‌ترین در نوع خود است و بالاتر از رقبای معروفی چون میدجرنی و دالی‌-ای قرار می‌گیرد.

بیشتر بخوانید: هوش مصنوعی جامع ایلان ماسک به اساسی‌ترین سوالات بشر می‌پردازد!

مدل هوش مصنوعی تبدیل متن به تصویر متا معرفی شد

متا از مدل هوش مصنوعی جدیدی به نام CM3Leon (یا همان Chameleon یا «آفتاب‌پرست») رونمایی کرده و می‌گوید این سیستم می‌تواند در تبدیل متن به تصویر بهترین عملکرد را به نمایش بگذارد. این مدل همچنین یکی از اولین مدل‌هایی است که می‌تواند برای تصاویر توضیح یا کپشن بنویسد.

CM3Leon یک مدل مبدل یا «ترنسفورمر» است که با استفاده از مکانیزمی موسوم به «توجه» (Attention) سعی می‌کند ارتباط داده‌های موجود ازجمله متن یا تصاویر به یکدیگر را ارزیابی کند. این توجه در کنار دیگر ویژگی‌های مربوط به معماری در مدل‌های ترنسفورمر می‌تواند سرعت آموزش مدل‌ها را افزایش دهد. ساخت مدل‌های ترنسفورمر بزرگ‌تر با افزایش توان پردازشی ممکن می‌شود.

مدل هوش مصنوعی تبدیل متن به تصویر متا معرفی شد

متا ادعا می‌کند که CM3Leon از اکثر مدل‌های ترنسفورمر بهینه‌تر است، چون به پنج‌برابر توان پردازشی کمتر نیاز دارد و می‌تواند با پایگاه کوچک‌تری از داده‌ها آموزش داده شود. این شرکت برای آموزش مدل خود از میلیون‌ها تصویر از شرکت Shutterstock استفاده کرده است.

قوی‌ترین نسخه از CM3Leon حدود 7 میلیارد پارامتر دارد که تقریباً دو‌برابر مدل DALL-E 2 از شرکت OpenAI است. یکی از قابلیت‌های کلیدی مدل هوش مصنوعی جدید متا که به افزایش قدرت آن کمک کرده، تکنیکی موسوم به «بهینه‌سازی نظارتی» (SFT) است. این تکنیک قبلاً در مدل‌های متنی مثل ChatGPT استفاده شده بود و حالا در مدل‌های تصویری هم خود را ثابت کرده است.

مدل CM3Leon متا می‌تواند فرمان‌های مربوط به ویرایش تصاویر موجود را نیز درک کند. علاوه‌براین، همان‌طور که گفتیم، این مدل قادر است برای تصاویر توضیح کوتاه یا بلند بنویسد. عملکرد CM3Leon در این زمینه حتی از مدل‌های مخصوص خلق کپشن برای تصاویر مثل Flamingo و OpenFlamingo هم بهتر است.

متا هنوز اعلام نکرده که قصد عرضه عمومی مدل هوش مصنوعی CM3Leon را دارد یا نه و اگر پاسخ این سؤال مثبت است، این اتفاق چه زمانی خواهد افتاد.

بیشتر بخوانید:

نظر شما درباره‌ مدل هوش مصنوعی تبدیل متن به تصویر متا چیست؟ دیدگاه خود را در بخش کامنت‌ها با تکراتو در میان بگذارید و اخبار تکنولوژی را با ما دنبال کنید.

راهنمای خرید تکراتو
ارسال برای دوستان در: واتساپ | تلگرام |






ارسال نظر