نسل دوم هوش مصنوعی Imagen رسما توسط گوگل معرفی شد که قابلیتهای پیشرفته و عملکرد خیره کننده این هوش مصنوعی را به رخ میکشد.
در بیانیهای مطبوعاتی، گوگل دومین نسخه از هوش مصنوعی Imagen را به معرفی کرد. این مدل هوش مصنوعی قابلیت ایجاد و ویرایش تصاویر بر اساس متن را داراست و بهطور گسترده برای مشتریان Google Cloud که از Vertex AI استفاده میکنند و دسترسی آنها تأیید شده است، در دسترس قرار میگیرد.
ادامه مطلب در ادامه
بیشتر بخوانید:
- هوش مصنوعی Gemini گوگل به زودی به سامسونگ و سایر گوشیهای اندرویدی میآید
- گوگل قصد دارد یک چتبات شخصیسازی شده معرفی کند
- روایت زندگی کاربران با هوش مصنوعی مبتنی بر Gemini گوگل ممکن خواهد شد
نسل دوم هوش مصنوعی Imagen گوگل
گوگل اطلاعات مربوط به دادههای استفاده شده برای آموزش مدل جدید را منتشر نکرده است و به سازندگانی که ممکن است بهطور ناخواسته در مجموعهدادهها شرکت داشته باشند، فرصتی برای انصراف یا درخواست غرامت ارائه نمیدهد.
Imagen 2 نام مدل هوش مصنوعی گوگل است که پیشنمایش آن در کنفرانس I/O اردیبهشت و خرداد معرفی شد. این مدل توسط کسبوکار DeepMind توسعه یافته است. قبلاً این شرکت از به اشتراکگذاری نمونههای تصاویر خودداری میکرد.
گوگل ادعا میکند که Imagen 2 در مقایسه با نسل اول خود، کیفیت تصویر را بهطور قابلتوجهی بهبود داده است. همچنین، گوگل ویژگیهای بهروز شده هوش مصنوعی خود را معرفی کرده است که امکان اضافه کردن متن و لوگو به تصاویر را فراهم میکند.
در یک کنفرانس مطبوعاتی، توماس کوریان، مدیرعامل گوگل کلود اظهار داشت:
“اگر میخواهید تصاویری که با متن پوشانده شده را مانند تصاویر تبلیغاتی ایجاد کنید، این امکان برای شما فراهم شده است.”
Imagen 2 در رقابت با سایر مدلهای تولید تصویر پیشرو مانند DALL-E 3 و Titan Image Generator قرار دارد. با این حال، دو تفاوت احتمالی میان آنها وجود دارد؛ Imagen 2 میتواند متن را به چندین زبان تولید کند و همچنین لوگو را روی تصاویر قرار دهد.
رئیس محصولات رسانهای مولد گوگل توضیح میدهد:
“Imagen 2 میتواند نشانها، علائم و لوگوهای انتزاعی تولید کند و این توانایی را داراست که این لوگوها را روی محصولات، لباسها، کارتهای ویزیت و سایر سطوح قرار دهد.”
با بهرهگیری از تکنیکهای جدید یادگیری و مدلسازی، Imagen 2 قادر است پرسشهای توصیفیتر و طولانیتر را درک کند و به سؤالات مربوط به عناصر تصویر پاسخهای تفصیلی ارائه دهد. گوگل ادعا میکند که این تکنیکها بهبودی در درک چند زبانه Imagen 2 ایجاد میکنند و مدل را قادر میسازند درخواستی را با یک زبان به خروجی در زبان دیگر ترجمه کند.
گوگل برای اعمال واترمارکهای نامرئی بر روی تصاویر از SynthID استفاده میکند که توسط دیپمایند توسعه یافته است. البته، تشخیص واترمارکها به ابزاری خاص نیاز دارد که توسط گوگل ارائه شده و در دسترس عموم قرار ندارد.
گوگل در مورد دادههای استفاده شده برای آموزش Imagen 2 سکوت کرده است و این موضوع هنوز موضوعی قانونی است که در دادگاه بحث میشود. در حال حاضر، گوگل یک سیاست جبران خسارت برای مشتریان واجد شرایط Vertex AI ارائه میدهد.
استفاده از هوش مصنوعی مولد برای تولید تصاویر، نگرانیهایی برای مشتریان و توسعهدهندگان سازمانی ایجاد میکند. تحقیقات نشان میدهد که نسل اول Imagen نیز از این پدیده مصون نبوده و تصاویری قابل شناسایی از افراد واقعی، آثار دارای حق کپیرایت توسط هنرمندان و موارد دیگر را در صورت درخواست با استفاده از روشهای خاص ارائه داده است.
در نظرسنجی اخیر، تقریباً یک سوم شرکتها اعلام کردهاند که مالکیت معنوی بزرگترین نگرانی آنها در مورد استفاده از هوش مصنوعی مولد است.
بیشتر بخوانید:
- سرویس جدید اینترنت 20 گیگابیتی گوگل با هزینه ماهانه 250 دلار معرفی شد
- لیست بیشترین سرچ کاربران سال 2023 منتشر شد؛ چه کلماتی در گوگل بیشتر جستجو شدهاند؟
- اعتراف گوگل: ویدیوی معرفی هوش مصنوعی Gemini ساختگی بود!
- گوگل اکنون به تولیدکنندگان محتوا اجازه متوقف کردن نظرات روی ویدئوهای یوتیوب را میدهد
- هوش مصنوعی GPT-4 تنبل شده است؛ OpenAI تایید کرد
نظر شما در مورد نسل دوم هوش مصنوعی Imagen چیست؟ نظرات خود را با ما به اشتراک گذاشته و اخبار فناوری را از تکراتو دنبال کنبد.
.
منبع: Google