گوگل هوش مصنوعی Whisk را که قابلیت تولید تصویر بدون نیاز به دستور متنی را دارد معرفی کرد. این فناوری خاص میتواند تصاویر را بر اساس نمونههایی که کاربران ارائه میدهند ایجاد کند.
عملکرد هوش مصنوعی Whisk به این نحو است که کاربران تصاویری را که مد نظرشان است را به Whisk نشان داده و این هوش تلاش میکند نزدیکترین تصویر را تولید کند.
معرفی ویژگیهای برجسته هوش مصنوعی Whisk
یکی از مهمتریم ویژگیهای هوش مصنوعی Whisk که آن را از سایر مدلهای متمایز میکند این است که برای تولید تصاویر به توصیفهای متنی وابسته نیست. بدین معنی که کاربران تنها با نشان داده یک تصویر میتوانند خروجیهای دلخواه خود را داشته باشند. در صورت عدم تمایل تصویر ارائه شده توسط هوش، کاربران با کلیک بر روی آیکون طاس، میتوانند از تصاویر دیگری که هوش مصنوعی ایجاد میکنند استفاده کنند.
همچنین این امکان برای کاربران فراهم شده که اگر تصویری نیاز به ویرایش داشت از طریق نوشتن دستور متنی اصلاحات مد نظرشان را اعمال کنند. این هوش مصنوعی پس از تولید تصویر، دستور متنی که به او داده شده را نیز ارائه میدهد و امکان دانلود آنها نیز فراهم است. در صورتیکه که نتیجهی انتهایی قابل قبول نباشد، گزینهی ویرایش نیز برای کاربر وجود دارد که از آن طریق میتواند به نتیجه دلخوان دست یابد.
بنابر اعلام گوگل، Whisk با هدف تسهیل تجربههای بصری سریع طراحی شده؛ بنابراین ممکن است در پیادهسازی دقیق دستورات با چالشهای مواجه شود. به همین دلیل هم امکام ویرایش دستورها برای کاربران آزاد است. یعنی تا هر میزان که کاربر بخواهد میتواند با ارائه دستورات متنی جزئیات بیشتری از هوش بخواهد تا نتیجه مورد نظر به دست بیاید.
گوگل همچنین در طراحی این ابزار از مدل پیشرفته Imagen 3 استفاده کرده و در کنار آن یک هوش مصنوعی جدید به نام Veo 2 را نیز معرفی کرده که برای تولید ویدیوها کاربرد دارد. طبق اعلام گوگل، Veo 2 توانایی درک بسیار دقیقی از زبان سینماتوگرافی دارد.
بیشتر بخوانید: