;
coinex

گوگل از هوش‌ مصنوعی Imagen برای تبدیل متن به عکس رونمایی کرد

هوش‌ مصنوعی Imagen برای تبدیل متن به عکس قابلیتی است که به کاربر این امکان را می‌دهد تا متن خود را به تصویر مرتبط تبدیل کند.

گوگل به تازگی از هوش‌ مصنوعی Imagen برای تبدیل متن به عکس رونمایی کرده است که با خلق تصویر مرتبط با متن، کاربر می‌تواند نوشته را به طور عمیق درک کند و به راحتی ارتباط برقرار کند. می‌توان گفت از این طریق، کاربر در بطن موضوع نوشته شده قرار می‌گیرد. در ادامه قصد داریم به جزئیات بیش‌تری از این قابلیت جدید بپردازیم؛ پس با تکراتو همراه باشید.

قابلیت هوش‌ مصنوعی Imagen برای تبدیل متن به عکس

برای درک راحت‌تر این موضوع ابتدا با یک مثال ساده شروع خواهیم کرد. فرض کنید شما متنی با محتوای «یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار می‌زند» را نوشته و قصد دارید آن را به تصویر تبدیل کنید. در اینجا مدل Imagen تصویری را با تمام جزئیات متن، به شما ارائه می‌دهد. گفتنیست که دقت به کار رفته در این مدل به اندازه‌ای است که نسبت به مدل‌های دیگر، بی رقیب بوده و همچنین رضایت بیش‌تر کاربران را به همراه دارد.

قابلیت هوش‌ مصنوعی Imagen برای تبدیل متن به عکس

 

اهالی ماونتین ویو از طریق قابلیت هوش‌ مصنوعی Imagen برای تبدیل متن به عکس تعدادی از این تصاویر را در وب‌سایت مختص به این پروژه آپلود کرده‌اند تا کاربران بتوانند در مقایسه با خروجی‌های مدل‌های دیگر، متوجه تفاوت عکس‌ها شوند. البته گفتنیست که مدل Imagen در حال حاضر برای تمامی افراد قابل دسترس نیست. درواقع گوگل قصد دارد تمام زیرساخت‌های موردنیاز این قابلیت برای استفاده همگان را مهیا کند و سپس دسترسی استفاده از آن برای عموم امکان پذیر شود.

مشکلات هوش مصنوعی گوگل

اولین مشکل قابلیت هوش‌ مصنوعی Imagen برای تبدیل متن به عکس درواقع اطلاعات موجود است که تنها از طریق اینترنت به دست می‌آید. پس با توجه به اینکه اطلاعات اینترنت به طور کامل دسته‌بندی و یکپارچه‌سازی نشده است، این موضوع می‌تواند در هنگام ارائه تصویر خروجی مشکلاتی را به وجود بیاورد. به طور مثال، ممکن است تصویر خروجی با متن مرتبط نباشد. محققان گوگل در این باره اظهار کرده‌اند: «هرچند این رویکرد موجب پیشرفت‌های الگوریتمی سریع در سال‌های اخیر شده، داده‌هایی که از این طریق به دست می‌آیند حاوی کلیشه‌های اجتماعی، نظرات افراطی و توهین‌آمیز یا اشکالات دیگری هستند که به ضرر اقلیت‌ها تمام می‌شود.»

محققان همچنین گفته‌اند با اینکه تا به الان بخش عمده‌ای از نویزها و محتوای ناخواسته در داده‌های موجود حذف شده است؛ اما باز هم نمی‌توان از محتواهای نامناسب از جمله تصاویر هرزه‌نگاری، نژادپرستی و کلیشه‌های آسیب‌زننده اجتماعی مجموعه داده LAION-400M چشم‌پوشی کرد. بنابراین باید برنامه‌ریزی‌ای ترتیب داده شود تا Imagen بتواند جدا از نژادپرستی، سوگیری‌های اجتماعی و در نهایت محدودیت‌های موجود در زبان‌های مختلف، عملکردی متفاوت و عالی را ارائه دهد. قطعا در آینده شاهد پیشرفت و توسعه این قابلیت و همچنین برطرف شدن مشکلات آن خواهیم بود.

بیشتر بخوانید:

نظر شما درمورد هوش‌ مصنوعی Imagen برای تبدیل متن به عکس چیست؟ لطفا نظرات خود را در بخش کامنت‌ها با تکراتو در میان بگذارید.

ارسال برای دوستان در: واتساپ | تلگرام |






ارسال نظر