گوگل با معرفی نانو بنانا 2 (Nano Banana 2)، ترکیبی از سرعت جمینای فلش و قابلیتهای حرفهای را ارائه کرده و تولید تصویر 4K را سریعتر کرده است.
به گزارش تکراتو و به نقل از androidheadlines، گوگل از مدل جدید تولید تصویر خود با نام نانو بنانا 2 رونمایی کرده است؛ مدلی که سرعت جمینای فلش را با قابلیتهای حرفهای ترکیب میکند.
از مهمترین ارتقاهای این نسخه میتوان به حفظ ثبات سوژه برای حداکثر پنج کاراکتر، بهرهگیری از اطلاعات بهروز وب برای افزایش دقت و پشتیبانی از وضوح 4K اشاره کرد.
در آگوست 2025، گوگل با معرفی نانو بنانا که یک مدل تولید تصویر مبتنیبر هوش مصنوعی بود، بسیاری را غافلگیر کرد و این ابزار بهسرعت وایرال شد.
نانو بنانا 2
اکنون نسخه جدید آن با نام نانو بنانا 2 و بهعنوان بخشی از خانواده جمینای 3.1 فلش ایمیج عرضه شده است. هدف این نسخه جدید، حل یکی از چالشهای همیشگی دنیای فناوری خلاقانه است؛ انتخاب میان کیفیت بالا و سرعت تولید.
در گذشته کاربران برای دستیابی به استدلال پیچیدهتر و جزئیات دقیقتر ناچار بودند از مدلهای حرفهای استفاده کنند که زمان بیشتری برای پردازش نیاز داشتند، یا برای پیشنویسهای سریع به مدلهای سادهتر و کمهوشتر رضایت دهند. نانو بنانا 2 این فاصله را از بین برده و قابلیتهای حرفهای را در قالبی سریعتر و چابکتر ارائه میدهد.
استاندارد تازه در تولید سریع تصاویر هوش مصنوعی
یکی از بزرگترین تغییرات این نسل در نحوه درک جهان توسط مدل است. نانو بنانا 2 تنها به دادههای آموزشی ایستا متکی نیست، بلکه از پایگاه دانش گسترده گوگل و نتایج جستوجوی لحظهای وب نیز بهره میبرد.
این موضوع باعث میشود هوش مصنوعی درک دقیقتری از موضوعات خاص و رویدادهای جاری داشته باشد. این مدل اکنون قادر است اینفوگرافیکهای کاربردی تولید کند، یادداشتهای دستنویس نامرتب را به نمودارهای منظم تبدیل کند و مصورسازی دقیق دادهها را انجام دهد؛ قابلیتی که برای تولیدکنندگان محتوا اهمیت زیادی دارد.
همچنین دقت در پردازش متن بهطور محسوسی افزایش یافته و این ابزار را به گزینهای مناسب برای طراحی نمونههای بازاریابی یا کارتهای تبریک محلیسازیشده تبدیل کرده است؛ جایی که خوانایی اهمیت بالایی دارد.
ثبات کاراکتر و کنترل خلاقانه بیشتر
برای داستاننویسان و طراحان، حفظ ثبات سوژه همواره چالشی جدی بوده است. حفظ شباهت یک کاراکتر در صحنههای مختلف کار آسانی نیست.
نانو بنانا 2 این مشکل را با حفظ شباهت ظاهری تا پنج کاراکتر مختلف و همچنین نگهداشتن جزئیات تا 14 شیء در یک روند کاری برطرف میکند. این ویژگی امکان ساخت روایتها یا استوریبوردهای منسجم را بدون فراموشی ویژگیهای سوژهها فراهم میکند.
علاوه بر این، مدل جدید دستورات پیچیده را با دقت بیشتری دنبال میکند. اگر کاربر نورپردازی خاص یا بافتی ویژه درخواست کند، احتمال تطابق خروجی با تصویر ذهنی او در همان تلاش نخست بسیار بیشتر است.
این مدل همچنین از وضوحهای متنوع از 512 پیکسل برای فایلهای کوچک تا پسزمینههای شفاف 4K پشتیبانی میکند.
تمرکز ویژه بر شفافیت
با نزدیکتر شدن تصاویر تولیدشده توسط هوش مصنوعی به واقعیت، پرسش درباره واقعی بودن محتوا اهمیت بیشتری یافته است. گوگل برای افزایش ایمنی از رویکردی دوگانه در زمینه منشأ محتوا استفاده میکند.
این مدل از فناوری SynthID که یک واترمارک دیجیتال نامرئی است، در کنار استاندارد C2PA Content Credentials بهره میبرد.
این ابزارها فراتر از برچسبگذاری ساده بهعنوان تولیدشده توسط هوش مصنوعی عمل کرده و اطلاعاتی درباره نحوه استفاده از هوش مصنوعی ارائه میدهند. به گفته گوگل، فناوری SynthID تاکنون بیش از 20 میلیون بار مورد استفاده قرار گرفته است.
دسترسی گسترده در اکوسیستم گوگل
نانو بنانا 2 در سراسر اکوسیستم گوگل در حال عرضه است. این مدل اکنون موتور پیشفرض تولید تصویر در اپلیکیشن جمینای محسوب میشود.
همچنین در بخشهای مختلف جستوجوی گوگل از جمله حالت هوش مصنوعی و لنز در بیش از 140 کشور ادغام شده است. توسعهدهندگان نیز میتوانند از طریق جمینای API و AI Studio به این مدل دسترسی داشته باشند.

