وب سایت خبری

اگر تا امروز ساخت عکس با هوش مصنوعی را فقط معادل چند مدل دیفیوژن و خروجی‌های گاهی غیر قابل کنترل می‌دانستید، نانو بنانا (Nano Banana) احتمالاً نگاه شما را عوض می‌کند. گوگل این نام را روی سری مدل‌های بومی تولید و ویرایش تصویر در خانواده جمینای گذاشته است؛ مدلی که هم تولید تصویر از متن را انجام می‌دهد و هم ویرایش تصویر با متن را به شکل مکالمه محور و چند مرحله‌ای پیش می‌برد.

فهرست مطالب

در این راهنما، دقیق و مستند می‌گوییم که نانو بنانا چیست، مدل پرو این هوش مصنوعی دقیقاً چه تفاوتی با مدل معمولی دارد، چرا برای حفظ ثبات شخصیت و محصول مهم است، چطور از آن در جمینای و Google AI Studio استفاده کنید و چطور پرامپت نویسی حرفه‌ای برای این مدل هوش مصنوعی انجام دهید.

نانو بنانا (Nano Banana) چیست؟

نانو بنانا (Nano Banana) نامی است که به نسل جدید مدل‌های تولید و ویرایش تصویر در اکوسیستم هوش مصنوعی Google و خانواده هوش مصنوعی جمینای اطلاق می‌شود. این مدل‌ها با هدف ادغام کامل درک زبان، پردازش تصویر و حفظ زمینه مکالمه طراحی شده‌اند و رویکرد گوگل به تصویرسازی با هوش مصنوعی را یک گام فراتر از ابزارهای سنتی می‌برند.

برخلاف بسیاری از مدل‌های تصویرساز که صرفاً بر تولید یک خروجی ثابت تمرکز دارند، نانو بنانا به عنوان بخشی از یک مدل چندوجهی (Multimodal AI) عمل می‌کند؛ یعنی همان مدلی که متن را می‌فهمد، می‌تواند تصویر بسازد، تصویر موجود را ویرایش کند و تغییرات را در چند مرحله و به صورت پیوسته دنبال کند.

نانو بنانا فقط یک تصویرساز نیست

نکته کلیدی درباره نانو بنانا این است که نباید آن را صرفاً یک مولد تصویر یا Image Generator دانست. این مدل در واقع یک سیستم ویرایش تصویر مبتنی بر پردازش زبان طبیعی است. کاربر می‌تواند به جای کار با ابزارهای پیچیده گرافیکی، تنها با نوشتن دستور متنی، تغییرات مورد نظر را اعمال کند.

این تغییرات می‌توانند شامل موارد زیر باشند:

اصلاح جزئی یک بخش خاص از تصویر
تغییر نور، رنگ یا زاویه دید
جایگزینی یا حذف عناصر مشخص
و حتی تکرار این فرایند در چند مرحله متوالی

جایگاه نانو بنانا در اکوسیستم جمینای

از نظر فنی، نانو بنانا یک هوش مصنوعی ساخت عکس مستقل با رابط جداگانه نیست. این نام به مدل‌های Native Image Generation در جمنای اشاره دارد؛ یعنی مدل‌هایی که تولید و ویرایش تصویر را مستقیماً در هسته مدل زبانی انجام می‌دهند. در این رویکرد، تصویرسازی دیگر یک سرویس جانبی یا موتور جداگانه نیست، بلکه بخشی از توانایی ذاتی مدل زبانی بزرگ (LLM) محسوب می‌شود.

همین یکپارچگی باعث شده نانو بنانا در مواردی مثل:

ویرایش مکالمه محور
حفظ ثبات شخصیت، محصول یا برند
ادغام چند تصویر مرجع
و ویرایش چندمرحله‌ای هدفمند

عملکردی متفاوت و دقیق‌تر نسبت به بسیاری از ابزارهای تصویرساز رایج داشته باشد.

نانو بنانا چگونه تصویر را ویرایش می‌کند؟

نانو بنانا بر پایه ویرایش تصویر مبتنی بر متن (Text-based Image Editing) کار می‌کند. کاربر یک دستور متنی ارائه می‌دهد و در صورت نیاز، یک یا چند تصویر مرجع را نیز وارد می‌کند. مدل با درک دستور و زمینه قبلی مکالمه، تصویر را تولید یا اصلاح می‌کند. مزیت مهم این روش، حفظ زمینه است. مدل می‌فهمد چه چیزی باید تغییر کند و چه چیزی نباید تغییر کند. به همین دلیل، دستورهایی مانند پس زمینه را تاریک‌تر کن، اما چهره و حالت نور روی سوژه ثابت بماند برای نانو بنانا قابل درک و اجرا هستند.

تاریخچه نانو بنانا

نانو بنانا به صورت رسمی به عنوان یک محصول مستقل معرفی نشد. این مفهوم هم زمان با توسعه مدل‌های چندوجهی جمنای و تمرکز گوگل بر تولید و ویرایش تصویر بومی درون LLM در سال‌های ۲۰۲۴ و ۲۰۲۵ شکل گرفت. با عرضه مدل‌های تصویری جمنای مانند نسخه‌های Flash و Pro، این توانایی‌ها به تدریج در اختیار کاربران قرار گرفت و در میان توسعه دهندگان و کاربران حرفه‌ای با نام «Nano Banana» شناخته شد.

در واقع، نانو بنانا حاصل تغییر نگاه گوگل از «ساخت تصویر» به سمت ویرایش هوشمند، مکالمه محور و مبتنی بر زبان طبیعی است؛ مسیری که به احتمال زیاد، پایه اصلی ابزارهای خلاقانه آینده گوگل را تشکیل خواهد داد.

نانو بنانا پرو گوگل (Nano Banana Pro) چیست؟

Nano Banana Pro نسخه پیشرفته‌تر و کنترل پذیرتر نانو بنانا است که روی نسل جدیدتر مدل‌های تصویری جمنای بنا شده و برای خروجی‌های حرفه‌ای‌تر طراحی شده است. در صفحات رسمی «گوگل دیپ مایند»، Nano Banana Pro به عنوان مدل تصویر ساخت و ویرایش با دقت استودیویی معرفی می‌شود و تمرکز ویژه‌ای روی تولید متن خوانا داخل تصویر و کنترل‌های دقیق‌تر در ادیت دارد. برای دسترسی به این مدل پیشرفته باید اشتراک‌های پولی جمنای را تهیه کنید. البته در دیجیاتو مطلبی برای فعالسازی گوگل ا نترپرایز (Enterprise) داریم که می‌توانید برای دسترسی به این مدل تصویرساز از آن استفاده کنید.

تفاوت نسخه Pro با نسخه معمولی

با استناد به توضیحات رسمی گوگل، مهم‌ترین تفاوت‌ها این‌ها هستند:

رندر متن داخل تصویر با کیفیت بالاتر (Text Rendering): برای پوستر، نمودار، دیاگرام و هر چیزی که متن باید واقعاً خوانا باشد.
کنترل‌های حرفه‌ای‌تر در ادیت: مثل کنترل بهتر روی نور، زاویه دوربین، فوکوس و فرمت خروجی.
سهمیه و دسترسی متفاوت: کاربران رایگان معمولاً سهمیه محدودتری در Pro دارند و بعد از اتمام سهمیه، به مدل معمولی برمی‌گردند.

مناسب چه کسانی است؟

طراحان گرافیک و UI/UX: وقتی به خروجی تمیز، قابل تکرار و کنترل پذیر نیاز دارید.
تولیدکننده‌های محتوا و مارکتینگ: برای ساخت چند نسخه از یک کمپین با «ثبات محصول/کاراکتر» و ادیت چند مرحله‌ای.
توسعه دهنده‌ها: برای ادغام در ابزارها، سرویس‌ها و گردش کار (Workflow) از طریق Google AI Studio و Gemini API.

مهم‌ترین ویژگی‌ها و مزایای نانو بنانا

نقطه قوت اصلی نانو بنانا در شیوه تعامل با تصویر است. گوگل با این مدل تلاش کرده فاصله بین زبان انسانی و ویرایش بصری را از بین ببرد. نتیجه، سیستمی است که تصویر را مثل یک گفت و گو می‌فهمد، تغییرات را به خاطر می‌سپارد و در چند مرحله، دقیق‌تر می‌شود. در این بخش، مهم‌ترین ویژگی‌ها و مزایایی را می‌خوانید که نانو بنانا را به یک ابزار متمایز در اکوسیستم جمنای تبدیل کرده‌اند.

ویرایش مکالمه محور (Conversation-based Editing)

نانو بنانا برای «ادیت تک شات» ساخته نشده؛ نقطه قوت این است که شما می‌توانید مثل یک گفت و گو، مرحله به مرحله تغییر بدهید، خروجی را ببینید و دقیق‌تر کنید. گوگل در معرفی Gemini 2.5 Flash Image (که با نام nano-banana هم شناخته می‌شود) روی ترنسفورم هدفمند با پردازش زبان طبیعی (NLP) و گردش کار چند مرحله‌ای تاکید می‌کند.

حفظ ثبات شخصیت و محصول (Character / Brand Consistency)

یکی از ویژگی‌هایی که هم در Google AI Studio و هم در منابع رسمی دیپ مایند برجسته شده، توانایی ثابت نگه داشتن چهره، لباس، سبک و هویت کاراکتر یا محصول در چند تصویر است.

ادغام چند تصویر و ویرایش چند مرحله‌ای

نانو بنانا می‌تواند چند تصویر مرجع را بگیرد و ترکیب کند یا از آنها برای ادیت استفاده کند. در معرفی رسمی Gemini 2.5 به «blend multiple images» و «targeted transformations» اشاره می‌کند.

سرعت بالا برای تکرارهای زیاد

برای بسیاری از سناریوهای تولید محتوا، سرعت یعنی امکان آزمون و خطای بیشتر. نانو بنانا به عنوان مدل Flash برای چرخه‌های سریع طراحی شده.

متن داخل تصویر (ویژگی شاخص نسخه Pro)

اگر تجربه تان از مدل‌های تصویرساز این بوده که متن همیشه خراب می‌شود، نسخه Pro دقیقاً همین نقطه را هدف گرفته است: «Generate clear text» در صفحه رسمی Nano Banana Pro صریحاً آمده و یکی از تمایزهای کلیدی است.

چرا نانو بنانا متمایز است؟

جمع بندی فنی تمایز نانو بنانا نسبت به بسیاری از رقبا این است که مدل تصویر بومی یک LLM چندوجهی است؛ یعنی همان اکوسیستمی که زبان را می‌فهمد، تصویر را هم تولید و ویرایش می‌کند و شما را به یک ورک‌فلو مکالمه‌ای می‌رساند.

جدول مقایسه: نانو بنانا در برابر مدل‌های رایج تصویرساز

این جدول برای تصمیم گیری سریع است؛ جزئیات کیفیت خروجی در عمل به نوع پرامپت و دیتای مرجع هم وابسته است.

معیار	نانو بنانا (Gemini 2.5 Flash Image)	نانو بنانا پرو (Gemini 3 Pro Image)	Midjourney / Stable Diffusion / DALL·E / Firefly (کلی)
ادیت مکالمه ای چند مرحله ای	بسیار قوی	بسیار قوی + کنترل بیشتر	بسته به ابزار/رابط؛ گاهی نیازمند ترفند و رندر مجدد
ثبات کاراکتر/محصول	نقطه قوت	نقطه قوت (برای کارهای دقیق‌تر)	در برخی مدل‌ها خوب است، اما وابسته به روش و تنظیمات
متن داخل تصویر	معمولاً متوسط	یکی از مزیت‌های اصلی	اغلب چالش برانگیز (در بسیاری از مدل‌ها)
دسترسی برای توسعه دهنده	Google AI Studio + Gemini API	Google AI Studio + Gemini API	بسته به سرویس؛ برخی متن باز/برخی تجاری
یکپارچگی با ابزارهای طراحی	در اکوسیستم گوگل	علاوه بر گوگل، در همکاری‌های رسمی هم دیده می‌شود	Firefly/Photoshop یکپارچگی قوی دارد

کاربردهای نانو بنانا در دنیای واقعی

نانو بنانا زمانی ارزش واقعی خود را نشان می‌دهد که از فضای آزمایش و سرگرمی خارج شود و وارد سناریوهای واقعی تولید، طراحی و کسب و کار شود. مزیت اصلی این مدل، نه در «ساخت یک تصویر جذاب»، بلکه در کنترل پذیری، تکرارپذیری و حفظ زمینه در طول فرایند تولید است؛ چیزی که در پروژه‌های واقعی اهمیت حیاتی دارد. در ادامه، کاربردهای نانو بنانا را از زاویه استفاده عملی و حرفه‌ای بررسی می‌کنیم.

تولید و ویرایش تصاویر با دستور متنی در پروژه‌های واقعی

در بسیاری از پروژه‌های واقعی، تصویر از صفر ساخته نمی‌شود، بلکه بارها و بارها اصلاح می‌شود. نانو بنانا دقیقاً برای همین سناریو طراحی شده است. شما می‌توانید یک تصویر اولیه بسازید و سپس در چند مرحله، با دستورهای متنی دقیق، آن را اصلاح کنید؛ بدون این که هویت کلی تصویر از بین برود.

این رویکرد در پروژه‌هایی مثل طراحی پوستر، بنر تبلیغاتی، تصاویر آموزشی یا محتوای شبکه‌های اجتماعی بسیار کاربردی است. به جای این که هر بار تصویر جدیدی تولید شود، همان خروجی قبلی به تدریج به نسخه نهایی نزدیک می‌شود. این یعنی صرفه جویی در زمان، کاهش آزمون و خطا و کنترل بیشتر روی نتیجه.

استفاده از نانو بنانا در طراحی گرافیک و تولید محتوا

برای طراحان گرافیک و تولیدکنندگان محتوا، نانو بنانا بیشتر شبیه یک دستیار خلاق هوشمند عمل می‌کند تا یک ابزار جایگزین. این مدل می‌تواند در مراحل اولیه ایده پردازی، ساخت نسخه‌های مختلف از یک طرح و حتی اصلاح‌های نیمه نهایی نقش مؤثری داشته باشد.

به عنوان مثال، در طراحی یک کمپین محتوایی، می‌توان چند نسخه از یک تصویر با نور، زاویه یا فضای متفاوت تولید کرد و سپس بهترین گزینه را برای ادامه کار انتخاب کرد. نکته مهم این است که نانو بنانا می‌تواند «سبک بصری» را حفظ کند؛ یعنی خروجی‌ها حس یکپارچگی دارند و پراکنده یا تصادفی به نظر نمی‌رسند.

کاربردهای نانو بنانا برای کسب و کارها و برندها

در فضای کسب و کار، سرعت و ثبات دو عامل کلیدی هستند. نانو بنانا به برندها اجازه می‌دهد تصاویر محصول، بنرهای تبلیغاتی و محتوای بصری را با هویت ثابت و در زمان کوتاه تولید کنند. این موضوع به ویژه برای فروشگاه‌های آنلاین، تیم‌های دیجیتال مارکتینگ و استارتاپ‌ها اهمیت دارد.

برای مثال، یک فروشگاه اینترنتی می‌تواند از یک تصویر محصول، چندین خروجی متفاوت برای موقعیت‌های مختلف بسازد؛ یکی برای صفحه محصول، یکی برای شبکه‌های اجتماعی و یکی برای تبلیغات. همه این خروجی‌ها از نظر ظاهر محصول و سبک بصری هماهنگ باقی می‌مانند، بدون این که نیاز به طراحی جداگانه برای هر کدام باشد.

نقش نانو بنانا در نمونه سازی سریع (Rapid Prototyping)

در بسیاری از پروژه‌ها، هدف نهایی تصویر نیست؛ بلکه نمایش ایده است. نانو بنانا در این جا نقش مهمی در نمونه سازی سریع ایفا می‌کند. طراح یا تیم محصول می‌تواند خیلی سریع، ایده‌های بصری مختلف را امتحان کند و بازخورد بگیرد، بدون این که وارد جزئیات زمان بر ابزارهای سنتی شود.

این کاربرد به ویژه برای تیم‌های استارتاپی، طراحان UI/UX و حتی ارائه‌های مدیریتی بسیار ارزشمند است، چون تصمیم گیری بصری را سریع‌تر و شفاف‌تر می‌کند.

مقایسه کاربرد نانو بنانا با فتوشاپ در عمل

در دنیای واقعی، نانو بنانا جایگزین کامل فتوشاپ نیست و قرار هم نیست باشد. تفاوت اصلی در نوع استفاده است. فتوشاپ ابزار کنترل دقیق و پیکسل محور است؛ مناسب زمانی که خروجی نهایی باید کاملاً آماده چاپ یا انتشار حرفه‌ای باشد. نانو بنانا اما در مرحله قبل از آن می‌درخشد؛ جایی که ایده پردازی، اصلاح سریع و تولید چند نسخه اهمیت دارد.

به همین دلیل، بهترین سناریو استفاده از نانو بنانا در کنار فتوشاپ است. نانو بنانا تصویر را به سطح مطلوب می‌رساند و فتوشاپ آن را نهایی می‌کند. این ترکیب، هم سرعت را بالا می‌برد و هم کیفیت نهایی را حفظ می‌کند.

چطور از نانو بنانا استفاده کنیم؟ (راهنمای عملی)

چون رابط کاربری جمنای بر اساس کشور، حساب یا نسخه ممکن است تغییر کند، در این بخش از راهنمای اصلی گوگل به شما آموزش می‌دهیم.

ورود و دسترسی به Nano Banana

وارد هوش مصنوعی جمنای به آدرس gemini.google.com شوید.
از منوی ابزارها، گزینه Create images را انتخاب کنید.
در انتخاب مدل، حالت Fast معمولاً برای Nano Banana است و حالت Thinking معمولاً برای Nano Banana Pro است.

محیط کاربری و نحوه کار

یک باکس پرامپت دارید.
می‌توانید تصویر مرجع آپلود کنید (اختیاری).
با وارد کردن پرامپت، بعد از مدتی خروجی تولید می‌شود و شما همان جا با پیام بعدی آن را اصلاح می‌کنید (ادیت مکالمه‌ای).

اولین پرامپت و تولید تصویر (نمونه ساده)

برای نمونه می‌توانید از پرامپت ساده زیر استفاده کنید و خروجی را ببینید:

یک تصویر تبلیغاتی از یک فنجان قهوه روی میز چوبی، نور صبح، سبک واقع گرایانه، کادر 3:2، بدون متن.

یک تصویر تبلیغاتی از یک فنجان قهوه روی میز چوبی، نور صبح، سبک واقع گرایانه، کادر 3:2، بدون متن.

پرامپت نویسی حرفه‌ای برای نانو بنانا

قدرت واقعی نانو بنانا زمانی مشخص می‌شود که پرامپت‌ها هدفمند، مرحله بندی شده و دقیق نوشته شوند. این مدل برای تعامل یک مرحله‌ای ساخته نشده است؛ بلکه برای گفت و گویی پیوسته که در آن تصویر به مرور اصلاح و تکامل پیدا می‌کند. به همین دلیل، پرامپت نویسی در نانو بنانا بیشتر شبیه «هدایت یک فرایند خلاقانه» است تا صدور یک دستور ساده.

اگر با مفهوم پرامپت یا اصول پرامپت نویسی آشنایی ندارید، پیشنهاد می‌کنیم به مقاله پرامپت چیست از دیجیاتو نگاهی داشته باشید.

ساختار استاندارد پرامپت در Nano Banana

پرامپت مؤثر در نانو بنانا باید ساختار داشته باشد. این مدل به دلیل اتصال مستقیم به مدل زبانی در اکوسیستم Google Gemini، توانایی درک هم زمان «خواسته»، «زمینه» و «محدودیت» را دارد. اگر این عناصر به صورت شفاف بیان نشوند، خروجی هم مبهم خواهد بود.

در یک پرامپت استاندارد، ابتدا هدف مشخص می‌شود، سپس سوژه و فضای بصری توصیف می‌شوند و در نهایت، مواردی که نباید تغییر کنند یا محدودیت‌های خروجی ذکر می‌شوند. این ساختار به مدل کمک می‌کند تصویر را دقیقاً در چارچوب خواسته شما تولید یا ویرایش کند.

یک تصویر واقع گرایانه از یک لپ تاپ روی میز چوبی بساز. نور طبیعی صبح از سمت چپ وارد شود. پس زمینه ساده و مینیمال باشد. نسبت تصویر ۱:۱. هیچ متنی داخل تصویر نباشد.

یک تصویر واقع گرایانه از یک لپ تاپ روی میز چوبی بساز. نور طبیعی صبح از سمت چپ وارد شود. پس زمینه ساده و مینیمال باشد. نسبت تصویر ۱:۱. هیچ متنی داخل تصویر نباشد.

پرامپت حفظ ثبات شخصیت یا محصول

یکی از مهم‌ترین تفاوت‌های نانو بنانا با بسیاری از تصویرسازهای هوش مصنوعی، توانایی حفظ ثبات در خروجی‌های متعدد است. اما این ثبات فقط زمانی اتفاق می‌افتد که ویژگی‌های هویتی به صورت دقیق و بدون ابهام در پرامپت تعریف شوند.

در این نوع پرامپت، شما در واقع قوانین ثابت را برای مدل تعیین می‌کنید. هرچه این قوانین شفاف‌تر باشند، تصویر در خروجی‌های بعدی کمتر دچار تغییر ناخواسته می‌شود.

این کاراکتر را در تمام تصاویر ثابت نگه دار: مرد ۳۰ ساله، موهای کوتاه مشکی، ته ریش، کت چرمی مشکی. فرم صورت، رنگ پوست و لباس تغییر نکند. فقط محیط اطراف را تغییر بده.

این کاراکتر را در تمام تصاویر ثابت نگه دار: مرد ۳۰ ساله، موهای کوتاه مشکی، ته ریش، کت چرمی مشکی. فرم صورت، رنگ پوست و لباس تغییر نکند. فقط محیط اطراف را تغییر بده.

پرامپت ویرایش چندمرحله‌ای تصویر

نانو بنانا برای اعمال تغییرات تدریجی طراحی شده است. به جای این که چندین تغییر بزرگ را در یک دستور بنویسید، بهتر است هر تغییر را در یک مرحله جداگانه انجام دهید. این کار باعث می‌شود مدل دقیق‌تر عمل کند و کنترل شما روی خروجی افزایش پیدا کند.

ویرایش چندمرحله‌ای به شما اجازه می‌دهد بعد از هر تغییر، نتیجه را بررسی کنید و در صورت نیاز مسیر را اصلاح کنید؛ درست مثل کار با یک طراح واقعی.

پرامپت ادغام چند تصویر

در بسیاری از سناریوهای حرفه‌ای، تصویر نهایی‌ترکیبی از چند منبع مختلف است. نانو بنانا می‌تواند چند تصویر مرجع را دریافت کند، اما برای رسیدن به نتیجه مطلوب، باید نقش هر تصویر به روشنی مشخص شود.

در این نوع پرامپت، بهتر است دقیقاً توضیح دهید کدام تصویر پایه است، کدام تصویر به آن اضافه می‌شود و چه عناصری نباید تغییر کنند. هرچه این توضیحات شفاف‌تر باشند، نتیجه طبیعی‌تر خواهد بود.

تصویر اول را به عنوان پس زمینه استفاده کن. محصول موجود در تصویر دوم را با همان زاویه و نور، روی میز تصویر اول قرار بده. سایه طبیعی زیر محصول اضافه کن. سایر بخش های تصویر تغییر نکنند.

تصویر اول را به عنوان پس زمینه استفاده کن. محصول موجود در تصویر دوم را با همان زاویه و نور، روی میز تصویر اول قرار بده. سایه طبیعی زیر محصول اضافه کن. سایر بخش های تصویر تغییر نکنند.

نمونه پرامپت‌های کاربردی برای استفاده واقعی

در استفاده‌های واقعی، پرامپت باید مستقیماً به هدف پروژه اشاره کند. نانو بنانا در این سناریوها زمانی بهترین عملکرد را دارد که بداند تصویر برای چه کاربردی تولید می‌شود.