Nano Banana (Gemini 2.5 Flash Image)
Społecznościowa nazwa dla Google Gemini 2.5 Flash Image - zaawansowanego modelu generowania obrazów AI z precyzyjnym renderowaniem tekstu i wysoką rozdzielczością.
Nano Banana to społecznościowa nazwa dla Google Gemini 2.5 Flash Image - modelu dostępnego przez Gemini App, Gemini API i Vertex AI. To znaczący krok naprzód od poprzednich generacji, przesuwający generowanie obrazów z kategorii “zabawa” do profesjonalnej produkcji zasobów wizualnych.
Kluczowe możliwości
- Renderowanie tekstu: Precyzyjne generowanie tekstu w obrazach
- Spójność postaci: Zachowanie konsystencji wizualnej
- Wysoka rozdzielczość: Output w 4K
- Integracja z wyszukiwarką: Wykorzystuje Google Search do weryfikacji faktów i generowania obrazów opartych na aktualnych danych
Prompt engineering
Model rozumieć nie tylko słowa kluczowe, ale intencje, fizykę i kompozycję. Eksperci zalecają podejście “kreatywnego dyrektora” zamiast “zbioru tagów”, z uwzględnieniem 6 podstawowych czynników: podmiot, kompozycja, akcja, lokacja, styl i instrukcje edycji.
Nano-Banana Pro to model “myślący”, który doskonale radzi sobie ze złożonymi edycjami przez konwersacyjne promptowanie, w tym in-painting, restaurację, koloryzację i zmianę stylu.