Колаж з результатами роботи Gemini. Джерело: Google
Google оголосив про масштабне оновлення інструментів редагування зображень у додатку Gemini. Розроблена командою DeepMind нова модель вже отримала найвищі оцінки в ранніх тестах і доступна всім користувачам Gemini. Модель дозволяє створювати та змінювати фото так, щоб зображені люди чи тварини залишалися впізнаваними та природними.
Місце | Модель | Бал | 95% ДІ (±) | Голосів | Організація | Ліцензія |
---|---|---|---|---|---|---|
1 | gemini-2.5-flash-image-preview (nano-banana) | 1362 | ±2 | 2 521 035 | Пропрієтарна | |
2 | flux-1-kontext-max | 1191 | ±3 | 357 196 | Black Forest Labs | Пропрієтарна |
3 | flux-1-kontext-pro | 1174 | ±2 | 2 015 530 | Black Forest Labs | Пропрієтарна |
3 | gpt-image-1 | 1170 | ±3 | 1 026 399 | OpenAI | Пропрієтарна |
5 | flux-1-kontext-dev | 1152 | ±3 | 1 584 400 | Black Forest Labs | Пропрієтарна |
6 | qwen-image-edit | 1145 | ±2 | 1 585 904 | Alibaba | Apache 2.0 |
6 | seededit-3.0 | 1142 | ±4 | 1 285 080 | Bytedance | Пропрієтарна |
8 | gemini-2.0-flash-preview-image-generation | 1093 | ±3 | 1 700 785 | Пропрієтарна | |
9 | bagel | 1044 | ±5 | 12 774 | Bytedance | Apache 2.0 |
10 | step1x-edit | 1017 | ±4 | 138 399 | StepFun | Apache 2.0 |
Джерело: lmarena.ai
Що змінилося
Нова версія Gemini працює з акцентом на автентичність. Якщо раніше штучний інтелект міг «перекроїти» риси обличчя чи змінити зовнішність під час редагування, то тепер система мінімізує подібні відхилення. Це означає, що друзі на фото виглядатимуть як друзі, а домашні улюбленці — як вони самі, навіть після зміни зачіски, одягу чи оточення.
Gemini навчився:
- переносити людей чи об’єкти в інше середовище без втрати впізнаваності;
- додавати чи замінювати речі та меблі на фото, залишаючи інші елементи без змін;
- застосовувати стиль однієї частини зображення до іншої (наприклад, колір квітів на одязі);
- комбінувати фотографії та створювати цілі нові сцени.
Приклад зміни ролей персонажа. Ілюстрація: Google
Приклади використання
- Сімейні фото: якщо хтось кліпнув очима, алгоритм скоригує лише вираз обличчя.
- Домашні улюбленці: пес із новим ошийником залишиться тим самим улюбленцем, а не «новою породою».
- Модні експерименти: можна приміряти інший одяг чи взуття прямо на фото.
- Ремонт і дизайн: легко уявити, як виглядатиме кімната з новими меблями чи кольором стін.
- Фантазійні сцени: друзі з двору можуть опинитися в Парижі чи на Марсі — і все одно залишаться впізнаваними.
Приклад змішування двох зображень. Ілюстрація: Google
Чому це важливо
Google позиціонує оновлений Gemini як інструмент нового рівня персоналізації та візуального сторітелінгу. Модель відкриває можливості для творчості, онлайн-спілкування та професійної роботи з візуальним контентом — від створення сімейних альбомів до рекламних кампаній.
Приклад поєднання дизайну. Ілюстрація: Google
За словами розробників, усі обчислення виконуються із збереженням приватності користувача, а оновлення є лише першим кроком до ще гнучкіших функцій редагування.
Джерело: Google