Блог

Midjourney v5 вийшов, результат буде виглядати фотореалістично

20/3/23

Нещодавно вийшла нова версія генератора зображень зі штучним інтелектом від Midjourney - Midjourney V5. Це вже друга модель глибокого навчання, над якою працювали п'ять місяців. Нова модель здатна створювати захоплюючі зображення на основі текстових підказок.

Midjourney V5 — це диво, здатне здійснювати значні покращення у розумінні мови, точності та стилістичній гнучкості. Розробники говорять, що ця модель характеризується більшим мозком, знаннями, розумінням та кращим слухом порівняно з попередником.

В новій моделі використовується зовсім інша нейронна архітектура та нові естетичні прийоми.

Ця версія дійсно творить дива, навіть якщо це поки що лише альфа-тест. Можете спробувати самі і переконатися в цьому!

Midjourney V5 вийшла - але як нею користуватися?

На курсі ви знайдете докладні інструкції щодо запуску та використання цієї генеративної нейронної мережі для створення творів мистецтва.

Якщо ви ще не знайомі з Midjourney, раджу спершу ознайомитися з цією статтею.

У вас може виникнути питання: як додати нову модель V5 у свій робочий процес? Є два способи: ви можете набрати "/settings" у будь-якому каналі #newbies Discord, а потім вибрати "MJ version 5".

Або - якщо ви хочете спочатку спробувати - просто додайте параметр "--v 5" в кінці вашого запиту.

Оновлення зосереджені на збільшенні зручності користування

Однією з найбільших змін, яку користувачі Midjourney чекали з нетерпінням, була відсутність шестиніжок.

У новій моделі ви помітите менше хаотичних згустків. Вона значно краще володіє знаннями про те, як поводитися з кінцівками.

Крім того, V5 має кращу генерацію обличчя та очей, включаючи найдрібніші деталі.

Нижче ми провели кілька тестів на створення портретів, і дійсно, вони виглядають дуже добре.

Деякі експерименти з реалістичними портретами.

Хоча це не справжні люди, це все одно дивно, чи не так? Але не все бездоганно.

Наприклад, на зображенні з моделлю, яка робить селфі в дзеркалі, зверніть увагу на серйозні проблеми з відображеннями. Новий генератор мистецтва дійсно вміє рахувати до п'яти, створюючи пальці.

Фотореалізм

Модель V5 може створювати набагато реалістичніші зображення. Якщо ви не вказуєте художній стиль, ім'я художника або медіа-джерело, ви отримаєте системні налаштування за замовчуванням, і результат буде виглядати повністю фотореалістично.

Щоб налаштувати те, як Midjourney читає ваш текстовий опис, додайте в кінець підказки параметр "stylize N" (де N змінюється від 0 (min) до 1000 (max)). Чим менше значення, тим менше стиль будинку ШІ впливатиме на кінцеву картинку.

Midjourney V5 має підвищену цілісність. Деталі згенерованих об'єктів з більшою ймовірністю вийдуть правильними, а також V5 дуже швидко реагує на ваші дії.

У версії V5 розробники пропонують писати речення, а не списки, і використовувати більш чіткий текст, що описує те, чого ви хочете.

Зображення в стилі Вінсента Ван Гога.

Висока деталізація та покращена продуктивність

Здається, що Midjourney тепер може давати більш контрольовані та прогнозовані результати. Водночас це покращення означає, що ним може бути важче користуватися. Короткі підказки можуть більше не працювати так добре, як раніше. У V5 розробники пропонують писати речення, а не списки, і використовувати більш чіткий текст, який описує те, що ви хочете. Подумайте про це як про дуже короткий твір, який час від часу нам усім доводилося складати в школі.

Зліва: старий вихід з V4. Праворуч: результат того самого запиту в новому V5.

Інші співвідношення сторін

У Midjourney 5-тої версії роздільна здатність збільшена вдвічі, і тепер можна створювати зображення роздільною здатністю до 1024x1024. Зверніть увагу, що кнопка "збільшити" у цій моделі працює по-іншому. Всі отримані вами зображення мають максимальну якість, тому ця кнопка просто відокремлює ваше попередньо збільшене зображення від сітки. У майбутньому з'явиться можливість генерувати зображення роздільною здатністю 2048x2048.

Ще одним цікавим оновленням є ширші можливості вибору співвідношення сторін. Раніше користувацькі співвідношення не підтримувалися. У новій моделі ви можете створювати набагато ширші або набагато вужчі розміри полотна та спробувати будь-яке співвідношення сторін, яке вам подобається. Також досягнення до кінотеатрального формату стали доступними у Cinemascope!

Зображення створене шляхом додавання «–ar 21:9» до підказки

Вагу зображень повернули

У новій версії Midjourney повернулася функція зважування зображень. Якщо ви використовуєте фотографію або зображення як посилання, тепер ви можете збільшувати його вагу за допомогою параметра "iw N", де N варіюється від 0,5 до 2,0. Наприклад, я завантажив фотографію Джеймі Лі Кертіс (https://www.imdb.com/name/nm0000130/), яка минулого тижня отримала Оскар за найкращу роль другого плану, в бота Midjourney та попросив його уявити її прекрасною інопланетянкою з іншої планети. Я також вказав "iw 1.0", щоб ми все ще могли впізнати актрису. Ось один з результатів, який видав штучний інтелект:

Зображення на основі фотографії Джеймі Лі Кертіс

Midjourney V5: основні проблеми

  • Користувачам попередніх версій Midjourney потрібно знову навчатися створювати підказки. Це важлива річ, яку слід пам'ятати. У Discord відбувається багато експериментів, учасники спільноти намагаються з'ясувати, як правильно формулювати запити до моделі V5.
  • Деякі користувачі відзначають, що V5 працює трохи повільніше, ніж V4, що не дивує, оскільки якість і деталізація підвищилися.
  • Сервери можуть бути перевантажені, тому будьте обережні. Можливо, допоможе платна підписка, яка дозволить спілкуватися з ботом Midjourney напряму. Або просто запасіться терпінням.

Висновок щодо Midjourney

Midjourney V5 знаходиться в альфа-тесті та все ще може бути змінено у фінальній версії. Проте те, на що вона вже здатна, може означати, що майбутнє наступило трохи раніше, ніж очікувалося.

Усі статті