Самые интересные нейросети: топ-14 сервисов для раскрашивания изображений, генерации текста и не только

Списки и рейтинги 20 января 2023

Полина Соломенцева

Редактор отдела интервью и лонгридов

Полина Соломенцева

Нейросети — далеко не новое явление, но в 2022 году эта сфера привлекла особое внимание как СМИ, так и инвесторов. Только за прошлый год в приложения, которые генерируют контент с помощью ИИ, было вложено не меньше $1,37 млрд — это больше чем за все предыдущие пять лет вместе взятые.

На сегодняшний день самые яркие и интересные нейросети открывают абсолютно новые горизонты для творчества и развлечения. Некоторые — генерируют изображения, с помощью других эти изображения можно озвучивать или анимировать.

В этой статье редакция RB собрала подборку нейросетей, с которыми будет интересно поэкспериментировать и оценить масштаб «наступившего будущего».

Подписаться на RB.RU в Telegram

Содержание:

DALL-E 2;
Stable Diffusion;
Midjourney;
Gnod;
Autodraw;
ThisPersonDoesNotExist;
Ostagram;
GauGAN;
«Балабоба»;
Colorize;
Deep Nostalgia;
Sketch Metademolab;
Riffusion;
Guess the Line.

DALL-E 2

Открывает наш топ интересных нейросетей нашумевшая DALL-E 2. Эта программа была анонсирована в апреле 2022 года, разработчиком выступила исследовательская лаборатория искусственного интеллекта OpenAI.

Что умеет:

Генерировать изображения по текстовому описанию на английском языке;
«Дорисовать» картину, расширив изображение за его исходные пределы;
Вносить изменения, добавляя объекты;
Создавать несколько вариантов похожих изображений на основе оригинала.

Как пользоваться: чтобы получить доступ к DALL-E 2, нужно пройти регистрацию через электронную почту, а затем подтвердить номер телефона.

Возможности DALLE-2

Стоит отметить, что нейросеть не работает на территории России. То есть для работы из России потребуется VPN (список качественных VPN-сервисов можно посмотреть здесь), а также купить номер телефона страны для подтверждения (например, здесь).

В первый месяц доступно 50 кредитов, одна операция (например, генерация изображения по запросу) стоит один кредит. Каждый последующий месяц пользователю доступны 15 кредитов.

Если нет желания включать VPN и настраивать иностранный номер, можно протестировать российскую DALL-E от от SberDevices и Sber AI. Российская программа не требует регистрации, бесплатна и генерирует изображения по запросу на русском и других языках.

Генерация Kandinsky по запросу «Собака в самолете пьет шампанское»

Stable Diffusion

Нейросеть Stable Diffusion достаточно популярна за счет качества и реалистичности сгенерированных изображений и точно входит в список бесплатных нейросетей, которые стоит попробовать.

Stable Diffusion — это ПО с открытым исходным кодом, его релиз состоялся в 2022 году. В разработке приняли участие группа компаний CompVis, Runway, EleutherAI и LAION.

Что умеет: генерировать изображения по текстовому описанию на английском языке.

Как пользоваться: сервис представляет собой классический веб-сайт с кратким описанием функций и полем для описания изображения. Достаточно ввести нужный текст или воспользоваться предложенными вариантами и нейросеть меньше чем за минуту сгенерирует четыре варианта изображения.

Генерация Stable Diffusion по запросу «Собака сидит в самолете и пьет шампанское»

Stable Diffusion не требует регистрации и полностью бесплатна. Обратите внимание, что из-за высокой популярности сервис может выдавать ошибку при генерации изображения — возможно попытку придется повторить несколько десятков раз.

Midjourney

Midjourney входит в тройку самых популярных нейросетей для генерации изображений. Автор программного обеспечения — научный сотрудник NASA и основатель Leap Motion Дэвид Хольц, проект стал доступен широкому кругу пользователей в июле 2022 года.

Что умеет:

Генерировать изображения по текстовому описанию на английском языке;
Объединять несколько изображений в одно;
Создавать аватары в разных стилях.

Как пользоваться: сейчас нейросеть доступна в виде чат-бота в Discord, поэтому, чтобы начать ей пользоваться, потребуется зайти в свой аккаунт или завести новый.

Генерация MidJourney по запросу «Собака сидит в самолете и пьет шампанское»

После входа в Discord нужно нажать на кнопку «Присоединиться к бета-версии» на сайте нейросети — сайт автоматически перенаправит на нужный канал. Обратите внимание, что бот по умолчанию публичный и другие пользователи также будут видеть ваши изображения (при желании бота можно добавить на личный сервис).

Картинки генерируются в специальных комнатах Newcomer rooms — нужно выбрать любую и перейти в чат.

Следующие шаги:

В поле ввода указать /setting, нажать Enter — базовые настройки уже будут применены по умолчанию;
В поле ввода указать /imagine, нажать Enter — написать любое слово на английском языке — отправить в чат;
Принять настройки.

После этих шагов пользователь может начать генерировать собственные изображения. Каждому новому юзеру выдается 25 бесплатных кредитов — один кредит на один запрос.

У бота большое количество команд и программ, полное руководство стоит изучить на сайте нейросети в специальном разделе.

Gnod

Gnod — проект немецкого специалиста по искусственному интеллекту Марека Гибни. Сам создатель описал его как самообучающуюся систему рекомендаций, которая «общается с каждым, кто заходит на сайт, пытаясь понять его картину мира». Gnod точно входит в список нейросетей, которые отлично подойдут для досуга.

Сервис специализируется на четырех основных направлениях — фильмах, изобразительном искусстве, литературе и музыке, и на основе уже знакомых и любимых подбирает похожие, новые для пользователя лица и произведения.

Что умеет:

Gnod Music рекомендует музыкальных исполнителей;
Gnod Art рекомендует художников;
Gnod Literature рекомендует авторов;
Gnod Movies рекомендует фильмы;
Gnod Search помогает сравнивать поисковые системы.

Как пользоваться: интерфейс сервиса полностью на английском языке. Для начала пользователю нужно выбрать интересующую его сферу — допустим, фильмы. После этого потребуется ввести три любимых фильма, на их основе нейросеть предложит кинокартину. Если ответ Gnod не устроил пользователя, можно нажать «мне не нравится» и она выдаст новую рекомендацию.

Обратите внимание, что могут возникнуть проблемы с десктопной версией сайта, рекомендуем пользоваться мобильной версией.

Imaginary soundscape

Imaginary soundscape — нейросеть от команды ученых Токийского университета, разработанная в 2018 году. Проект можно описать как звуковую инсталляцию, где зрители могут передвигаться по Google Street View и погружаться в воображаемые звуковые ландшафты, созданные с помощью моделей глубокого обучения.

Что умеет:

Озвучивать случайное место на земле на Google Map;
Озвучивать изображения.

Как пользоваться: чтобы озвучить изображение, достаточно загрузить его в соответствующее окно на сайте — в базе нейросети более 52 тысяч звуков.

При открытии Google Street View пользователь попадает на случайную точку на карте — редактор RB в первый раз очутилась на улочке Камбоджи, а во второй раз — на службе в кафедральном соборе. После этого можно остаться на локации и исследовать ее, переключиться на случайную новую или вбить в поисковую строку нужное место.

Autodraw

Инструмент для рисования Autodraw был разработан Дэном Мотценбекером и Кайлом Филлипсом в Google Creative Lab. Как заявлено на сайте самого проекта, «он сочетает машинное обучение с рисунками талантливых художников, чтобы помочь каждому создавать что-то креативное».

Что умеет: дорисовывает и преображает изначальный рисунок пользователя.

Как пользоваться: интерфейс сервиса напоминает упрощенный Paint. Из кнопок есть кисть, автокисть, текст, заполнение, фигуры и выбор цвета. Пользователь выбирает автокисть и начинает рисовать фигуру — программа автоматически пытается «угадать», что имеет в виду юзер, и предлагает похожие готовые фигурки.

Рисунок на Autodraw

Готовые фигуры можно двигать, перекрашивать, закрашивать, менять в размере и создавать из них цельные изображения. Пожалуй, главный минус этой программы — в ней не предусмотрен ластик.

ThisPersonDoesNotExist

Самые интересные нейросети иногда бывают еще и одними из самых пугающих. Сайт разработчика Uber Филиппа Ванга ThisPersonDoesNotExist точно можно отнести к последним.

Что умеет: раз в несколько секунд генерирует человеческое лицо, картину, лошадь, кошку или химическую решетку.

Как пользоваться: на сайте нет кнопок, разделов и тому подобного — по умолчанию, когда пользователь открывает сервис, он видит только сгенерированное человеческое лицо. Лицо человека, которого в реальной жизни не существует. Чтобы сгенерировать новое — нужно просто обновить страницу.

Коллаж из сгенерированных лиц нейросетью ThisPersonDoesnotExist

В нижнем углу при посещении сайта появится всплывающее окно — в нем можно будет перейти на генератор картин, кошек, лошадей, химических решеток или изучить исходный код на GitHub.

Ostagram

Ostagram — достаточно популярный сервис для обработки изображений. Программа работает на основе сверточных нейронных сетейCпециальная архитектура искусственных нейронных сетей, нацеленная на эффективное распознавание образов. Входит в состав технологий глубокого обучения и алгоритма художественного стиля Леона Гатиса, Александра Эккера и Матиаса Бетге.

Что умеет: объединяет стили двух разных изображений и генерирует на их основе одно новое.

Как пользоваться: для обработки своих изображений потребуется пройти регистрацию. Далее в разделе «Изображения» нужно загрузить картинку для обработки (за раз можно обработать до 10 штук), а затем выбрать один из предложенных фильтров или добавить свой вариант. Дополнительно можно регулировать масштаб и вес стиля — от этого зависит глубина наложения фильтра.

Обработка фото в Ostagram

Бесплатная обработка фотографии занимает от одной до нескольких минут. Есть платная версия, которая позволяет ускорить процесс и получить качество в HD.

Посмотреть работы других пользователей можно в ленте сервиса.

GauGAN

Нейросеть GauGAN — проект американской технологической компании NVIDIA. Первую версию компания представила еще в 2019 году, вторую презентовала в 2021. Чтобы выдавать качественным результат, нейросеть была натренирована на 10 миллионах фотографий видов природы.

Что умеет:

Генерирует изображения по текстовому запросу;
Генерирует изображения на основе эскиза.

Как пользоваться: если пользователь хочет получить сгенерированное изображение по текстовому запросу, нужно выполнить следующие действия:

Принять условия и положения внизу страницы (без этого будет невозможно выполнять какие-либо действия);
В Input visualization выбрать все варианты;
В Input utilization выбрать только «текст»;
В строке ввода текста на английском языке (весь интерфейс сервиса англоязычный) указать нужное описание, допустим, rainy forest;
Нажать на стрелку render output;
Нейросеть выдаст сгенерированное изображение, оно будет полностью меняться, если использовать разные стили.

Понятный и подробный гайд можно посмотреть здесь.

Генерация изображения по эскизу

Если пользователь хочет получить изображение на основе скетча, нужно выполнить все те же шаги, в input utilization указать «скетч» и нарисовать набросок в левом окне.

«Балабоба»

Генератор фраз и предложений «Балабоба» — сервис на основе языковой модели YaLM, разработанной «Яндексом». Другие модели семейства компания использует в «Яндекс.Поиске», умной колонке «Алисе» и множестве других проектов.

Что умеет: «дописывает» начатое предложение в разных стилях: инструкциях, рецептах, предсказаниях и так далее.

Генерация текста от «Балабоба»

Как пользоваться: выбрать стиль, допустим, народные мудрости. Начать вводить предложение, нажать «Набалабобить». Обратите внимание, что на некоторые темы, такие как политика, экономика, религия и так далее, нельзя сгенерировать продолжение.

Colorize

Colorize — это российский сервис на основе искусственного интеллекта, который позволяет раскрашивать черно-белые фотографии и видео. По данным сайта, с помощью сервиса раскрасили уже более миллиона фотографий.

Что умеет:

Делает черно-белые фото и видео цветными;
Реставрирует фотографии.

Как пользоваться: чтобы раскрасить черно-белую фотографию, нужно загрузить файл с ней в соответствующее окно. Реставрировать фотографии можно только платно — стоимость пакета начинается от 600 рублей.

Окрашенное семейное фото с помощью Colorize

Deep Nostalgia

Deep Nostalgia — функция генеалогического онлайн-сервиса MyHeritage, которую компания запустила в начале 2021 года. Функция произвела настоящий фурор среди пользователей — за время ее существования было анимировано более 106 миллионов снимков.

Что умеет: улучшает качество фотографий и оживляет лица на снимках.

Как пользоваться: для начала необходимо пройти бесплатную регистрацию на сервисе. После этого нужно загрузить фотографию (цветная или черно-белая — неважно), на которых изображены люди. Анимация одного лица занимает от 10 до 20 секунд.

После обработки пользователь получит видеоролик, на котором лицо с фотографии будет улыбаться, моргать и наклонять голову.

Sketch Metademolab

Список интересных нейросетей пополняет Sketch Metademolab — сервис, который позволяет оживлять детские рисунки. Проект разработан Meta AI* (принадлежит Meta, признанной экстремистской организацией на территории РФ) и находится в бесплатном онлайн-доступе для всех желающих.

Что умеет делать: оживляет скетчи и детские рисунки, анимируя движения изображенных существ.

Как пользоваться: для начала, если пользователь находится на территории России, нужно включить VPN. Потом анимирование происходит в четыре этапа:

Загрузка нужного рисунка;
Выделение конкретного персонажа на картинке;
Отделение персонажа от фона;
Выделение точек анимирования.

После этого нейросеть предложит варианты движений персонажа — танец, бег, прыжки и так далее.

Riffusion

Riffusion — музыкальная нейросеть, созданная Сетом Форсгреном и Айком Мартиросом. Для своего проекта Riffusion Форсгрен и Мартирос произвели тонкую настройку Stable Diffusion на спектрограммах — визуальных представлениях звука, показывающих амплитуду различных частот во времени.

Это довольно точное систематическое представление звука, которое можно снова преобразовать в аудио, выполнив тот же процесс в обратном порядке.

Что умеет: генерирует мелодии по текстовым подсказкам.

Как пользоваться: сервис максимально прост в использовании — в строке с текстом нужно описать мелодию, которую хочет услышать пользователь. После того, как она будет сгенерирована, — нажать на play и прослушать.

Интересно, что необязательно описывать музыкальные стили или инструменты. Riffusion сгенерирует мелодию, даже если написать название города или слово «собака».

Guess the Line

Проект-игра от художников-резидентов Google Arts & Culture Lab Эмиля Вальнера и Ромена Казье Guess the Line предлагает пользователю проверить свои навыки рисования, пока робот с ИИ будет угадывать, что изображено.

Что умеет: угадывает, что изображено на рисунке пользователя.

Как пользоваться: пользователю в начале игры выдаются карточки, где описано то, что ему нужно нарисовать, и 60 секунд времени (за каждый отгаданный робот рисунок начисляется дополнительное время).

Интерфейс игры Guess the line

После того, как пользователь закончил рисунок, он должен нажать на кнопку «скан», и робот-ассистент попробует угадать, что изображено. Один отгаданный рисунок — один балл. Если рисунок не получается — можно нажать на кнопку «пропустить» и начать рисовать следующий.

Обложка: генерация Midjourney по запросу russian businessmen in anime style

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

ТЕГИ

Искусство
Образ жизни
Нейротехнологии
Технологии
Искусство
Образ жизни
Нейротехнологии
Технологии

Возможности

31 декабря 2027

DeepTech Studio

Все возможности

Колонки

Материалы по теме

Пройти курс «Самое важное o 115-ФЗ»
1 Цифровая телепатия, древо технологий и будущее человечества. Команда Neuralink на подкасте Лекса Фридмана Посмотрели 8 с половиной часов за вас 13 августа 15:03
2 Осторожно, чат-боты: как не оказаться в информационной ловушке Проверьте, врут ли вам нейросети 18 июля 08:00
3 Технология нейросетевого анализа «Нитро» от «Яндекс Музыки» поможет начинающим авторам попасть в рекомендации Это произойдет за счет схожести аудиовекторов новых композиций и популярных треков 06 июля 22:01
4 Разработчик нейротехнологий Neiry привлек 300 млн рублей от фонда «Восход» и других Инвестиции пойдут на разработку новых продуктов и масштабирование 26 июня 11:52

Самые интересные нейросети: топ-14 сервисов для раскрашивания изображений, генерации текста и не только

DALL-E 2

Stable Diffusion

Midjourney

Gnod

Imaginary soundscape

Autodraw

ThisPersonDoesNotExist

Ostagram

GauGAN

«Балабоба»

Colorize

Deep Nostalgia

Sketch Metademolab

Riffusion

Guess the Line

Возможности

Популярное

Product Hunt: что это такое?

Хакеры атаковали компании через взломанные системы для лифтов

32 факта о Павле Дурове

«Сбер» возобновил выдачу ипотеки для ИТ-специалистов

Исключение из ЕГРЮЛ — что нужно знать

Материалы по теме