Самые интересные нейросети: топ-14 сервисов для раскрашивания изображений, генерации текста и не только
Нейросети — далеко не новое явление, но в 2022 году эта сфера привлекла особое внимание как СМИ, так и инвесторов. Только за прошлый год в приложения, которые генерируют контент с помощью ИИ, было вложено не меньше $1,37 млрд — это больше чем за все предыдущие пять лет вместе взятые.
На сегодняшний день самые яркие и интересные нейросети открывают абсолютно новые горизонты для творчества и развлечения. Некоторые — генерируют изображения, с помощью других эти изображения можно озвучивать или анимировать.
В этой статье редакция RB собрала подборку нейросетей, с которыми будет интересно поэкспериментировать и оценить масштаб «наступившего будущего».
Содержание:
- DALL-E 2;
- Stable Diffusion;
- Midjourney;
- Gnod;
- Autodraw;
- ThisPersonDoesNotExist;
- Ostagram;
- GauGAN;
- «Балабоба»;
- Colorize;
- Deep Nostalgia;
- Sketch Metademolab;
- Riffusion;
- Guess the Line.
DALL-E 2
Открывает наш топ интересных нейросетей нашумевшая DALL-E 2. Эта программа была анонсирована в апреле 2022 года, разработчиком выступила исследовательская лаборатория искусственного интеллекта OpenAI.
Что умеет:
- Генерировать изображения по текстовому описанию на английском языке;
- «Дорисовать» картину, расширив изображение за его исходные пределы;
- Вносить изменения, добавляя объекты;
- Создавать несколько вариантов похожих изображений на основе оригинала.
Как пользоваться: чтобы получить доступ к DALL-E 2, нужно пройти регистрацию через электронную почту, а затем подтвердить номер телефона.
Возможности DALLE-2
Стоит отметить, что нейросеть не работает на территории России. То есть для работы из России потребуется VPN (список качественных VPN-сервисов можно посмотреть здесь), а также купить номер телефона страны для подтверждения (например, здесь).
В первый месяц доступно 50 кредитов, одна операция (например, генерация изображения по запросу) стоит один кредит. Каждый последующий месяц пользователю доступны 15 кредитов.
Если нет желания включать VPN и настраивать иностранный номер, можно протестировать российскую DALL-E от от SberDevices и Sber AI. Российская программа не требует регистрации, бесплатна и генерирует изображения по запросу на русском и других языках.
Генерация Kandinsky по запросу «Собака в самолете пьет шампанское»
Stable Diffusion
Нейросеть Stable Diffusion достаточно популярна за счет качества и реалистичности сгенерированных изображений и точно входит в список бесплатных нейросетей, которые стоит попробовать.
Stable Diffusion — это ПО с открытым исходным кодом, его релиз состоялся в 2022 году. В разработке приняли участие группа компаний CompVis, Runway, EleutherAI и LAION.
Что умеет: генерировать изображения по текстовому описанию на английском языке.
Как пользоваться: сервис представляет собой классический веб-сайт с кратким описанием функций и полем для описания изображения. Достаточно ввести нужный текст или воспользоваться предложенными вариантами и нейросеть меньше чем за минуту сгенерирует четыре варианта изображения.
Генерация Stable Diffusion по запросу «Собака сидит в самолете и пьет шампанское»
Stable Diffusion не требует регистрации и полностью бесплатна. Обратите внимание, что из-за высокой популярности сервис может выдавать ошибку при генерации изображения — возможно попытку придется повторить несколько десятков раз.
Midjourney
Midjourney входит в тройку самых популярных нейросетей для генерации изображений. Автор программного обеспечения — научный сотрудник NASA и основатель Leap Motion Дэвид Хольц, проект стал доступен широкому кругу пользователей в июле 2022 года.
Что умеет:
- Генерировать изображения по текстовому описанию на английском языке;
- Объединять несколько изображений в одно;
- Создавать аватары в разных стилях.
Как пользоваться: сейчас нейросеть доступна в виде чат-бота в Discord, поэтому, чтобы начать ей пользоваться, потребуется зайти в свой аккаунт или завести новый.
Генерация MidJourney по запросу «Собака сидит в самолете и пьет шампанское»
После входа в Discord нужно нажать на кнопку «Присоединиться к бета-версии» на сайте нейросети — сайт автоматически перенаправит на нужный канал. Обратите внимание, что бот по умолчанию публичный и другие пользователи также будут видеть ваши изображения (при желании бота можно добавить на личный сервис).
Картинки генерируются в специальных комнатах Newcomer rooms — нужно выбрать любую и перейти в чат.
Следующие шаги:
- В поле ввода указать /setting, нажать Enter — базовые настройки уже будут применены по умолчанию;
- В поле ввода указать /imagine, нажать Enter — написать любое слово на английском языке — отправить в чат;
- Принять настройки.
После этих шагов пользователь может начать генерировать собственные изображения. Каждому новому юзеру выдается 25 бесплатных кредитов — один кредит на один запрос.
У бота большое количество команд и программ, полное руководство стоит изучить на сайте нейросети в специальном разделе.
Gnod
Gnod — проект немецкого специалиста по искусственному интеллекту Марека Гибни. Сам создатель описал его как самообучающуюся систему рекомендаций, которая «общается с каждым, кто заходит на сайт, пытаясь понять его картину мира». Gnod точно входит в список нейросетей, которые отлично подойдут для досуга.
Сервис специализируется на четырех основных направлениях — фильмах, изобразительном искусстве, литературе и музыке, и на основе уже знакомых и любимых подбирает похожие, новые для пользователя лица и произведения.
Что умеет:
- Gnod Music рекомендует музыкальных исполнителей;
- Gnod Art рекомендует художников;
- Gnod Literature рекомендует авторов;
- Gnod Movies рекомендует фильмы;
- Gnod Search помогает сравнивать поисковые системы.
Как пользоваться: интерфейс сервиса полностью на английском языке. Для начала пользователю нужно выбрать интересующую его сферу — допустим, фильмы. После этого потребуется ввести три любимых фильма, на их основе нейросеть предложит кинокартину. Если ответ Gnod не устроил пользователя, можно нажать «мне не нравится» и она выдаст новую рекомендацию.
Обратите внимание, что могут возникнуть проблемы с десктопной версией сайта, рекомендуем пользоваться мобильной версией.
Imaginary soundscape
Imaginary soundscape — нейросеть от команды ученых Токийского университета, разработанная в 2018 году. Проект можно описать как звуковую инсталляцию, где зрители могут передвигаться по Google Street View и погружаться в воображаемые звуковые ландшафты, созданные с помощью моделей глубокого обучения.
Что умеет:
- Озвучивать случайное место на земле на Google Map;
- Озвучивать изображения.
Как пользоваться: чтобы озвучить изображение, достаточно загрузить его в соответствующее окно на сайте — в базе нейросети более 52 тысяч звуков.
При открытии Google Street View пользователь попадает на случайную точку на карте — редактор RB в первый раз очутилась на улочке Камбоджи, а во второй раз — на службе в кафедральном соборе. После этого можно остаться на локации и исследовать ее, переключиться на случайную новую или вбить в поисковую строку нужное место.
Autodraw
Инструмент для рисования Autodraw был разработан Дэном Мотценбекером и Кайлом Филлипсом в Google Creative Lab. Как заявлено на сайте самого проекта, «он сочетает машинное обучение с рисунками талантливых художников, чтобы помочь каждому создавать что-то креативное».
Что умеет: дорисовывает и преображает изначальный рисунок пользователя.
Как пользоваться: интерфейс сервиса напоминает упрощенный Paint. Из кнопок есть кисть, автокисть, текст, заполнение, фигуры и выбор цвета. Пользователь выбирает автокисть и начинает рисовать фигуру — программа автоматически пытается «угадать», что имеет в виду юзер, и предлагает похожие готовые фигурки.
Рисунок на Autodraw
Готовые фигуры можно двигать, перекрашивать, закрашивать, менять в размере и создавать из них цельные изображения. Пожалуй, главный минус этой программы — в ней не предусмотрен ластик.
ThisPersonDoesNotExist
Самые интересные нейросети иногда бывают еще и одними из самых пугающих. Сайт разработчика Uber Филиппа Ванга ThisPersonDoesNotExist точно можно отнести к последним.
Что умеет: раз в несколько секунд генерирует человеческое лицо, картину, лошадь, кошку или химическую решетку.
Как пользоваться: на сайте нет кнопок, разделов и тому подобного — по умолчанию, когда пользователь открывает сервис, он видит только сгенерированное человеческое лицо. Лицо человека, которого в реальной жизни не существует. Чтобы сгенерировать новое — нужно просто обновить страницу.
Коллаж из сгенерированных лиц нейросетью ThisPersonDoesnotExist
В нижнем углу при посещении сайта появится всплывающее окно — в нем можно будет перейти на генератор картин, кошек, лошадей, химических решеток или изучить исходный код на GitHub.
Ostagram
Ostagram — достаточно популярный сервис для обработки изображений. Программа работает на основе сверточных нейронных сетей и алгоритма художественного стиля Леона Гатиса, Александра Эккера и Матиаса Бетге.
Что умеет: объединяет стили двух разных изображений и генерирует на их основе одно новое.
Как пользоваться: для обработки своих изображений потребуется пройти регистрацию. Далее в разделе «Изображения» нужно загрузить картинку для обработки (за раз можно обработать до 10 штук), а затем выбрать один из предложенных фильтров или добавить свой вариант. Дополнительно можно регулировать масштаб и вес стиля — от этого зависит глубина наложения фильтра.
Обработка фото в Ostagram
Бесплатная обработка фотографии занимает от одной до нескольких минут. Есть платная версия, которая позволяет ускорить процесс и получить качество в HD.
Посмотреть работы других пользователей можно в ленте сервиса.
GauGAN
Нейросеть GauGAN — проект американской технологической компании NVIDIA. Первую версию компания представила еще в 2019 году, вторую презентовала в 2021. Чтобы выдавать качественным результат, нейросеть была натренирована на 10 миллионах фотографий видов природы.
Что умеет:
- Генерирует изображения по текстовому запросу;
- Генерирует изображения на основе эскиза.
Как пользоваться: если пользователь хочет получить сгенерированное изображение по текстовому запросу, нужно выполнить следующие действия:
- Принять условия и положения внизу страницы (без этого будет невозможно выполнять какие-либо действия);
- В Input visualization выбрать все варианты;
- В Input utilization выбрать только «текст»;
- В строке ввода текста на английском языке (весь интерфейс сервиса англоязычный) указать нужное описание, допустим, rainy forest;
- Нажать на стрелку render output;
- Нейросеть выдаст сгенерированное изображение, оно будет полностью меняться, если использовать разные стили.
Понятный и подробный гайд можно посмотреть здесь.
Генерация изображения по эскизу
Если пользователь хочет получить изображение на основе скетча, нужно выполнить все те же шаги, в input utilization указать «скетч» и нарисовать набросок в левом окне.
«Балабоба»
Генератор фраз и предложений «Балабоба» — сервис на основе языковой модели YaLM, разработанной «Яндексом». Другие модели семейства компания использует в «Яндекс.Поиске», умной колонке «Алисе» и множестве других проектов.
Что умеет: «дописывает» начатое предложение в разных стилях: инструкциях, рецептах, предсказаниях и так далее.
Генерация текста от «Балабоба»
Как пользоваться: выбрать стиль, допустим, народные мудрости. Начать вводить предложение, нажать «Набалабобить». Обратите внимание, что на некоторые темы, такие как политика, экономика, религия и так далее, нельзя сгенерировать продолжение.
Colorize
Colorize — это российский сервис на основе искусственного интеллекта, который позволяет раскрашивать черно-белые фотографии и видео. По данным сайта, с помощью сервиса раскрасили уже более миллиона фотографий.
Что умеет:
- Делает черно-белые фото и видео цветными;
- Реставрирует фотографии.
Как пользоваться: чтобы раскрасить черно-белую фотографию, нужно загрузить файл с ней в соответствующее окно. Реставрировать фотографии можно только платно — стоимость пакета начинается от 600 рублей.
Окрашенное семейное фото с помощью Colorize
Deep Nostalgia
Deep Nostalgia — функция генеалогического онлайн-сервиса MyHeritage, которую компания запустила в начале 2021 года. Функция произвела настоящий фурор среди пользователей — за время ее существования было анимировано более 106 миллионов снимков.
Что умеет: улучшает качество фотографий и оживляет лица на снимках.
Как пользоваться: для начала необходимо пройти бесплатную регистрацию на сервисе. После этого нужно загрузить фотографию (цветная или черно-белая — неважно), на которых изображены люди. Анимация одного лица занимает от 10 до 20 секунд.
После обработки пользователь получит видеоролик, на котором лицо с фотографии будет улыбаться, моргать и наклонять голову.
Читайте также: Не только Deep Nostalgia: 5 приложений, оживляющих фото
Sketch Metademolab
Список интересных нейросетей пополняет Sketch Metademolab — сервис, который позволяет оживлять детские рисунки. Проект разработан Meta AI* (принадлежит Meta, признанной экстремистской организацией на территории РФ) и находится в бесплатном онлайн-доступе для всех желающих.
Что умеет делать: оживляет скетчи и детские рисунки, анимируя движения изображенных существ.
Как пользоваться: для начала, если пользователь находится на территории России, нужно включить VPN. Потом анимирование происходит в четыре этапа:
- Загрузка нужного рисунка;
- Выделение конкретного персонажа на картинке;
- Отделение персонажа от фона;
- Выделение точек анимирования.
После этого нейросеть предложит варианты движений персонажа — танец, бег, прыжки и так далее.
Riffusion
Riffusion — музыкальная нейросеть, созданная Сетом Форсгреном и Айком Мартиросом. Для своего проекта Riffusion Форсгрен и Мартирос произвели тонкую настройку Stable Diffusion на спектрограммах — визуальных представлениях звука, показывающих амплитуду различных частот во времени.
Это довольно точное систематическое представление звука, которое можно снова преобразовать в аудио, выполнив тот же процесс в обратном порядке.
Что умеет: генерирует мелодии по текстовым подсказкам.
Как пользоваться: сервис максимально прост в использовании — в строке с текстом нужно описать мелодию, которую хочет услышать пользователь. После того, как она будет сгенерирована, — нажать на play и прослушать.
Интересно, что необязательно описывать музыкальные стили или инструменты. Riffusion сгенерирует мелодию, даже если написать название города или слово «собака».
Guess the Line
Проект-игра от художников-резидентов Google Arts & Culture Lab Эмиля Вальнера и Ромена Казье Guess the Line предлагает пользователю проверить свои навыки рисования, пока робот с ИИ будет угадывать, что изображено.
Что умеет: угадывает, что изображено на рисунке пользователя.
Как пользоваться: пользователю в начале игры выдаются карточки, где описано то, что ему нужно нарисовать, и 60 секунд времени (за каждый отгаданный робот рисунок начисляется дополнительное время).
Интерфейс игры Guess the line
После того, как пользователь закончил рисунок, он должен нажать на кнопку «скан», и робот-ассистент попробует угадать, что изображено. Один отгаданный рисунок — один балл. Если рисунок не получается — можно нажать на кнопку «пропустить» и начать рисовать следующий.
Обложка: генерация Midjourney по запросу russian businessmen in anime style
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Как открыть бизнес по франшизе»
- 1 Цифровая телепатия, древо технологий и будущее человечества. Команда Neuralink на подкасте Лекса Фридмана Посмотрели 8 с половиной часов за вас 13 августа 15:03
- 2 Осторожно, чат-боты: как не оказаться в информационной ловушке Проверьте, врут ли вам нейросети 18 июля 08:00
- 3 Технология нейросетевого анализа «Нитро» от «Яндекс Музыки» поможет начинающим авторам попасть в рекомендации Это произойдет за счет схожести аудиовекторов новых композиций и популярных треков 06 июля 22:01
- 4 Разработчик нейротехнологий Neiry привлек 300 млн рублей от фонда «Восход» и других Инвестиции пойдут на разработку новых продуктов и масштабирование 26 июня 11:52