DALL-E: новая технология создания цифровых изображений из текста

DALL-E: новая технология создания цифровых изображений из текста

Вы видели в Твиттере забавные картинки со странными словами, написанными рядом с ними? Эти изображения были созданы программой DALL-E. Программа искусственного интеллекта, которая превращает слова в особый новый язык, а затем создает из него реалистичные изображения. Довольно захватывающе, не так ли? Вот все, что  нужно знать об этом.

Что такое ДАЛЛ-Е

DALL-E — новый искусственный интеллект, программное обеспечение, которое превращает ваши слова в изображения и произведения искусства. Пользователи могут просто вставить текст на английском языке, и нейронная сеть создаст из него изображение. Инструмент был разработан стартапом OpenAI, поддерживаемым Microsoft, и основан на технологии Google Imagen. На данный момент в описании DALL-E на сайте OpenAI говорится, что это «новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки из описания на языке».

DALL-E может создавать даже самые удивительные фотографии: например, «Мишки Тедди покупают продукты в Древнем Египте». В январе 2021 года OpenAI представила DALL-E, первую версию этого программного обеспечения. более новая версия — DALL-E.

Разработчики говорят: «DALL-E 2 даст людям возможность творческого самовыражения. DALL-E 2 также помогает нам понять, как передовые системы искусственного интеллекта видят и понимают наш мир, что имеет решающее значение для нашей миссии по созданию искусственного интеллекта, приносящего пользу человечеству».

Как работает

DALL-E — нейронная сеть, обученная OpenAI для создания изображений из текста. Он может комбинировать не связанные понятия и создавать антропоморфные версии животных и предметов. DALL-E работает с системой компьютерного зрения CLIP , которую OpenAI представила в прошлом году. Нейросеть переводит человеческий язык на свой язык и только потом превращает его в изображения.

Доктор компьютерных наук Яннис Дарас написал в Твиттере примеры того, что он назвал «своим языком искусственного интеллекта»: «Apoploe vesrreaitais означает птиц», — написал Дарас. «Contarra ccetnxniams luryca tanniounons» означает «вредитель или вредитель».

Интерфейс DALL-E прост: есть текстовое поле, в которое пользователь может вставить текст, и кнопка для начала преобразования, а чуть ниже изображения. Создатели объясняют, как работает DALL-E: «Программа использует процесс, называемый «рассеиванием», который начинается с набора случайных точек и постепенно превращает этот рисунок в изображение по мере распознавания определенных аспектов этого изображения».

На данный момент новая версия DALL-E доступна только небольшой группе людей. Однако вы можете записаться в лист ожидания, объяснив, почему и с какой целью вы хотите протестировать программу, и, возможно, разработчики предоставят ранний доступ.

Программное обеспечение скоро будет добавлено в API для использования внешними разработчиками. А пока вы можете попробовать версию DALL-E Mini, которая также создает изображения из текста и имеет открытый исходный код. Хотя иногда эта версия вылетает из-за большого количества запросов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *