В Сбере представили новейшую версию нейросети Kandinsky 4.1 Image. Она может создавать более качественные и детализированные изображения, а также лучше следует текстовым инструкциям. Об этом рассказали в пресс-службе Сбера.
В новейшую версию был добавлен AI-редактор Malvina, позволяющий редактировать изображения. При этом Malvina старается не нарушать геометрию исходного изображения.
В Сбере рассказали, что модель Kandinsky 4.1 Image обучалась не только на огромном датасете «Изображение – текстовое описание», но и также дополнительно дообучалась на отработанных вручную изображениях, сбалансированных по 9 метакатегориям. В итоге такого дообучения существенно увеличилась эстетичность и корректность генерируемых изображений во всех доменах, а также выросло качество генерации текстур и сложных объектов.
Модель научилась понимать стили известных художников — Айвазовского, Босха, Кранаха, Кандинского и других. Также пользователь отныне может создавать изображения в различных художественных стилях.
Старший вице-президент, начальник блока «Технологическое развитие» Сбера Андрей Белевцев сообщил, что отныне пользователи могут не тратить много времени в графических редакторах.
«Мы специально обучали обновленную модель Kandinsky на разнообразных и при этом детально выверенных и размеченных данных, чтобы нейросеть могла работать с различными сценами: от портретов до пейзажей. Интеграция с GigaChat превращает нашу языковую модель в универсальный инструмент для творчества и работы, который может освоить любой желающий», — сказал он.
Ранее сообщалось, что OpenAI разрабатывает устройство с ИИ, которое заменит смартфоны.