Вся суть нейросети в одной картинке
Автор: Борис Толчинский aka Брайан ТолуэллГотовлю шахматный флешмоб и пытаюсь создать для него иллюстрацию с помощью нейросети Midjourney. Казалось бы, задача самая простая: что такое шахматы, как выглядят фигуры и игральная доска, знают все, даже те немногие, кто сам никогда за неё не садился.
Но для Миджорни эта простейшая задача оказалась абсолютно неразрешимой. Почти месяц я генерировал в фоне десятки изображений с разнообразными запросами, где было слово "chess", но ни одно из этих изображений не получилось хоть сколь-нибудь осмысленным.
Это очень странно, мне самому в это сложно поверить, но это именно так.
Продвинутая нейросеть в 2023 году не понимает, что игральная доска строго квадратная, состоит из 64 белых и чёрных клеток, которые чередуются в порядке, который так и называется - шахматный порядок. Что фигуры в шахматах должны стоять строго на своих клетках, а не между ними. Что эти фигуры двух разных цветов, а не одного. Что это строго определённых фигуры, а не Бог весть какие, и одна из них Король, значит, на доске должны стоять, как минимум, два Короля разного цвета. И так далее...
Миджорни ничего такого не сумел нарисовать. Я уж молчу о том, чтобы изобразить на доске какую-то хоть сколь-нибудь реальную шахматную позицию. Хотя, казалось бы, чего уж проще: в мире сыграны мириады партий, в электронных базах есть нотации, записи партий и позиций, на все случаи жизни. Есть также тысячи, если не миллионы, картинок, где разные позиции изображены. Шахматные программы появились едва ли не первыми среди компьютерных игр, как только появились сами компьютеры - помню, я играл на своём допотопном советском ПК в шахматы ещё в 1989-м.
Мне всё больше кажется, что нейросеть воспринимает шахматную доску и фигуры просто как орнамент, элемент декора. Не знаю, как другие нейросети, а Миджорни обожает рисовать орнаменты.
Что всё это значит, очевидно, на мой взгляд: пока что нейросети - никакой не "искусственный интеллект", и даже близко не стояли. Они не понимают, что творят. Вернее, не "творят", как люди, а лишь перерисовывают. Иногда получается плохо, иногда прекрасно и поэтому полезно; но всегда они делают это бездумно.
Можно ли это как-то исправить, и надо ли, другой вопрос.