Добрые вести из мира нейронок

Автор: iskander-zombie

Релизнулась Gemini 3, и вместе с ней новая Nano-banana. Кстати, доступны старшие модели сейчас бесплатно, насколько я понимаю – но все так же с сильным ограничением по числу запросов в сутки для бесплатного тарифного плана.

Я не сильно погружен в тему нейронок, так что не могу в полной мере оценить те возможности, которыми не пользуюсь. Скажу чисто по предварительным ощущениям от Нано-бананы – ждали не зря, генератор картинок стал намного эффективнее, чем в версии 2.5. В частности, он теперь умеет почти без ошибок создавать текстовые надписи на иллюстрациях (сложные не пробовал, но раньше и в простых было по 10 ошибок в предложении из трех слов, а теперь нет), может достаточно эффективно вращать положения объектов в пространстве и компоновать фрагменты (менять лица и детали внешности, например). Все это относится в первую очередь к «думающей» модели, «быстрая» косячит со сложными задачами сильнее.

И еще – хотя я это говорю пока с большой осторожностью – но вроде бы стала чуть менее параноидальной цензура. Я потестировал нейронку на создании иллюстраций к рассказу/повести «Code of Conduct», прочитанному и переведенному мною прошлой зимой (без помощи нейронок, лол). Напомню, что это был эротический триллер о гипнозе и промывании мозгов, с изрядным упором на разные костюмно-визуальные фетиши. И картинки получились просто огонь! Разумеется, пределы я осознаю, никто тут не даст прям совсем откровенные сцены изображать. Но и даже в этих рамках получились очень даже горяченькие иллюстрации, хоть и без 18+ контента. Понятное дело, у меня уже был навык наработан, и я знаю как вручную редактировать промпты, и как удалять или заменять синонимами слова, которые с набольшей вероятностью триггерят фильтры безопасности. Но сейчас это делать стало проще. Меньше ложных срабатываний, больше возможностей изображать провокационные, мрачные и эротичные сцены (в пределах разумного).

При обсуждении с нейронкой этого же текста (что само по себе интересное занятие), было замечено, что она сейчас куда лучше владеет русской разговорной речью, причем БЕЗ каких-либо указаний с моей стороны. Слова типа «пофигизм», «училка», «шмотки» и т.п. употребляются к месту и при том дозированно. Вероятно, стиль общения частично подстраивался под лексику анализируемого текста. Это создает куда больший эффект живого собеседника, а не стереотипного вежливого робота, который обычно ощущается при общении со "стандартным голосом" ИИ-ассистента.

Далее примеры иллюстраций.