Дайджест по нейросетям на начало 2024 года

Автор: Марсианка с изолентой

Спасибо Габриэлю Норлэйну, что подкинул мне тему для блога)

Это будет быстрый дайджест по нейросетям. Что мы имеет на начало 2024 года и мои прогнозы на ближайшее будущее. Каждая тема будет под спойлером, а ситуация в целом и с рабочими местами — в самом конце блога.

Про картинки

Все тут знают, что нейросети умеют рисовать картинки по текстовому запросу. В данный момент получается у них очень даже неплохо. Ведущие лидеры, чтобы «поиграться из коробки» chatgpt и midjourney. В этом году ждем, что улучшат технологию накладывания текста.

Что еще по теме картинок: быстрое отделение фона от объекта, преобразование из растра и вектор, замена и стирание объектов по клику, рисование «палки-огуречика» получение «человечика».

Плюсы для художников/дизайнеров и прочих: очевидны. Суперэкономия времени. Никакой рутины больше - аминь. Чистый полет фантазиии и творчество осталось.

Также ликуют те люди, кому нужны были в работе картинки, но сами рисовать они не умеют, а денег заказать просто не было. Теперь эта проблема решена. Могу только порадоваться за них.

Про видео

От создания нейрокартинок плавно переходим к созданию видео. Пока сырое, примерно в том же состоянии в котором были нейрокартинки вначале. Только побаловаться и чутка ужаснуться. В этом году ждем улучшений

Что есть в неплохом состоянии: повышение качества видео и создание видео с твоим цифровым аватаром. Для последнего нужно записать видео-исходники. В инсте и тиктоке уже юзают

Еще сейчас можно любого персонажа или фотку человека заставить танцевать. Пока ничего серьезного, но все равно прикольно.

Еще помню, можно поменять одежду на человеке в видео. Не идеально, но хоть как-то.

Удаление и замена объектов на видео - пробуют ввести, но оно корявенько. К концу этого года, думаю, допилят. Монтажеры то ли с ужасом, то ли с благоговением вздохнут))

Прогнозы: проблему с мощностью пока никак не решить. Для генерации видео из текста нужен топовый (или около того) комп. Понятно, что у не всех такой есть, поэтому второй вариант - отдавать деньги по подписке, чтобы видео генерировалось на оборудовании сервиса в котором подписку будете покупать. А значит такую технологию точно обязательно возьмут на вооружение корпорации. В ближайшие 5 лет скорость создания фильмов и мультфильмов повысится в разы. Кстати конкуренцию корпам вполне могут составить молодые команды. Надеюсь, они тоже не будут сидеть сложа лапки.

Про игры и 3D

Создание 3д модели по картинке или текстовому описанию - есть, но в зачаточном состоянии. Не знаю ждать ли бума в этом году… скорее всего нет. Но чего точно можно ждать - это внедрение нейросетевого поведения и настоящего разгора с нейросетью. То есть ты встречаешь нпс - говоришь с ним (через микрофон) или текстом - а он тебе отвечает.

Кстати, если вы не знали, у молодежи популярны текстовые игры. Это такая простенькая штука на мобилку. Все события происходят в чате с нпс-друзьями (как ролевая игра и часто там присутствует элемент хоррора). Представьте, как здорово повысится уровень погружения, когда эти нпс будут отвечать тебе как настоящие. Понимать все твои запросы и тд. Круто, очень круто! Я думаю кто-то уже просек фишку и скоро заработет неплохое баблишко. Жаль это буду не я

Что касается более крутых проектов: там точно будет повышение продуктивности с 3д анимацией. Типа, находишь видос, где кто-то танцует - вуаля - твоя 3д персонаж у тебя точно также уже танцует. Конечно подобная технология по захвату уже была, но она станет еще лучше и быстрее!

Что еще ждем в этом или в след. году: более умную процедурную генерацию предментов и карт.

Про кодинг

Нейросеть сейчас умеет писать программы, умеет писать простенькие игры, может создать сайт, может полностью скопировать (внешне) чужой сайт. В отличии от создания картинок, тут все-таки придется владеть профессией. Потому что нейросеть более менее справляется лишь с рутинными задами, но довести до ума получившееся все еще нужно))

Прогнозы: Думаю, скоро нейросети будут обучать людей кодингу, а не индусы на ютубе.

Кстати про обучение: chatGPT неплохо обучает базовым/школьным знаниям. То есть он может выступать в роли учителя. Фан-сообщество даже модельки сделало, мол ты в чате общаешься с любимым персонажем, и он тебе за физику поясняет.

Про аудио

Нейросеть может написать песню или мелодию по вашему запросу. Но выдаст вам уже готовую аудиодорожку. Также некоторые сервисы умеют отделять голос от музыкального сопровождения. Шумы и все такое они тоже убирают. Так что можно просто записывать что-то на свой телефон, прогонять через нейросеть и получать на выходе почти студийное качество звука.

Если создать модель с нужным голосом, нейросеть используя этот голос озвучит вам любой текст или сделает перепевку песни.

Нейросеть хорошо переводит аудио в текст - лучше чем раньше, и умеет переводить с языка на язык в режиме реального времени. Например, прямо во время созвона.

Прогнозы: Скоро можно будет синтезировать абсолютно любой голос, мужской, женский, детский, с любым акцентов и на любом языке.

Про текст

Про то, что нейросеть неплохо научилась переводить языки я написала в спойлере с аудио. Здесь мы рассмотрим создание текста по запросу.

На данный момент текстовые нейросети могут: нагенерировать вам идей, рассказать что-то простым языком, сделать описание по картинке, выделить главную мысль текста, придумать название чего-либо, создать контент-план, написать презентацию, написать книгу и тд.

Сама книгу не пробовала писать через нейросеть, но какой-то китаец насколько я помню вже выиграл конкурс с такой книгой. «Суховатый» язык критиков не смутил - так как фантастика у китайцев часто подобным языком пишется. Это с их же слов если что, азах.

Ладно, на самом деле создание текста это лишь маленькая капелька. В этом году наш ждет супер-нейросеть gemini и я расскажу о ней ниже.

Итак, что же у нас по рабочим местам? Во-первых, если ваша профессия касается чего либо из выше перечисленно, готовьтесь, что вам придется адаптироваться.

Художникам нужно будет переквалифицироваться в нейро-художников. Дизайнерам - то же самое. Используйте все возможности нейросетей, чтобы ускорить свою работу и тогда без работы вы не останетесь. Вы сможете брать больше заказов но, скорее всего, за меньшие деньги.

Те, кто адаптироваться не смогут, либо проиграют своим собратьям, либо будут существовать за счет громкого имени. Все-таки есть еще люди, которые ценят традиционные методы. Но далеко не каждый будет готов за них переплачивать.

У монтажеров, аниматоров и 3д-шников ситуация получше - в их среду не каждый залететь может. В ближайшие годы нейросети для них будут исключительно вспомогательными инструментами. Их золотая эра наступает.

Похожая ситуация с кодерами. Специалисты своего дела будут по-прежнему цениться высоко и оплачивать также. А низовью придется бороться за каждую крошечку. Конкуренция (как и в случае с художниками) будет расти. Придется брать много заказов, но за копейки.

Теперь про тех, кто зарабатывал своим голосом. Сейчас голоса активно воруют. Какие-нибудь запрещенные сайты особенно, ибо им закон не писан. Кто-нибудь поприличнее конечно предложит деньги за то, чтобы использовать голосовую модель. С одной стороны хорошо - один раз записал свой голос и дальше можно кофеек пить. С другой - не понятно, как будут выплачивать деньги за все это. Ну это уже правовая сторона. Но то, что зарабатывать на этом уже не получится как раньше - безусловно.

И раз уж затронута тема голоса, не могу не сказать про то, как ловко этим пользуются мошенники. Например, вам звонят мошенники, представляются кем угодно, хоть соц. опросом и че-то спрашивают. После этого считайте, что ваша голосовая модель готова. Если у вас еще видео есть в соц сетях, то мошенники получают ваш полный цифровой аватар. Используя его они не только могут звонить вашим родственникам и друзьям и разводить их на деньги, но также звонить в ваш банк и подтвержать снятие денег со счета. Иногда для этого даже видео не нужно, иногда нужно. Но в общем то, что банки до сих пор используют такой метод подтверждения, для меня дико!

Касаемо забастовки актеров - актеры будут нужны, пока их услуги будут обходиться дешевле, чем новые методы. Поэтому самых известных актеров конечно попробуют «слепить» и использовать их цифровую версию. А если кино/сериал с ноунеймами, то их использовать выйдет дешевле. Тем более нейросетям все еще надо на ком-то обучаться

Интересное будет происходить в фешн-индустрии. Настоящих моделей останется мало, в основном все перейдут на цифровых. Но тут знаете какая фишка. Уже 2023 год принес новую тенденцую - стремление к натуральному и естественному. В 2024 это только усилится. Теперь люди не хотят вылизанную картинку. Они хотят, чтобы было все по-настоящему. Чтобы одежду показали - как она сидит по-настоящему, а не на компьютерной модельке.

Поэтому те компании, которые будут делать упор на натуральное, будут пользоваться успехом. Не могу сказать, что все остальные не будут, они вполне себе сэкономят, но без активной аудитории настоящей популярности не получится добиться. Клиенты должны будут писать отзывы и демонстрировать продукт на себе.

Что еще ждать в новом году? Вы сможете до покупки «примерять» одежду на себе, украшения и даже косметику. Сюда же входят и предметы домашнего уюта, которые вы сможете визуально разместить через камеру телефона.

Вспомнила, что я как-то архитекторов и дизайнеров интерьера обошла стороной. У них там тоже есть подвижки с нейросетями, но я не углублялась в эту тему.

Самое крутое, что я жду в этом году это GEMINI - просто потрясающая штука. Особенно если будет работать у нас без впн. Прикрепила обзор от одной девушки в самом конце. А также крит. обзор.

Кстати о гугле. Он обещает интегрировать gemini в свои телефоны пиксель. Ну и уже (смотрела презентацию сегодня) эту нейронку интегрировали в новые модели самсунговского смартфона. Увы, как бы я не хотела эту штуку, я не могу бездумно потреблять) Мой телефон еще в полном порядке.

Но нам также обещают в этом году такие девайсы (не помню как называются), которые смогут подключаться к вашему телефону а сами выглядят как брошь и крепятся к одежде. Считайте это будет ваш персональный Джарвис (как у Тони Старка). Голосовой помощник на максималках. Он вам поможет все запланировать, запишет, что вы скажете, пиццу закажет, скорую помощь вызовет и тд. Ну и конечно он будет в реальном времени переводить вам текст с любого языка прямо вам в наушник.

Я уверена, что что-то упустила, но самое основное и прикольное я вам рассказала точно.

Напишите ваше мнение, что ли?)

И что-то я даже не коснулась темы писателей. Но думаю, вы догадались по полученной информации какие преимущества можно использовать. И я даже не про то, что книгу могут написать за вас. Посмотрите чуть под другим углом. Вы сможете выйти туда, куда раньше было сложно)) По-моему кстати некоторые уже эту фишку используют! И вы не отставайте!

upd: также добавила разоблачение видео-презентации gemini

нейросети, поболтать, размышления

+24

280

0 комментариев, по времени, по убыванию времени, по возрастанию популярности

0 комментариев, по
времени, по убыванию

времени, по возрастанию

популярности