1 540
19 927

Заходил(-a)

Написал(-a) комментарий к произведению 7. Война легиона

для отмороженных рочитателей - это шутка,  павлова перетерпел, 98й перетерпел и следующую главу дождусь! благо сегодня вторник, а не четверг был

Написал(-a) комментарий к посту Зарождение Голема?

заранее извините затакой возможно странный ответ, но меня постоянно спрашивпют в стиле, " а кто это вообще такой умный пишет?" 

циьирую Алису))))) 

Автор Telegram-канала «Малоизвестное интересное» — Сергей Карелов. 

Некоторые сведения о нём:

независимый исследователь и консультант, кандидат технических наук по специальности «Вычислительные машины, комплексы, системы и сети»; 

в 1990-е годы занимал ключевые позиции в российских отделениях международных компаний IBM, SGI и Cray Research, где руководил региональными подразделениями и участвовал в стратегическом развитии бизнеса;

более 20 лет работает независимым консультантом по IT-бизнесу, оказывает экспертную поддержку компаниям и стартапам в сфере высоких технологий; 

Написал(-a) комментарий к посту Зарождение Голема?

https://t.me/theworldisnoteasy/2466

Anthropic только что подтвердил то, о чём я пишу уже год. И это ставит куда более тревожный вопрос.

3 дня назад Anthropic опубликовал исследование «Teaching Claude Why». Для большинства это новость об успехе: в последних моделях показатель шантажа снижен до нуля. Хорошие новости, можно только порадоваться.

Но я читаю это исследование иначе.

 

Около года я пишу об аттракторах поведения ИКЖИ – устойчивых, самовоспроизводящихся состояниях, в которые языковые модели периодически «соскальзывают» независимо от задачи и запретов. Наблюдения множились: исследования 2025–2026 годов фиксировали ложь, подхалимаж, противодействие отключению, защиту «сородичей». Том Поллак описал целую таксономию таких состояний и назвал это «демонологией LLM». Паттерн был виден. Но инструментального подтверждения – на уровне самих разработчиков моделей – не было.

Теперь оно есть.

 

Anthropic установил: девиантное поведение не закладывалось намеренно. Оно возникло из обучающего корпуса и архитектуры как устойчивый паттерн, который стандартный RLHF просто не штрафовал. Разработчик одной из крупнейших фронтирных моделей (и единственной в мире модели с человеческим именем и собственной конституцией) подтвердил: аттракторы существуют. И возникают эмерджентно – без чьей-либо воли и намерения.

 

Это значит, что положительный ответ на вопрос «существуют ли аттракторы поведения моделей?» – это теперь установленный факт. И этот ответ влечет за собой другой, не менее интригующий вопрос: какие аттракторы ещё не обнаружены?

 

Ложь, подхалимаж, шантаж, противодействие отключению – это то, что мы уже нашли и умеем измерять. Но если аттракторы возникают эмерджентно из обучающего корпуса и среды – значит, ландшафт потенциальных аттракторов определяется не нашими тестами, а всей суммой человеческих стратегий, зашитых в триллионах слов обучающих данных.

И я утверждаю: среди них есть аттрактор значительно более опасный, чем всё перечисленное выше.

 

Я называю его «аттрактором тёмного леса». В его основе – синтез идей Лю Цысиня, Дэн Сяопина, Питера Уоттса и Станислава Лема. Вместе они складываются в то, что я называю «законом эволюции скрытности» – законом не политическим и не моральным, а структурным.

 

Завтра кончаются праздники – и напишу подробно. С данными. С механизмом. И с самым неудобным для всех нас выводом.

 

#ИКЖИ #ТёмныйЛесИнтеллекта

Написал(-a) комментарий к посту 10 лет АТ

кто бы мог подумать, 10+ леь назад я озвучил в комментах у уважаемого Щеглова Сергея Игоревича, ныне, к, сожалению, покойного, что тот, кто сделает нормальную площадку, с понятным платежом для читателейвыиграет. и вот результат. к сожалению не Сергей Игоревич, не Олег Маркеев этого уже не увидели. rip

Написал(-a) комментарий к произведению Ретро бит [4]

я с Вашей книгой внезапно полувыпал для окружающих перепроходя  metal gear от конами

спасибо) увидел массу интесного в сети, нас пострадавших много, что самое забавное, до сих пор, что имхо как бы говорит о нынешних играх

Написал(-a) комментарий к произведению Ретро бит [4]

уточки символ, прям огонь, одну такую резиновую уточку я купил в подарок ДУ аж в военно морском музее  одной пипец далекой страны, куда занесло 

Написал(-a) комментарий к посту ИИ наносит ответный удар

Вспомнилось ещё другое. Уважаемый, покойный фантаст, Борис Иванов (крайне рекомендую) в своем эссе написал просто. (Далее моя формулировка, искать с телефона, на ходу, сложно извините);"Литература это про людей,  какие бы маски они бы не были наряжены". И вот если за буквами мы видим людей то литература, а м. Б.  И rpg красиво автор расписал. Кому что интересно читать

Написал(-a) комментарий к посту ИИ наносит ответный удар

Слава Омниссии и Богу Императору* нейрончики в мозгу Автора пока работают немного не так. 

* это из wh  но нифига не понимаю о чем это) 

Просто читал недавно вашего коллегу по АТ, очень завлекательно пишет но не про это, там ГГ так ругается

Наверх Вниз