GPT прошел тест Тьюринга

Автор: Дибутил Фталат 2 апреля в 21:28

Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально.

Двойное, рандомизированное, контролируемое слепое исследование.

Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.

Выводы:

Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.

Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/

борг, гагарин, искусственный интеллект, сопротивление бесполезно

156

17 комментариев, по

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Ника Ракитина 2 апреля в 21:48

Это было прекрасно. Первую пару я сразу напугала, и они сбежали. Во второй раз определила чатЖПТ на раз-два. Спасибо за развлечение.

раскрыть ветвь 2

Дибутил Фталат автор 2 апреля в 22:29

# ↑

Я тоже угадал. Железка не смогла ответить на вопрос, требующий более двух шагов в логике (очень простой вопрос, кстати), а человек - наврал без умысла, просто на основе собственного опыта, не подтвержденного статистикой.

Железка сказала, что она из Британии, я ответил, что я из одного из ее доминионов, предложил угадать из которого. Она не поняла вопрос.
Человек сказал, что он с Азорских островов, я спросил, как там птицы, он с недоумением ответил, что чайки вроде летают. На Азорах попугаи - притча во языцех, и если бы он подумал, то ответил бы, что орут, и железка это знает (проверил).

раскрыть ветвь 1

Уран Чекан 2 апреля в 21:39

Сомнительно…

раскрыть ветвь 3

Дибутил Фталат автор 2 апреля в 22:31

# ↑

Со статистикой спорить трудно, а опровергать - бесполезно. Факт в том, что Джемини 2.5 уже гораздо круче ГПТ 4.5 в смысле осознанной интерактивности, там у людей нет шансов выиграть совсем.

раскрыть ветвь 2

Александр Накул 3 апреля в 06:36

Так ещё несколько раз ещё Элиза проходила. Которая только и умела, что переформулировать вопросы https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B8%D0%B7%D0%B0_(%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0)

раскрыть ветвь 3

Дибутил Фталат автор 3 апреля в 10:49

# ↑

— С какой целью интересуетесь?

Типа такого?

раскрыть ветвь 2

Вадим Ширяев 3 апреля в 04:34

Как псевдо-ии вообще может самообучаться, если на вопрос, сообщит ли он разрабам о косяках, он отвечает отрицательно?:)

раскрыть ветвь 2

Дибутил Фталат автор 3 апреля в 06:24

# ↑

Человек докладывает о косяках в бытии Богу. Толку?

раскрыть ветвь 1

Вадим Ширяев 3 апреля в 04:31

Пэтэушник опустился до уровня …:)

раскрыть ветвь 2

Дибутил Фталат автор 3 апреля в 06:25

# ↑

Я не очень в курсе, ч чем проблема а пэтэушников?

раскрыть ветвь 1

Написать комментарий

17 комментариев, по популярности времени, по убыванию времени, по возрастанию

17 комментариев, по
популярности

времени, по убыванию

времени, по возрастанию