GPT прошел тест Тьюринга

Автор: Дибутил Фталат

Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. 

Двойное, рандомизированное, контролируемое слепое исследование. 

Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот. 


Выводы:  

  • Ллама 3.1 примерно как человек, в 50% случаев участники угадывают 
  • GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди. 


Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/

+7
156

17 комментариев, по

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Ника Ракитина
#

😂 Это было прекрасно. Первую пару я сразу напугала, и они сбежали. Во второй раз определила чатЖПТ на раз-два. 😀  Спасибо за развлечение.

 раскрыть ветвь  2
Дибутил Фталат автор
#
Я тоже угадал. Железка не смогла ответить на вопрос, требующий более двух шагов в логике (очень простой вопрос, кстати), а человек - наврал без умысла, просто на основе собственного опыта, не подтвержденного статистикой.

Железка сказала, что она из Британии, я ответил, что я из одного из ее доминионов, предложил угадать из которого. Она не поняла вопрос.
Человек сказал, что он с Азорских островов, я спросил, как там птицы, он с недоумением ответил, что чайки вроде летают. На Азорах попугаи - притча во языцех, и если бы он подумал, то ответил бы, что орут, и железка это знает (проверил).

 раскрыть ветвь  1
Уран Чекан
#

Сомнительно…

 раскрыть ветвь  3
Дибутил Фталат автор
#

Со статистикой спорить трудно, а опровергать - бесполезно. Факт в том, что Джемини 2.5 уже гораздо круче ГПТ 4.5 в смысле осознанной интерактивности, там у людей нет шансов выиграть совсем.

 раскрыть ветвь  2
Александр Накул
#
 раскрыть ветвь  3
Дибутил Фталат автор
#

— С какой целью интересуетесь?

Типа такого?
😆 

 раскрыть ветвь  2
Вадим Ширяев
#

Как псевдо-ии вообще может самообучаться, если на вопрос, сообщит ли он разрабам о косяках, он отвечает отрицательно?:)

 раскрыть ветвь  2
Дибутил Фталат автор
#

Человек докладывает о косяках в бытии Богу. Толку?

 раскрыть ветвь  1
Вадим Ширяев
#

Пэтэушник опустился до уровня …:)

 раскрыть ветвь  2
Дибутил Фталат автор
#

Я не очень в курсе, ч чем проблема а пэтэушников?

 раскрыть ветвь  1
Написать комментарий
165 22 27
Последние комментарии
41 / 5K
Екатерина Белозерова
Флудилка конкурса "Произведение по заявке"
79 / 79
Ульяна Разина
Религия-опиум народа?
9 / 9
Екатерина Александрова
И ещё одно небольшое разъяснение
8 / 8
Вита Паветра
Субботний рецептъ!
1 / 1
Натали Карэнт
Субботний кофе
1 / 1
Людмил Федогранов
Почему его зовут Александром Великим
9 / 9
Ольга Хадли
Кофейный флешмоб
5 / 5
Богдан Костяной
Субботний ФМ – Как молоды мы были!
10 / 4K
Енотская Морда
Марафон незаконченных романов "Триумфальная арка"
86 / 86
Ари Видерчи
Первый блин комом
19 / 19
Макс Далин
"Цветение" - цитата и иллюстрации
2 / 2
Маргарита Гуминенко
Рецензии с углублённым изучением произведения
1 / 8
Андрей Никитин
Ужасы жизни в Южной Корее, о которых Важно знать
2 / 2
Ник Вернер
Артбуки на АТ
7 / 7
Хаку Катсуми
Кибернетика явно не мое....
8 / 8
Алексей Птица
«Благими намерениями вымощена дорога в ад, благими делами дорога в рай».
40 / 40
Анжела Ченина
Миры Великого Кольца и планеты до порога Синед Роба. Какими они могут быть?
191 / 191
Ари Видерчи
Рецензия на повесть «Басурманка» — Степан Сказин
102 / 483K
Мерлин Маркелл
Флудилка
8 / 8
Лекс Мираж
Честный отзыв на сказку
Наверх Вниз