GPT прошел тест Тьюринга

Автор: Дибутил Фталат

Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. 

Двойное, рандомизированное, контролируемое слепое исследование. 

Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот. 


Выводы:  

  • Ллама 3.1 примерно как человек, в 50% случаев участники угадывают 
  • GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди. 


Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/

+7
151

0 комментариев, по

140 22 27
Наверх Вниз