GPT прошел тест Тьюринга
Автор: Дибутил ФталатЭто, конечно, было очевидно еще примерно год назад с 4o, но теперь официально.
Двойное, рандомизированное, контролируемое слепое исследование.
Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.
Выводы:
- Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
- GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.
Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/