GPT прошел тест Тьюринга
Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот. Выводы: Ллама 3.1 примерно как человек, в 50% случаев участники угадывают GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди. Кстати, сам тест...
Читать дальше →
155
17