1. Логика и критическое мышление. Победитель — Claude 2.
Чат-ботам задали вопрос о том, где находится алмаз, который положили в чашку, которую положили на кровать вверх дном, а затем отнесли её в холодильник. Только Claude 2 понял, что алмаз остался на кровати
2. Математическое мышление. Победители — ChatGPT, Bard и Claude 2. Llama 2 не справилась.
Нейронка не смогла посчитать массу картошки после того, как ее высушат (задачка из старшей школы), и не назвала 10 простых чисел.
3. Кодинг. Победители — ChatGPT и Bard. Claude 2 и Llama 2 не смогли в простой код на Python.
4. Разгадывание загадок. Победители — ChatGPT, Bard и Claude 2.
Llama 2 не смогла в загадку «У отца Дэвида есть сын. Как его зовут?» (ответ: Дэвид)
5. Креативное письмо. Победители — Bard и Llama 2. Остальные чат-боты не смогли написать стихотворение, каждая строчка которого оканчивалась бы на букву «е».
Итоги такие: у ChatGPT, Bard и Claude 2 по 22 балла из 24, а у Llama 2 — 19 из 24. Цукерберг и тут не смог стать первым.
Мы в VK: https://vk.com/darkwebex
