Пост канала «Полезный Парфун» от 15.06.2026
Чтож, первый этап эксперимента завершен. Посмотрим, как справились нейронки с прогнозами.
Из 10 сыгранных матчей 4 закончились вничью, то есть ровно 40% тура. Нейронки этого вообще не предсказывали. Совокупно по всем шести моделям на эти 40 прогнозов (4 матча × 6 моделей минус пропуски ГигаЧата) ни одной ничьей.
При этом единственные ничьи, которые модели вообще ставили (5/6 на Корею—Чехию, плюс DeepSeek на Австралию—Турцию), пришлись на матчи, которые ничьими не закончились, там были чистые победы 2:1 и 2:0. Получается почти зеркальная картина, там, где реально была ничья, все видели победителя; там, где все видели ничью, была победа.
Финальный счёт по точным прогнозам такой — ChatGPT всё ещё лидер с двумя точными счетами (Мексика—ЮАР и Гаити—Шотландия) против одного у DeepSeek, Qwen, Claude и Алисы и нуля у ГигаЧата. Но по угадыванию исхода (без привязки к счёту) Алиса теперь явный лидер, 5 из 10, у остальных пяти моделей по 4 из 10 (у ГигаЧата 3 из 7 сыгранных). Парадокс в том, что Алиса добилась этого худшими по точности счетами в таблице, она просто реже всех "промахивалась мимо победителя", хотя почти никогда не угадывала цифры.
Если делать общий вывод по первому туру, он такой — нейросетки неплохо чувствуют явного фаворита (Мексика, США, Шотландия, Германия — все 4 матча с явным преимуществом одной из команд угаданы по исходу почти всеми), но системно слепы к ничьим и к настоящим андердогам — Австралия—Турция осталась единственным матчем, где не угадал вообще никто и ни в чём.
Из забавного, моя затея даже в СМИ попала. Так что продолжим, ловите результаты с 15 по 19 июня. И помните, это эксперимент про ИИ, а не намёк нести куда-то деньги, ставки зло, осуждаю максимально!