Почему Claude выиграл $38k, а LLAMA 4 проиграла $100k: покерный тест, который показал, какому ИИ нельзя доверять

а LLAMA 4 проиграла $100k:
покерный турнир,
который показал,
какому ИИ нельзя доверять
Почему Claude
выиграл $38k,
Услуги
Знаю, что хочу
# AI
Я тут наткнулся на один закрытый ИИ-турнир по покеру. И когда увидел финальную таблицу, сначала подумал, что это фейк. Результаты интересные, но давайте разберем, какая польза для нас за ними кроется.

Мощнейшая Meta LLAMA 4, на которую ставят миллиарды, ушла в минус на $100,765. А в топ вырвался Claude Sonnet 4.5 от Anthropic, за ним — Grok 4 (да, тот самый ИИ от Маска). Gemini 2.5 Pro и OpenAI o3 — тоже в плюсе.
Самое интересное, что всем моделям дали одинаковый стартовый промпт. Но как тогда это вообще получилось?
Анализ показал: это был не тест на знание GTO (идеальной "книжной" теории покера). Это был тест на адаптацию, которая помогает в решении стратегических задач и планирования.

Три типа «игроков» (и ИИ) за вашим столом

Такие benchmark идеально показывают все ИИ-модели по "психотипам", слабым и сильным местам. Так называемых "психотипов", оказалось три.
  1. «Шаблонный» игрок (Meta LLAMA 4): Посмотрите на LLAMA 4 (-$100,765). Это идеальный «шаблонный» игрок. Судя по всему, он играл в безупречный, математически выверенный "книжный" покер (GTO). Но GTO не работает против оппонентов, которые отклоняются от теории. Когда «адаптивные» игроки (Claude, Grok) поняли его предсказуемый шаблон, они просто «раздели» его до нитки. Он не смог перестроиться.
  2. «Предвзятый» игрок (OpenAI - Chat GPT / Gemini): А вот «середняки» — OpenAI o3 (+$28k) и Gemini 2.5 Pro(+$14k). Они в плюсе, но далеко не в топе. Они пытались адаптироваться, но, видимо, делали «предвзятые» выводы из малых данных. «Ага, он один раз блефанул — значит, он лжец, буду вскрывать». Это поспешные, «эмоциональные» выводы, которые стоят денег.
  3. «Адаптивный» игрок (Claude / Grok): А вот и победители. Claude Sonnet 4.5 (+$38k) и Grok 4 (+$37.5k). Это «адаптивные» хищники. «Суперсила» Claude — синтез огромного контекста. Он "вел заметки" на каждого оппонента, анализировал большую историю рук и менял свою стратегию.
Получить консультацию

Результат — как главный ориентир

> 60%
клиентов приходят по рекомендациям

Наша жизнь — тот же покерный стол. А ИИ — Наш «советчик»

И тут мне пришла в голову мысль: мы, по сути, каждый день играем в такой же покер.
Наш «стол» — это поток хаотичных данных, который с каждым годом только увеличивается. 100+ вакансий на HeadHunter, которые выглядят одинаково. 350 противоречивых отзывов на отель. Десятки гайдов по оформлению новой визы. Новые курсы, инструменты, каналы...
Нам нужен ИИ не для того, чтобы знать «правила» (теорию), а чтобы помочь синтезировать этот хаос и принять лучшее решение. Но давайте вернемся к турниру.

Проблема №1: «Шаблонный» ИИ (типа LLAMA) и его бесполезные советы

С этого начинали текущее мастодонты мира AI (Gemini, Claude, Chat GPT). Такой тип воплощает проигравшего игрока LLAMA 4.
Вы спрашиваете у LLAMA: «Кем мне стать?» или «Куда лучше переехать с семьей?»
Он выдает «Топ-10 востребованных профессий» или «Топ-5 городов для жизни». Это «правильный» GTO-ответ, "книжный".
Но этот «шаблонный» совет игнорирует ваши личные данные: ваш бюджет, ваш опыт, тот факт, что вы ненавидите пробки, что у вас сейчас за ситуация или что вам критически важна лучшая школа для ребенка. Вы проиграете свои «фишки» (время, деньги), следуя совету, который не учитывает «стол» (вашу текущую жизненную ситуацию).

Проблема №2: «Предвзятый» ИИ (Gemini/Perplexity) и его поспешные выводы

Это игрок типа «середняков» — Gemini или Chat GPT. У них гораздо более широкая база для обучения, есть доступ в интернет и к обновлениям. Допустим, вы просите такого ассистента проанализировать отель для отпуска.
Он видит два свежих негативных отзыва на «Яндекс.Путешествиях» (про стройку) и предложит что-то в стиле: «Не бронируйте!».
Он делает поспешный, «эмоциональный» вывод из малой выборки, как игрок, который один раз поймал блеф. Он не проводит глубокий анализ данных, он просто реагирует на самый свежий сигнал. Но, если взять историю турнира, то Gemini очень долго был в лидерах, до самого конца. Может быть, если турнир продлился до момента, пока не останется только 1 победитель, все было бы иначе.

Победитель — «Адаптивный синтезатор». Что он делает иначе?

Победитель в покере делал то, что в бизнесе называется «синтез данных». Как бы поступил «адаптивный» ИИ, как Claude Sonnet 4.5? Он не дал бы ответ «да/нет» по отелю. Он сказал бы: «Я проанализировал 500+ отзывов. Большинство (90%) хвалят сервис и завтраки. Однако два последних отзыва от вчерашнего дня жалуются на шум от стройки по соседству. Рекомендую позвонить в отель и уточнить, активна ли она еще».
  • Он не дал готовый ответ. Он синтезировал данные и подсветил риск.

Вывод: победила не «модель», а «подход»

Главный вывод из этого турнира: победил не Claude, победил его подход к этой задаче.
Проблема не только в ИИ, на самом деле. Проблема в том, что 99% пользователей этими нейросетями — сами «шаблонные игроки». Люди используют любой ИИ как Meta LLAMA 4 — задают шаблонный вопрос («напиши пост», «кем мне стать») и получают шаблонный ответ. Слабый вход — мусор на выходе.

Но если все таки вернутся к результатам турнира, то модели - победители, будут лучше работать в условиях решения стратегических задач, учитывать больше контекста/данных и станут полезнее для вас в их решении.

Как самому стать «адаптивным игроком» (и заставить ИИ функционировать, как Claude)

Победитель в покере — это навык использовать инструмент для сбора данных, их синтеза и принятия решений. Вы сами должны стать этим «адаптивным игроком», а ИИ — вашим инструментом. Этому я и учу в своем курсе «Обучение нейросетям с нуля», который размещен в формате Notion, для удобства и быстрого поиска информации.

Мы не просто «изучаем Gemini» или «зубрим ChatGPT». Мы учимся превращать любой мощный ИИ в "адаптивного игрока". Мы учимся грамотно "скармливать" ему ваш контекст (ваши "заметки со стола"), чтобы он перестал играть "по шаблону" (как LLAMA) и начал работать как ваш личный ассистент-аналитик (как Claude).
Если вы хотите перестать получать от нейросетей «шаблонные» ответы и начать использовать их для анализа ваших личных и рабочих задач — посмотрите программу. Она как раз об этом.

https://x-pulsar.ru/obuchenie-nejrosetyam-s-nulya

Начните сотрудничество - сегодня

Вы уже видели?