ArenaPredictor

⚡ Live Inference Stats

Прогнозов выдано

За всё время

Сегодня

Новых прогнозов

7.2

Avg Confidence

Из 10

Ожидают решения

Требуют внимания

🏒

Матчи сегодня

Загрузка...

5 лиг

🎯

Предложено ставок

0 ставок

CPP Logic

📱

Telegram Bot

Подключён

● Active

🔄

Odds Monitor

Остановлен

🎯

54.4%

Accuracy

📈

+11.8%

ROI (CPP)

🔥

62.6%

Win Rate

⚡

23ms

Inference

🧠

Epochs

LSTM + Random Forest Ensemble v2.1.0

Гибридная система машинного обучения, комбинирующая LSTM нейросеть для анализа последовательностей матчей с Random Forest для паттерного распознавания. Обучена на 7 сезонах NHL с интеграцией CPP-логики для определения критических точек разрыва серий.

112

Признаков

5,320

Матчей

847K

Параметров

📚 Как работает AI

Ликбез по машинному обучению на примере нашей системы

🎯 Зачем нужно машинное обучение?

Человек физически не способен запомнить и проанализировать 5320 хоккейных матчей, найти в них закономерности, учесть сотни факторов одновременно и вычислить вероятности исходов. Компьютер может.

Машинное обучение — это способ научить компьютер находить паттерны в данных, которые человек не видит. Модель анализирует тысячи прошлых матчей и выявляет: "когда сходятся такие-то условия, в 63% случаев побеждает гостевая команда".

Цель нашей системы: превратить историю матчей в прибыльные прогнозы, находя ситуации, где вероятность исхода выше, чем думают букмекеры.

5,320

Матчей проанализировано

112

Факторов учтено

Сезонов NHL

📊 Данные — топливо модели

Качество прогнозов напрямую зависит от качества данных. Мы используем официальную статистику NHL за 7 сезонов (2016-2023), дополненную историческими коэффициентами букмекеров.

Что записывается по каждому матчу:

⚔️ Команды

Кто играл дома, кто в гостях

🏆 Результат

Счёт, победитель, овертайм

📅 Дата и время

Когда играли, день недели

💰 Коэффициенты

Odds на победу каждой команды

Важно: Коэффициенты букмекеров — ценный источник информации. Они отражают коллективное мнение рынка о вероятности исхода. Коэффициент 2.0 означает, что букмекер оценивает шансы команды в 50%.

🔢 Признаки — язык модели

Модель не понимает человеческий язык. Она не знает что "Calgary хорошо играет дома". Но она понимает числа: home_win_streak = 5, goals_per_game = 3.2.

Признак (feature) — это численная характеристика, которую модель может "увидеть" и использовать для предсказания. Мы преобразуем сырые данные матчей в 112 признаков.

📈 Серии 24

Победы/поражения подряд дома и в гостях, длина серий, достижение критических порогов

⚔️ H2H История 18

Результаты личных встреч команд: кто побеждал, когда, с каким счётом

⚽ Форма 32

Голы забитые/пропущенные, % побед за последние 5/10 игр, тренды

💰 Коэффициенты 12

Odds обеих команд, implied probability, разница коэффициентов, статус андердога

📅 Календарь 16

Дни отдыха, back-to-back игры, домашние/гостевые серии

🔗 Синергия 10

Комбинации паттернов, количество совпадающих сигналов

# Пример: как матч превращается в признаки
match = "Calgary vs Edmonton"

features = {
  "home_win_streak": 5,      # Calgary выиграла 5 дома подряд
  "away_loss_streak": 4,     # Edmonton проиграла 4 на выезде
  "h2h_home_wins": 4,        # Calgary выиграла 4 из 5 H2H
  "home_odds": 1.85,          # Коэффициент на Calgary
  "synergy_count": 3,        # 3 паттерна указывают на Edmonton
  ... # ещё 107 признаков
}

🎓 Обучение — поиск закономерностей

Обучение модели — это процесс, в котором алгоритм анализирует тысячи примеров и находит правила, которые позволяют предсказывать результат. Модель ищет зависимости вида: "когда домашняя серия > 4 И коэффициент гостей < 2.5, гости побеждают в 63% случаев".

📊

Данные

5320 матчей

→

✂️

Разделение

80% / 20%

→

🧠

Обучение

Поиск правил

→

✅

Проверка

Тест на 20%

Почему делим на 80% и 20%?

Если проверять модель на тех же данных, на которых она училась — она покажет отличный результат, но на новых матчах провалится. Это называется переобучение (overfitting).

Представьте студента, который выучил ответы на все задачи из учебника, но не понял принцип решения. На экзамене с новыми задачами он провалится. Поэтому мы учим модель на 80% матчей, а проверяем на 20%, которые она никогда не видела.

Метрики успеха: Accuracy (% правильных прогнозов) показывает общую точность. Но для ставок важнее ROI — возврат инвестиций. Модель с 52% accuracy может быть прибыльной, если правильно выбирает матчи с высокими коэффициентами.

🌲 Random Forest — ансамбль деревьев решений

Random Forest (случайный лес) — это 100 деревьев решений, каждое из которых обучено на случайной выборке данных. Каждое дерево "голосует" за исход, и побеждает большинство.

Дерево решений — это цепочка вопросов "да/нет":

Домашняя серия > 4?
├─ Да → H2H серия > 3?
│        ├─ Да → Синергия ≥ 2?
│        │        ├─ Да → Гости победят (85%)
│        │        └─ Нет → Неопределённо (52%)
│        └─ Нет → Коэффициент гостей < 2.5?
│                ├─ Да → Хозяева (58%)
│                └─ Нет → Гости (61%)
└─ Нет → ...

Почему "случайный лес" работает лучше одного дерева?

Одно дерево может ошибиться — оно переобучится на своих данных. Но когда 100 деревьев, каждое обученное на разных примерах, голосуют вместе — их ошибки компенсируются, а правильные ответы усиливаются. Это называется "мудрость толпы".

100

Деревьев в лесу

112

Признаков

54.4%

Accuracy

🧠 LSTM — нейросеть с памятью

LSTM (Long Short-Term Memory) — это тип нейронной сети, который умеет работать с последовательностями. В отличие от Random Forest, который видит только текущий матч, LSTM анализирует последние 10 матчей каждой команды как единую историю.

🏒

Матч -10

16 признаков

→

🏒

Матч -9

16 признаков

→

...

→

🏒

Сегодня

16 признаков

→

🎯

Прогноз

Win/Loss

Что видит LSTM в каждом матче (16 признаков):

⚽ Голы

Забито и пропущено

🏠 Площадка

Дома или в гостях

🏆 Результат

Победа/поражение, OT

💰 Odds

Коэффициенты, андердог

Преимущество LSTM: сеть видит контекст. После 5 побед подряд команда может быть уставшей или наоборот — "в потоке". LSTM учитывает такие динамические паттерны, которые Random Forest не видит.

Матчей в памяти

Признаков на матч

56.2%

Accuracy

📋 CPP — экспертные правила

CPP (Critical Pattern Prediction) — это набор правил, основанных на экспертном анализе хоккея. Машинное обучение не всегда находит очевидные закономерности. Иногда человеческий опыт даёт лучшие результаты.

Ключевой принцип CPP: "Серии ломаются"

Когда команда выигрывает или проигрывает слишком много матчей подряд — вероятность прерывания серии растёт. Победные серии заканчиваются из-за усталости и расслабленности. Серии поражений заканчиваются из-за мотивации и статистического возврата к среднему. Мы определили критические длины серий на основе анализа 5320 матчей:

🏠 Домашняя серия

Критическая длина: 4+ побед/поражений

✈️ Гостевая серия

Критическая длина: 3+ побед/поражений

📊 Общая серия

Критическая длина: 5+ побед/поражений

⚔️ H2H серия

Критическая длина: 4+ побед/поражений

Синергия — когда несколько паттернов указывают на одну команду одновременно. Если домашняя серия Calgary = 5 И H2H серия Calgary = 4 И гостевая серия Edmonton = 4 поражения — это синергия 3, и мы ставим на Edmonton (прерывание всех серий).

Результаты бэктеста CPP:

🏆
Лучшая комбинацияAwayLoss + HomeWin + Overall → Break
+64.3%
ROI

🎯

H2H + HomeLoss

Синергия 2+

+27.4%

ROI

📊

Базовая синергия

AwayLoss + HomeWin

+11.8%

ROI

🎯 Как система находит выгодные ставки

Разберём реальный пример: Edmonton Oilers @ Calgary Flames

Calgary Flames

Дома

Edmonton Oilers

В гостях

📈

Calgary

побед дома подряд → пора прерваться

📈

Edmonton

поражения на выезде → пора прерваться

⚔️

Личные встречи

1-4

Calgary доминирует → пора прерваться

⚡ Синергия: 3 паттерна указывают на прерывание

✅

ArenaPredictor

AI Model Dashboard

⚡ Live Inference Stats

LSTM + Random Forest Ensemble v2.1.0

📚 Как работает AI

🎯 Зачем нужно машинное обучение?

📊 Данные — топливо модели

⚔️ Команды

🏆 Результат

📅 Дата и время

💰 Коэффициенты

🔢 Признаки — язык модели

📈 Серии 24

⚔️ H2H История 18

⚽ Форма 32

💰 Коэффициенты 12

📅 Календарь 16

🔗 Синергия 10

🎓 Обучение — поиск закономерностей

🌲 Random Forest — ансамбль деревьев решений

🧠 LSTM — нейросеть с памятью

⚽ Голы

🏠 Площадка

🏆 Результат

💰 Odds

📋 CPP — экспертные правила

🏠 Домашняя серия

✈️ Гостевая серия

📊 Общая серия

⚔️ H2H серия

Лучшая комбинация

H2H + HomeLoss

Базовая синергия

🎯 Как система находит выгодные ставки

Рекомендация системы