⚡ Live Inference Stats

41
Прогнозов выдано
За всё время
0
Сегодня
Новых прогнозов
7.2
Avg Confidence
Из 10
0
Ожидают решения
Требуют внимания
🏒
Матчи сегодня
Загрузка...
5 лиг
🎯
Предложено ставок
0 ставок
CPP Logic
📱
Telegram Bot
Подключён
● Active
🔄
Odds Monitor
Остановлен
🎯
54.4%
Accuracy
📈
+11.8%
ROI (CPP)
🔥
62.6%
Win Rate
23ms
Inference
🧠
50
Epochs

LSTM + Random Forest Ensemble v2.1.0

Гибридная система машинного обучения, комбинирующая LSTM нейросеть для анализа последовательностей матчей с Random Forest для паттерного распознавания. Обучена на 7 сезонах NHL с интеграцией CPP-логики для определения критических точек разрыва серий.

112
Признаков
5,320
Матчей
847K
Параметров

📚 Как работает AI

Ликбез по машинному обучению на примере нашей системы

🎯 Зачем нужно машинное обучение?

Человек физически не способен запомнить и проанализировать 5320 хоккейных матчей, найти в них закономерности, учесть сотни факторов одновременно и вычислить вероятности исходов. Компьютер может.

Машинное обучение — это способ научить компьютер находить паттерны в данных, которые человек не видит. Модель анализирует тысячи прошлых матчей и выявляет: "когда сходятся такие-то условия, в 63% случаев побеждает гостевая команда".

Цель нашей системы: превратить историю матчей в прибыльные прогнозы, находя ситуации, где вероятность исхода выше, чем думают букмекеры.

5,320
Матчей проанализировано
112
Факторов учтено
7
Сезонов NHL

📊 Данные — топливо модели

Качество прогнозов напрямую зависит от качества данных. Мы используем официальную статистику NHL за 7 сезонов (2016-2023), дополненную историческими коэффициентами букмекеров.

Что записывается по каждому матчу:

⚔️ Команды

Кто играл дома, кто в гостях

🏆 Результат

Счёт, победитель, овертайм

📅 Дата и время

Когда играли, день недели

💰 Коэффициенты

Odds на победу каждой команды

Важно: Коэффициенты букмекеров — ценный источник информации. Они отражают коллективное мнение рынка о вероятности исхода. Коэффициент 2.0 означает, что букмекер оценивает шансы команды в 50%.

🔢 Признаки — язык модели

Модель не понимает человеческий язык. Она не знает что "Calgary хорошо играет дома". Но она понимает числа: home_win_streak = 5, goals_per_game = 3.2.

Признак (feature) — это численная характеристика, которую модель может "увидеть" и использовать для предсказания. Мы преобразуем сырые данные матчей в 112 признаков.

📈 Серии 24

Победы/поражения подряд дома и в гостях, длина серий, достижение критических порогов

⚔️ H2H История 18

Результаты личных встреч команд: кто побеждал, когда, с каким счётом

⚽ Форма 32

Голы забитые/пропущенные, % побед за последние 5/10 игр, тренды

💰 Коэффициенты 12

Odds обеих команд, implied probability, разница коэффициентов, статус андердога

📅 Календарь 16

Дни отдыха, back-to-back игры, домашние/гостевые серии

🔗 Синергия 10

Комбинации паттернов, количество совпадающих сигналов

# Пример: как матч превращается в признаки
match = "Calgary vs Edmonton"

features = {
  "home_win_streak": 5,      # Calgary выиграла 5 дома подряд
  "away_loss_streak": 4,     # Edmonton проиграла 4 на выезде
  "h2h_home_wins": 4,        # Calgary выиграла 4 из 5 H2H
  "home_odds": 1.85,          # Коэффициент на Calgary
  "synergy_count": 3,        # 3 паттерна указывают на Edmonton
  ... # ещё 107 признаков
}

🎓 Обучение — поиск закономерностей

Обучение модели — это процесс, в котором алгоритм анализирует тысячи примеров и находит правила, которые позволяют предсказывать результат. Модель ищет зависимости вида: "когда домашняя серия > 4 И коэффициент гостей < 2.5, гости побеждают в 63% случаев".

📊
Данные
5320 матчей
✂️
Разделение
80% / 20%
🧠
Обучение
Поиск правил
Проверка
Тест на 20%

Почему делим на 80% и 20%?

Если проверять модель на тех же данных, на которых она училась — она покажет отличный результат, но на новых матчах провалится. Это называется переобучение (overfitting).

Представьте студента, который выучил ответы на все задачи из учебника, но не понял принцип решения. На экзамене с новыми задачами он провалится. Поэтому мы учим модель на 80% матчей, а проверяем на 20%, которые она никогда не видела.

Метрики успеха: Accuracy (% правильных прогнозов) показывает общую точность. Но для ставок важнее ROI — возврат инвестиций. Модель с 52% accuracy может быть прибыльной, если правильно выбирает матчи с высокими коэффициентами.

🌲 Random Forest — ансамбль деревьев решений

Random Forest (случайный лес) — это 100 деревьев решений, каждое из которых обучено на случайной выборке данных. Каждое дерево "голосует" за исход, и побеждает большинство.

Дерево решений — это цепочка вопросов "да/нет":

Домашняя серия > 4?
├─ ДаH2H серия > 3?
│        ├─ ДаСинергия ≥ 2?
│        │        ├─ ДаГости победят (85%)
│        │        └─ НетНеопределённо (52%)
│        └─ НетКоэффициент гостей < 2.5?
│                ├─ ДаХозяева (58%)
│                └─ НетГости (61%)
└─ Нет...

Почему "случайный лес" работает лучше одного дерева?

Одно дерево может ошибиться — оно переобучится на своих данных. Но когда 100 деревьев, каждое обученное на разных примерах, голосуют вместе — их ошибки компенсируются, а правильные ответы усиливаются. Это называется "мудрость толпы".

100
Деревьев в лесу
112
Признаков
54.4%
Accuracy

🧠 LSTM — нейросеть с памятью

LSTM (Long Short-Term Memory) — это тип нейронной сети, который умеет работать с последовательностями. В отличие от Random Forest, который видит только текущий матч, LSTM анализирует последние 10 матчей каждой команды как единую историю.

🏒
Матч -10
16 признаков
🏒
Матч -9
16 признаков
...
...
🏒
Сегодня
16 признаков
🎯
Прогноз
Win/Loss

Что видит LSTM в каждом матче (16 признаков):

⚽ Голы

Забито и пропущено

🏠 Площадка

Дома или в гостях

🏆 Результат

Победа/поражение, OT

💰 Odds

Коэффициенты, андердог

Преимущество LSTM: сеть видит контекст. После 5 побед подряд команда может быть уставшей или наоборот — "в потоке". LSTM учитывает такие динамические паттерны, которые Random Forest не видит.

10
Матчей в памяти
16
Признаков на матч
56.2%
Accuracy

📋 CPP — экспертные правила

CPP (Critical Pattern Prediction) — это набор правил, основанных на экспертном анализе хоккея. Машинное обучение не всегда находит очевидные закономерности. Иногда человеческий опыт даёт лучшие результаты.

Ключевой принцип CPP: "Серии ломаются"

Когда команда выигрывает или проигрывает слишком много матчей подряд — вероятность прерывания серии растёт. Победные серии заканчиваются из-за усталости и расслабленности. Серии поражений заканчиваются из-за мотивации и статистического возврата к среднему. Мы определили критические длины серий на основе анализа 5320 матчей:

🏠 Домашняя серия

Критическая длина: 4+ побед/поражений

✈️ Гостевая серия

Критическая длина: 3+ побед/поражений

📊 Общая серия

Критическая длина: 5+ побед/поражений

⚔️ H2H серия

Критическая длина: 4+ побед/поражений

Синергия — когда несколько паттернов указывают на одну команду одновременно. Если домашняя серия Calgary = 5 И H2H серия Calgary = 4 И гостевая серия Edmonton = 4 поражения — это синергия 3, и мы ставим на Edmonton (прерывание всех серий).

Результаты бэктеста CPP:

🏆
Лучшая комбинация
AwayLoss + HomeWin + Overall → Break
+64.3%
ROI
🎯
H2H + HomeLoss
Синергия 2+
+27.4%
ROI
📊
Базовая синергия
AwayLoss + HomeWin
+11.8%
ROI

🎯 Как система находит выгодные ставки

Разберём реальный пример: Edmonton Oilers @ Calgary Flames

Calgary Flames
Дома
VS
Edmonton Oilers
В гостях
📈
Calgary
5
побед дома подряд → пора прерваться
📈
Edmonton
4
поражения на выезде → пора прерваться
⚔️
Личные встречи
1-4
Calgary доминирует → пора прерваться
⚡ Синергия: 3 паттерна указывают на прерывание

Рекомендация системы

Победа Edmonton Oilers (гости)
76%
Win Rate
+27%
ROI
21
Ставок в истории
Уверенность модели 76%