Я, в общем-то, для того и зарегистрировалась здесь, чтобы эту ссылку разместить
Ссылка выглядит очень полезной
. Я уже возобновил своё исследование. Приступил к программному анализу новых данных. Планирую проверить свои новые идеи и гипотезы.
Возможно, будет велика погрешность, т.к. не учитываются результаты ITF турниров.
Посмотрим, пока ещё рано делать какие-то заявления. Но определённо, имея в подобном качестве ещё и турниры ITF, можно было бы творить чудеса .
Вы специально искали указанный ресурс или знали о нём до прочтения моей темы?
Видно, что вы проделали очень трудоемкую работу по сбору и анализу данных
Так и есть. На пути к тому, что сейчас имею
, после неудач в тестировании гипотез посещали мысли, что зря теряю время
и букмекера не победить
. После серьезных неудач думал, раз уж букмекер
существует давно и имеет ресурсов гораздо больше меня, то какие могут быть у меня шансы побороть его?
Но сомнения в успехе не отняли у меня веру.
Помню, что ещё со времен, когда я уже сознательно что-то мог делать, в казалось бы безвыходных/трудных ситуациях, мной всегда двигала сильнейшая мотивация. В проблемных ситуациях у меня крутились мысли "Этого не может быть. Не может быть, что я не справлюсь. Должна быть какая-то возможность. Какой-то не учтенный ресурс. Думай. Ищи. Пробуй." После такой своей давней "мантры", я находил в себе силы и продолжал двигаться к поставленной цели. Такая мотивация меня всегда приводила к поставленной цели. Да и в этот раз мне удалось в качестве промежуточного результата получить ценные факторы, существенно влияющие на оценку шансов исхода в матче
. Свой промежуточный результат решил проверить публично - создал данную тему.
, при этом добились очень хороших результатов, и зато вам еще раз - респект )
Сравнение "очень хороших" относительно и у каждого может отличаться.
По моим меркам, текущий результат, выше среднего.
Если бы по стратегии InVe_FDM удавалось угадывать с точностью от 75% до 85%, то такой результат я бы считал хорошим. В случае точности угадывания выше 85% - считал бы очень хорошим результатом. Молчаливо предполагаю, что для каждого случая количество подходящих событий в месяц должно быть примерно от 40. Если будет меньше событий, то от повышенной точности толку будет уже меньше. В частности, будет критичен пропуск одного прогноза
. С практической точки зрения нужно, чтоб событий было примерно до 150.
А можно поинтересоваться, используете ли вы при анализе статистики какие-нибудь инструменты интеллектуальной обработки данных
Пробовал.
Собственно, очень рассчитывая не некоторые из них, и взялся за дело. Очень оптимистично оценивал возможное качество программных прогнозов, так и по срокам за сколько достигну результата.
Но как уже писал выше, меня ожидал "облом"
. Пробовал один инструмент, получил облом, потом другой инструмент и опять "облом"
. Сценарий с обломом повторялся несколько раз. Исследование затянулось не на один месяц. Выше писал, что после таких обломов уже и сомнения начали появляется.
Оказалось, что не всё так легко. Если бы было легко, то и другие умники получили бы хорошие результаты.
Мои попытки - это полезные знания и опыт
. Теперь с оглядкой на прошлое, мне кажется, почему сразу-то самое важное не выделил, ведь знал о трудах одного математика?
(например, средства Data Mining, нейронные сети, деревья решений, еще что-то)?
Data Mining - слишком широкое понятие. Почти любой научный или околонаучный подход к получению и анализу данных будет относиться к Data Mining. Поэтому напишу о нейронных сетях, "деревьях", разных кластерных алгоритмах, регресиях, классификации и т.д.
А теперь подробнее про инструменты.
Когда брался за дело, я очень рассчитывал на нейронные сети. С нейронными сетями приемлемого результата не получил - обломился.
Данные для анализа, как оказалось, были плохие, непригодного качества (именно для анализа были мало пригодны). Кстати, мою оценку подтвердил известный специалист/эксперт в данной области. Даже его специальные программные обработки не позволили заметно улучшить качество данных. Пробовал MLP (многослойный персептрон) и RBF (радиальная базисная функция). Позже, когда у меня будет достаточно данных в хорошем качестве, попробую ещё раз "штурмануть" задачу при помощи нейронных сетей.
"Дерево решений", тоже пробовал. Почти сразу после облома с нейронной сетью. К тому моменту некоторые не самые значимые факторы, что уже вычислил более примитивными средствами, "дерево решений" лишь подтвердило мои оценки по условным границам при сравнениях (для оценок шансов на исход).
Пробовал кластерные алгоритмы (k-means, EM и другие), получил лишь подтверждение того, что уже имел на тот момент, и что очевидно без кластерных алгоритмов. А именно, совершенно очевидно, что если есть достаточное количество данных в пригодном для анализа состоянии, то будет существовать несколько плюсовых стратегий. Определенные перспективы движения в этом направлении есть, но с практической точки зрения не стал заморачиваться с ними. Я искал, очень простой и в тоже время эффективный способ. Особый интерес у меня был к "Карте Кохонена". Не исключаю, что позже вернусь к данному направлению, может даже чисто из любознательных соображений.
Самое простое, до чего в состояние догадаться большинство - это линейная регрессия. Но поставленная задача может решаться линейно, только в узких областях. Поэтому я не напирал на линейную регрессию. От других разновидностей регрессии пользы больше, но ввиду всё тех же причин, о которых писал раньше (качество данных), пришлось отложить эти инструменты до лучших времён.
О классификации особо расписывать смысла не вижу, т.к. для решения задач классификации могут использоваться почти все инструменты, о которых упоминал выше.
----
Мне удалось, опираясь на труды известного математика, получить очень значимый фактор для оценки шансов на исход
. Вычислить этот фактор ОЧЕНЬ ЛЕГКО и не нужны выше упомянутые инструменты
!
Собственно, поэтому если и буду возвращаться к интеллектуальным инструментам, то только из-за своей любознательности или при решение других задач
.
------------
Прогнозы если будут, то через час или полтора.