Разработчики DeepMind создали нейросеть, которая смогла сама обучиться игре в шахматы за несколько часов и победила лучшие аналогичные алгоритмы.
Как отмечают журналисты Science Alert, программе потребовалось всего четыре часа, чтобы освоить все шахматные знания человечества.
После того, как алгоритм AlphaZero ознакомили только с правилами шахмат, без стратегии, всего за четыре часа он освоил игру в такой степени, что смог обыграть самую рейтинговую шахматную программу - Stockfish. В серии 100 игр против Stockfish, AlphaZero выиграл 25 игр, играя белыми, и три игры, играя черными. Остальные партии завершились вничью, побед у Stockfish не было.
"Теперь мы знаем, кто наш новый повелитель. Это, несомненно, будет революционизировать игру, но необходимо думать о том, как это может быть применено вне шахмат", - признался исследователь шахмат Дэвид Kремели, глава сайта Chessable.
Алгоритм AlphaZero был создан на базе наработок по программам AlphaGo и AlphaGo Zero, которые ранее стали абсолютными чемпионами в игре го. Подобно человеку, AlphaZero рассматривает меньше позиций, чем ее предшественницы. В отчете заявлено, что она оценивает 80 тысяч позиций в секунду в сравнении с 70 миллионами в секунду у Stockfish.
В отличие от предыдущих программ от DeepMind, AlphaZero создавался как алгоритм, способный научиться сразу нескольким задачам-играм, а не одной. Для этого алгоритм не обучали побеждать, а давали только базовые знания о правилах игры. AlphaZero затем играл сам с собой и самостоятельно вырабатывал тактику.
"Я всегда задавался вопросом, как это было бы, если бы более развитые виды высадились на Земле и показали нам, как они играют в шахматы. Теперь я это увидел", - сказал гроссмейстер Питер Хайне Нильсен, комментируя результаты AlphaZero.
Источник
Как отмечают журналисты Science Alert, программе потребовалось всего четыре часа, чтобы освоить все шахматные знания человечества.
После того, как алгоритм AlphaZero ознакомили только с правилами шахмат, без стратегии, всего за четыре часа он освоил игру в такой степени, что смог обыграть самую рейтинговую шахматную программу - Stockfish. В серии 100 игр против Stockfish, AlphaZero выиграл 25 игр, играя белыми, и три игры, играя черными. Остальные партии завершились вничью, побед у Stockfish не было.
"Теперь мы знаем, кто наш новый повелитель. Это, несомненно, будет революционизировать игру, но необходимо думать о том, как это может быть применено вне шахмат", - признался исследователь шахмат Дэвид Kремели, глава сайта Chessable.
Алгоритм AlphaZero был создан на базе наработок по программам AlphaGo и AlphaGo Zero, которые ранее стали абсолютными чемпионами в игре го. Подобно человеку, AlphaZero рассматривает меньше позиций, чем ее предшественницы. В отчете заявлено, что она оценивает 80 тысяч позиций в секунду в сравнении с 70 миллионами в секунду у Stockfish.
В отличие от предыдущих программ от DeepMind, AlphaZero создавался как алгоритм, способный научиться сразу нескольким задачам-играм, а не одной. Для этого алгоритм не обучали побеждать, а давали только базовые знания о правилах игры. AlphaZero затем играл сам с собой и самостоятельно вырабатывал тактику.
"Я всегда задавался вопросом, как это было бы, если бы более развитые виды высадились на Земле и показали нам, как они играют в шахматы. Теперь я это увидел", - сказал гроссмейстер Питер Хайне Нильсен, комментируя результаты AlphaZero.
Источник