Алгоритму AlphaZero, разработанному Google и DeepMind, хватило всего четырех часов игры с самим собой, чтобы самостоятельно синтезировать шахматные знания человечества за полтора тысячелетия и достичь уровня, который не только превосходит людей, но и позволяет громить чемпионов среди компьютерных алгоритмов.
Все блестящие хитрости и утонченности, которые программисты использовали для создания шахматных движков, были отправлены на свалку истории, отмечает портал Chess24.com.
Нейросеть победила сильнейшую шахматную компьютерную программу Stockfish 8 в ста партиях, не проиграв ни одной. Играя белыми, AlphaZero добилась 25 побед при 25 ничьих. Без преимущества первого хода ей удалось выиграть три партии при 47 ничьих. Итого в ста играх нейросеть одержала 28 побед, сведя остальные 72 вничью.
Как утверждают разработчики, AlphaZero достигла этого уровня всего через четыре часа после того, как в нее были загружены только базовые правила игры в шахматы, без дополнительных сведений о тактике, алгоритмах и дебютах.
В отличие от традиционных шахматных программ, AlphaZero выбирает ход не за счет перебора возможных вариантов, а применяя собственные алгоритмы, выработанные при самообучении. Для сравнения: AlphaZero рассматривала 80 тысяч позиций за секунду, тогда как Stockfish - до 70 миллионов.
Ранее детище DeepMind потратило два часа на постижение сеги (японские шахматы) и за восемь часов научилась безупречной игре в го.
По мнению компании-разработчика, в будущем подобные нейро-алгоритмы смогут решать важные исследовательские задачи, включая разработку новых лекарств и материалов.