Принадлежащая Google компания DeepMind создала нейросеть AlphaZero, которая всего за четыре часа сумела самостоятельно научиться играть в шахматы так хорошо, что победила действующего чемпиона мира по этой игре — компьютерную программу Stockfish. Машины вообще играют в шахматы намного лучше людей: созданный IBM суперкомпьютер Deep Blue победил чемпиона мира по шахматам Гарри Каспарова ещё в 1997 году.
В отличие от других шахматных программ, алгоритм DeepMind не изучал успешные комбинации и не наблюдал за действиями живых игроков. Разработчики ограничились тем, что научили AlphaZero правилам, после чего нейросеть уже училась играть сама с собой. Как видно, такой подход оказался достаточно эффективным.
AlphaZero хорошо играет не только в шахматы. Нейросеть за два часа научилась побеждать в японских шахматах (сёги) и за восемь часов освоила игру го настолько, что победила предыдущую программу DeepMind AlphaGo. Последняя смогла победить одного из сильнейших в мире игроков Ли Седоля и чемпиона мира Кэ Цзё.