14.05.2013

наиболее эффективное обучение игре

Возьмём какую-нибудь игру, в которой нужно соображать, то есть не основанную на физической силе. Чтобы научиться играть в эту игру, нужно различать правильный и неправильный ходы. Результат партии (выигрыш или проигрыш) является критерием суммарной правильности всех ходов партии. Результат партии — это обратная связь. Результат партии сообщает не более одного бита информации: выигрыш — единичка, проигрыш — нолик. Почему «не более», а не «ровно один». Количество информации зависит от вероятности выигрыша и проигрыша. Количество информации максимально (и равно одному биту), если верятность выигрыша равна вероятности проигрыша. Отсюда интересный вывод: чтобы увеличить скорость обучения, нужно уравнять вероятности, следовательно, нужно играть против человека, равного по силе.

Комментариев нет :

Отправить комментарий