La estrategia profunda de AlphaZero (1): versión Alejandro Magno
Lo que sigue es una visión general de la posible estrategia profunda de AlphaZero, que – creo – entra dentro del terreno de la suposición razonable. Se apreciará de manera muy visual y concreta en los diagramas de la partida.
Básicamente, la estrategia global de AlphaZero para estas situaciones de fianchettos cruzados con sacrificio de peón en d5 se basaría en dos pilares:
1) desequilibrio severo en el futuro de atacantes/defensores sobre el enroque negro y
2) minimización del valor “real” de las piezas negras.
Para aclarar el tema, vamos a imaginar un plan de ataque a Alejandro Magno.
Para aclarar el tema a quienes no saben mucho de ajedrez, vamos a imaginar una versión de “ataque a Alejandro Magno” (AM, desde ahora). Alejandro Magno y una parte de sus tropas se encuentran en un flanco (vamos a llamarlo “el flanco del rey”), dentro de una gran batalla.
Expondré, pues, cada punto, junto con su correspondiente “versión Alejandro”. Naturalmente, Alejandro sería el rey en la partida de ajedrez.
Básicamente, AlphaZero – blancas – estaría diciendo algo como:
1) Mi estrategia general desde aquí consistirá en pasar mis piezas al flanco de rey, para crear una severa situación de ataque. También cuentan las piezas de larga distancia (alfiles, básicamente), que podrán “disparar” sobre ese flanco sin necesitar estar presentes. Mi base “lógica” es que un desequilibrio de atacantes/defensores a mi favor (4-1, 3-1, 3-2…) sobre el enroque negro deberá ser muy peligroso.
El blanco cuenta con 4 atacantes, mientras el negro defiende sólo con la dama.
Versión Alejandro Magno: voy a atacar el flanco del rey – donde está Alejandro -, llevando allí más atacantes que defensores tenga Alejandro (crearé un desequilibrio). Por ejemplo, y simplificando: si hay 200 soldados en aquella zona, yo voy a intentar llevar 300 ó 400. Igualmente, podrían colaborar arqueros desde media o larga distancia.
2) Mi “táctica” general – en realidad es estrategia también – consistirá en impedir que sus piezas [negras] del otro flanco (Ab7 y Cb8, sobre todo, o los caballos de esta partida) crucen el centro del tablero y accedan al flanco de rey para ayudar en la defensa.
Los caballos negros están lejos del flanco de rey. En tanto, los alfiles blancos apuntan hacia él.
AM: voy a impedir que vayan en ayuda de Alejandro otros 100 o 200 hombres.
3) Cuando intenten cruzar a través del centro, lo adelantaré con tiempo en mi cálculo y se lo impediré.
Las negras podían intentar Cd6-f7-e5, o bien Cd6, Pf5 y Cde4. AlphaZero lo evita con la sutil 28.Td1 (ver comentario, en la partida).
AM: controlaré atentamente el centro de la batalla desde mi puesto en lo alto de la colina. Cuando aprecie tan sólo “síntomas” de que nuevas tropas se preparan para acudir a la zona de Alejandro enviaré tropas que las intercepten. Vamos, que seguiré el principio básico «no escribirás tu estrategia en piedra» y trataré de adaptar los movimientos de mis tropas a lo que ocurra durante la batalla.
3a) Si son los caballos los que intentan cruzar el centro para ayudar en la defensa, no me importará siempre y cuando:
– no cambien mis piezas ofensivas que operan a distancia del enroque (los alfiles, sobre todo)
– permanezcan en el centro, pero en casillas inestables (ya que los podrá expulsar con un peón, o se conseguirá con temas tácticos)
El caballo negro de e6 está en el centro, pero no podrá evitar ser expulsado por el peón f blanco.
AM: si dispongo de arqueros que puedan alcanzar la zona de Alejandro desde larga distancia, les mantendré a cubierto. Igualmente, si la caballería que va en su ayuda llega al centro de la batalla, pero no puede aguantar ahí mucho tiempo – por las causas que sea –, no me importa que esté en el centro temporalmente.
4) Mientras dichas piezas negras del flanco de dama estén casi inactivas, o no puedan coordinarse efectivamente con sus compañeras, su valor real no será el que los humanos le suelen dar – o el que le “insertan” a sus máquinas -. Serían el Ab7 y Cb8 en otras partidas, o aquí los caballos negros que no pueden coordinarse para realizar acciones útiles conjuntas.
¿Cuál es el valor “real” de las piezas rojas?
AM: Un soldado de Alejandro que no pueda actuar como tal – ha sido hecho prisionero, o ha quedado aislado de sus compañeros en la batalla – realmente no tiene el valor que un soldado libre, coordinado con sus compañeros de unidad (y otras unidades).
4a) El punto principal de mi estrategia: también impediré – tácticamente – que las torres negras o la dama tomen un valor real aceptable. ¿Cómo? Sencillamente, impidiendo que las torres jueguen por las columnas. O, si lo consiguen, neutralizando los puntos de entrada por dichas columnas.
Las dos torres negras apenas tendrán valor real en estas situaciones, ya que no podrán acceder a la columna e (única abierta, ya que sigue Ag6). Tampoco es posible cambiar una torre con Tfe8 (ver comentarios). En cambio, las torres blancas tienen un valor real muy alto, basado en su actividad, coordinación, dominio de la única columna abierta, puntos de entrada por ella, etc.
Si se trata de la dama, su valor “real” disminuye al limitarle notablemente su capacidad de movimiento y coordinación con otras piezas.
Igualmente, dichas torres, o al menos una de ellas, apenas contará como futura defensora del enroque; esto es así porque las torres desde abajo – la 8ª fila – apenas cuentan como defensoras. En cambio, mis torres podrán incorporarse al ataque – teniendo un elevado valor real – en varias situaciones:
– Entrada de la torre por la tercera o la séptima fila, sobre todo:
La torre blanca puede jugar por la tercera fila y crear amenazas concretas.
Por supuesto, ¡la entrada por la séptima fila, en buenas condiciones, es fantástica! Aquí las blancas amenazarían Ae8, por ejemplo, y mate en g7.
– Entrada de la torre por la columna h, en caso de que esta se abra. Por eso – tomo nota – en ocasiones provocaré el avance Pg7-g6 (con Ae4 y Dh5, por ejemplo), para crear contacto con Ph4-h5 y abrir la columna h. Partidas 3, 8 y 10.
En la partida 8, por ejemplo, las blancas jugaron previamente Ae4 y Dh5 para forzar Pg6 de las negras. Ahora pueden jugar Ph5 y abrir la columna h para la torre cuando sea oportuno. Por el contrario, la columna a de la torre negra no es útil, ya que una entrada virtual por a2 o a3 no encuentra posibilidad de coordinación con otra pieza de su equipo (dama o alfil).
4b) En los casos con doble fianchetto y sacrificio de peón en d5 es muy útil abrir y controlar la columna e, dado que así se impide el cruce de las piezas negras a través del centro.La columna e está controlada. Si el caballo negro la tapona saltando a e4, podemos expulsarlo avanzando el peón f a f3.
AM: si equiparamos las torres de ajedrez con lo que son, carros de combate, podemos imaginar que no pueden circular con normalidad – hay hombres caídos, ha llovido y el terreno se ha embarrado -. Por tanto, su valor real no es el que tendrían con buena maniobrabilidad. Dichos carros de combate no podrán molestar a mis tropas ni podrán acudir en defensa del “flanco del rey” de Alejandro.
En cambio, si nuestros carros tienen camino despejado pueden convertirse en una temible fuerza de ataque.
5) Realmente la cosa es más sencilla de lo que parece. Basta intentar lanzar el peón h2 hasta h6 en este tipo de situaciones para que las negras tengan que avanzar un peón de su enroque. En tal caso habrá debilidades que aprovechar.
Es difícil que ante un avance Ph4-h5-h6 las negras puedan mantener íntegros sus peones de enroque. Aquí, por ejemplo, jugaron Ph6. Hagan lo que hagan las negras, un movimiento del peón de enroque será un punto de contacto para las piezas blancas o dejará huecos – casillas poco protegidas – en las casillas de un cierto color (blancas, en la partida, al moverse los peones negros a h6 y g6).
AM: tengo una unidad disponible de (infantería) que puedo utilizar para debilitar las defensas de Alejandro. El terreno por el que avanzará es liso y su encuentro con las tropas de Alejandro prácticamente está garantizado. Es muy probable que origine debilidades en la formación defensiva del griego.
Naturalmente, como cualquier buena estrategia, el útil seguir el principio rector “no me escribas en piedra”. Son directrices generales, dispuestas a adaptarse de forma concreta conforme vaya cambiando la posición.
Todo esto se ve de forma muy clara en la partida 6 (ver próxima parte).
Si esto hubiera ocurrido así, desde el punto de vista del “lenguaje” de redes neuronales y aprendizaje por refuerzo esto significaría que AlphaZero habría ido “fortaleciendo” las conexiones relacionadas con los puntos anteriores. Es decir, como resumen:
AlphaZero podría estar sugiriendo: “los fianchettos cruzados” del tipo anterior
no son practicables en el ajedrez [con garantías de éxito].
Quizá muchas posiciones de aperturas del ajedrez lleven a un empate – o quizá el ajedrez, en su globalidad, “sea” un empate técnico (comenzando con cierta/s jugada/s concreta/s), al igual que las damas -, pero este tipo de situaciones no lo sería.
Podría ser que en estas situaciones el severo desequilibrio
flanco de rey/flanco de dama creado en la apertura ya no tenga remedio.
Pasemos ahora a ver la estrategia y su adaptación a las circunstancias, paso a paso:
Deja un comentario