logo

AlphaZero vs Stockfish: la increíble 5ª partida

Entre las 10 partidas publicadas por los investigadores, hay varias espectaculares. La 5ª partida fue una de ellas, en la que se vió algo “más allá” de lo que hace un motor de ajedrez “normal”.

9 de diciembre de 2017

Puedes ver la primera entrega aquí:

AlphaZero: Inteligencia artificial progresa sola en ajedrez y gana a Stockfish 8 (1)

Partida 5: piezas fuera de juego y dura iniciativa en el otro lado (2)

7.Pd5

Como ya expuse, para mí esto fue muy muy sorprendente. Lo que sigue es, tan sólo, mi opinión personal.

No porque este sacrificio de peón no sea conocido – constituye el comienzo de una línea muy jugada hoy día – sino porque realizarlo debería implicar mucha profundidad. En el sentido de que se sacrifica un peón, pero los factores dinámicos que van a surgir a partir de ahora son muy difíciles de ponderar. Traducido: no es posible “saber” si habrá compensación o no por el peón entregado.

Salvo que… no estés mirando sólo el “valor” del peón que entregas, sino también el “valor real” – ahora y en las próximas jugadas – de las piezas negras que, previsiblemente, quedarán hibernando en el lado izquierdo del tablero. Y también su escasa capacidad de coordinación a corto plazo. Y a todo esto le asignes – en la red neuronal pesos – “interesantes” (por decirlo de alguna forma). Es una hipótesis, claro.

AlphaZero ponderó bastante bien la actividad de piezas propias y su coordinación, al igual – por lo visto – que la falta de actividad y coordinación de las del otro jugador

Recordemos que AlphaZero no contaba con las numerosas partidas jugadas por los humanos con esta línea. Un Gran Maestro humano conoce que tales factores dinámicos van a estar ahí mucho tiempo, en detrimento de las piezas negras del ala izquierda. Por ejemplo, dado que el cruce a través del centro se tornará muy complicado, las piezas negras del ala de dama no podrán salvar la distancia para acudir en defensa del rey (que está en el otro lado).

Por lo visto, AlphaZero también “comprendía” la relevancia de estos factores dinámicos y, lo que es más interesante: la posibilidad de “estirarlos” para que dejaran de ser factores de corto plazo y convertirlos así en factores de medio/largo plazo.

Para ello aplicó un cálculo concreto muy exacto – orientado a la creación rápida de amenazas lejos de aquellas piezas negras – para mantener estos factores dinámicos bajo control durante mucho tiempo.

Por otro lado, y pensando a la inversa, cabe preguntarse si precisamente estar ajenos a los elementos profundos de este tipo de situaciones no ha condicionado la evolución ajedrecística de nosotros, los humanos (y los programas informáticos programados por nosotros). Esta es una idea breve – aunque especulativa – del asunto:

1) Hasta el siglo XX había una notable primacía del comienzo con 1.Pe4

2) Con 1.Pe4 hay pocas situaciones que terminen con un fianchetto (jugar el alfil entre los peones, ver imagen) aceptable de las negras en el ala de dama (ya que el alfil “chocaría” directamente contra el peón blanco de e4) [ii]. Por tanto, ver fianchettos cruzados es difícil con 1.Pe4.

3) Hasta la década de los 1950s los sacrificios de peón más probados eran los que luchaban por el control del centro: gambito de rey o de dama, gambito escocés, etc. Otros, como el Budapest, que no trata de conquistar el centro, eran poco utilizados.

4) En la década de los 1950s se introduce un gambito estratégico sorprendente: el gambito Volga, donde la apertura parcial de dos columnas permite presionar el flanco de dama del otro jugador.

Pero hasta la década de los 1980s apenas parece haber partidas con el tipo de gambito de AlphaZero con el fianchetto cruzado, basado en dejar inactivas las piezas de ese lado y jugar con mucha energía en el otro.

Aunque es especulativo, estas situaciones parecen integrar muchos factores dinámicos de medio/largo plazo que quizá podrían constituir una pieza clave para un avance cualitativo en nuestra comprensión ajedrecística. Naturalmente, lo están siendo en los últimos 15 años o así, como vemos en las partidas de la élite.

10.Cf5

Jugando en la parte derecha, lejos de las piezas encerradas negras. Viene el avance del peón a e4, la salida del caballo por c3 y, según juegue el negro, la llegada de la dama a g4.

14.Pe5

Natural, pero implica la entrega de un segundo peón, lo cual son ya palabras mayores.

16.Cc3

Tras la salida del alfil por f4 y la retirada del caballo negro las blancas intensificarán su potencia de ataque sobre el enroque: Ce4, Dg4, etc.

Lo que sigue no ocurrió, ya que ante la amenaza del caballo la dama negra jugó 17…D(f6)-g6. Sin embargo 17… Dd8 (posición) sería crítica, al intentar un desarrollo rápido de piezas (Pd5, Cd7, etc).

Tras 18.Ah3! Pd5 19.Ag5!! obtenemos un rápido desequilibrio de atacantes/defensores en el ala de rey (aunque todo está en el aire). Estos temas son conocidos de las partidas históricas entre personas, pero da frío pensar en el cálculo que conlleva.

La situación anterior puede derivar – 19… Pf6 20.Cxf6+ Pgxf6 21.Ah6 en ésta:

El ataque blanco es mortal.

Igualmente, AlphaZero mantiene bajo control (táctico) el trasvase de piezas negras del flanco de dama a través del centro del tablero. Si 18.Ah3! Ac4 (rumbo a e6) 19.Dh5!

El caballo blanco saltará a g5, lo cual impide ahora el retroceso del alfil negro a e6 (habría luego Cxe6 y Axh6).

18.h4!

Hoy en día es conocida la potencia de estos avances de peones (Ph4-h5-h6), capaces de conseguir debilitar casillas importantes de un enroque (como f6). No es fácil para las negras evitar que este peón monte la tienda de campaña en h6. Un intento habitual, como ocurrió, es situar el peón negro en esa casilla (18… Ph6), pero tras 19.Ph5 De6… sigue 20.g4 y se aprovecha el avance del peón negro a h6 para abrir brecha:

Mientras, las lejanas piezas negras pueden verlo todo con prismáticos…

Así, la dama negra debió refugiarse en la casilla h7, lo cual limitó de modo alarmante su “valor real”. Tras 20… Pf5 (no se jugó) se podría producir esta situación:

La retirada 21.Dd1 es buena, y si 21…Pfxe4 22.Axe4 deja a la dama negra maltrecha, como en la partida. Por ejemplo, se podría llegar aquí:

La coordinación de las piezas blancas es excelente. No es claro cuánto “valen” las piezas negras, pero deberían ir perdiendo de bastante material-que-puede-hacer-cosas-útiles, en este momento.

21.Ag5!!

¡Wow! ¡Otros programas informáticos tardan mucho en hacer – o no hacen – esta jugada! Las negras estaban intentando desarrollar con Pd5 y Cd7. Pero las blancas llegan antes: amenazan 22.Cf6! Como lectura importante de estas posiciones tenemos un punto crucial: mantén la iniciativa, pero evita que el otro lleve a cabo sus ideas [buenas].

Si el alfil es capturado llegamos a esto:

Goodbye.

27.Ah4!

Estas jugadas son sencillas para cualquier programa, pero siempre impresiona verlas. Las blancas ignoran toda recuperación rápida de material y coordinan las piezas al máximo. En realidad, si el alfil no se hubiera retirado las negras podrían defenderse con 27…Td5! Ahora no es posible por la captura en d5 y luego Te8+. Ahora, tras 28.Pg4, se recuperará todo el material con intereses.

No está claro que el blanco haya ido por debajo de material – en cuanto al valor “real” de las piezas – en ningún momento. ¡Esa es la lección de AlphaZero!

31.Ag3!!

Las piezas negras del ala de dama no tienen apenas valor real ahora mismo. Por tanto, AlphaZero sigue concentrando su potencia de fuego en la otra parte del tablero. Las blancas buscan la coordinación máxima sobre el peón g7 con Ae5 y Te7. Tras esto, Txg7 y Dxh6+ conduciría al mate.

AlphaZero ganó material, ¡pero alcanzó una posición que a un humano podría ocasionarle sudores fríos! Es lo que llamamos “técnicamente difícil de imponer”. Eso, o un montón de tacos juntos…

Y es en este momento donde – para mí – AlphaZero se equivoca. Es sólo una opinión.

En la posición de abajo, la IA de Google coordinó las piezas nuevamente tras 39.Ae5. Hay que hacer notar que si 39.Af8 seguía 39…Cd7, salvando todo.

Centralizar el alfil parece estar bien, pero la posición se volvió muy complicada de ganar tras el cambio de los peones h y g. En su lugar, parece muy interesante tratar de fijar el peón b6 – inmovilizarlo para atacarlo – con 39.Pa4:

No es que se busque ganar el peón con el ataque rápido Ac7 – las negras llegan justo a tiempo con la defensa táctica Cd7 y Ad5 -. Por un lado, se mantiene el peón h5. Por otro lado, al rey negro le resulta muy difícil actuar – tampoco puede aprovechar su valor real, en ambos sentidos -. El rey blanco, por el contrario, sí puede hacerse valer. Según jueguen las negras Ac7, seguido por Axb6 (y si se captura Ta6), o simplemente Rg2-f3-e4 debería ser ganador.

Por ejemplo, si las negras tratan de activar su rey, podríamos ver esto:

El blanco no debería cambiar muchos peones, ya que podría haber un empate próximo por falta de candidatos para ascender a la familia real (coronar una dama). Pero ahora el alfil blanco podrá reubicarse en d4, representando el papel que jugaban las velas para un barco en un día de viento.

Tras un laborioso proceso, AlphaZero dio el golpe final 86.Pf4!

Hagan lo que hagan las negras, pierden un peón (o si 86…Rf7 87.Pf5). Stockfish aguantó, pero no había esperanza (virtual).



Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Si continúas utilizando este sitio, aceptas el uso de las cookies. Más información

Las opciones de cookie en este sitio web están configuradas para "permitir cookies" para ofrecerte una mejor experiéncia de navegación. Si sigues utilizando este sitio web sin cambiar tus opciones o haces clic en "Aceptar" estarás consintiendo las cookies de este sitio.

Cerrar