Ordenador vence a jugador profesional de GO 5-0

Pensator · 14 de Marzo de 2016, 14:04:01

Me ha encantado este analisis de la partida:

https://gogameguru.com/lee-sedol-defeats-alphago-masterful-comeback-game-4/

kalamidad21 · 14 de Marzo de 2016, 19:23:55

Resumen, la partida más brillante de uno de los jugadores de Go más brillante, consigue encontrar un bug, en una rara situación especial, en que el ordenador se vuelve tonto, y jugando con precisión consigue aprovechar la ventaja obtenida para obtener una de sus más famosas victorias. Se duda de que se vaya a encontrar en otra igual.

¿Es más o menos correcto el resumen?

ewok · 14 de Marzo de 2016, 20:05:55

Yo no lo llamaría bug ("debilidad" en el juego de alphago creo que sería más apropiado) pero por lo demás creo que correcto, sí

Wkr · 14 de Marzo de 2016, 20:24:33

Básicamente, se trataba una jugada no contemplada en su heurística. Alphago no encontró una solución óptima, ni el camino más corto. Vamos, el coreano hizo una jugada que dio como resultado un "malfunction". XD Lamentablemente, ahora supongo que ya la tendrá en cuenta (en teoría, alphago aprende, o sus programadores habrán modificado el algoritmo para mejorar su heurística y evitar colapsos futuros). Así que va a ser difícil que se la vuelvan a colar.

ewok · 15 de Marzo de 2016, 09:14:03

Si no lo he entendido mal (aviso ya que no controlo de Go), la cosa va un poco así:
.- El estilo de juego 'humano' tiende a basar la toma de decisiones según la proyección de la jugada en cuestión contra el devenir global de la partida.
.- AlphaGo, por contra, evalúa cada pequeña jugada en sí misma calculándole un factor, cuánto valor representa perder cada pequeña batalla en vista a la partida en global.

Por lo que he entendido, Lee logró leer correctamente este comportamiento y planteó en la cuarta partida una estrategia de intentar "pequeñas victorias" en el borde/esquinas dejando a priori "vendido" el centro del tablero (lo cuál parece no ser una estrategia muy lógica o dentro de los cánones).

AlphaGo, mientras, asumía que los pequeños botines no representaban una amenaza real y, a partir del contraataque en el centro de Lee, no ha sido capaz de gestionar la situación.

Más allá de que el partido está ya visto para sentencia, súper interesante el tema, la verdad.

mazmaz · 15 de Marzo de 2016, 10:30:51

AlphaGo vuelve a ganar y quedan 4-1. La partida parece que fue la más disputada y AlphaGo logró remontar un error temprano.

Jsper · 15 de Marzo de 2016, 10:42:19

Escribo sólo para dar las GRACIAS por este hilo tan interesante.

Entre 'independentismos catalanes' e hilos de venta cícliclos, se agradece de veras recuperar el verdadero espíritu de la BSK.

ewok · 15 de Marzo de 2016, 10:56:05

Pues sí, acaba de terminar el 5º juego con victoria para AlphaGo con blancas por +2.5pts

Parece que el komi para blancas ha sido de 7.5, lo que no sé es si éste ha sido el komi para los cinco juegos o solo para éste último, entiendo que para todos.
Yo pensaba que el komi que se usaba habitualmente eran 5.5, ¿algún entendido?

Habría ganado AlphaGo igualmente por +0.5 pero habla de lo ajustado que ha debido ser este último juego.

Pensator · 15 de Marzo de 2016, 13:02:20

Por otra parte, hay que reconocer el merito y las agallas de Sedol. En teoria en la quinta partida sorteaban color, pero el pidio jugar a Google jugar con negras, porque habia detectado que cuando AlphaGo jugaba con Negras era un poco peor y el queria el reto al máximo.

Es decir, con negras mueves primero pero tienes que recuperar 7.5 pts, a Alphago le es mas facil jugar segundo y defender esos 7.5pts que al reves. Y Sedol quiso ponerselo facil Alphago, para aunque hubiera perdido el computo global, haberle ganado con ambos colores.

Por cierto, la 4a partida no fue un bug, los comentaristas daban la victoria a AlphaGo, lo que la jugada de Lee Sedol fue increible. El caos de Alphago fue cuando vio que en principio perderia la partida y entonces fue cuando ya perdio los papeles mas de lo que los perderia un gran maestro.

Tambien han dicho que cuando va ganando claramente Alphago, aun juega muy conservador y no sabe aprovechar esa situación como un gran maestro (aunque acaba ganando, pero supongo para el lo importante es ganar, le da igual que sea por 0,5 que por 70).

Por otra parte, sin tener ni por asomo nivel para comprender lo que pasa en su totalidad, si que me da la sensación, que aunque autoaprenda el programa, si no lo tocaran los desarrolladores y lo dejaran por si solo, al cabo de X partidas, 100, 500, 1000, las que fueran... Creo que Lee Sedol acabaria pillandole el truquillo al programa (teniendo en cuenta el factor autoaprendizaje).

ewok · 15 de Marzo de 2016, 13:19:20

Cita de: Pensator en 15 de Marzo de 2016, 13:02:20
Por otra parte, hay que reconocer el merito y las agallas de Sedol. En teoria en la quinta partida sorteaban color, pero el pidio jugar a Google jugar con negras, porque habia detectado que cuando AlphaGo jugaba con Negras era un poco peor y el queria el reto al máximo.

Es decir, con negras mueves primero pero tienes que recuperar 7.5 pts, a Alphago le es mas facil jugar segundo y defender esos 7.5pts que al reves. Y Sedol quiso ponerselo facil Alphago, para aunque hubiera perdido el computo global, haberle ganado con ambos colores.

Por cierto, la 4a partida no fue un bug, los comentaristas daban la victoria a AlphaGo, lo que la jugada de Lee Sedol fue increible. El caos de Alphago fue cuando vio que en principio perderia la partida y entonces fue cuando ya perdio los papeles mas de lo que los perderia un gran maestro.

Tambien han dicho que cuando va ganando claramente Alphago, aun juega muy conservador y no sabe aprovechar esa situación como un gran maestro (aunque acaba ganando, pero supongo para el lo importante es ganar, le da igual que sea por 0,5 que por 70).

Por otra parte, sin tener ni por asomo nivel para comprender lo que pasa en su totalidad, si que me da la sensación, que aunque autoaprenda el programa, si no lo tocaran los desarrolladores y lo dejaran por si solo, al cabo de X partidas, 100, 500, 1000, las que fueran... Creo que Lee Sedol acabaria pillandole el truquillo al programa (teniendo en cuenta el factor autoaprendizaje).

Gracias por el aporte, no sabía que había pedido Lee jugar con negras expresamente este 5º juego, qué crack

La verdad que su actitud ha sido exquisita desde la primera partida hasta el final.
Alucinante verle después de cada final de partida quedarse en la mesa un buen rato asimilando lo que ha ocurrido en la contienda, con un notable aspecto de estar totalmente exhausto.

No he visto todas las comparecencias que han ido haciendo tras cada juego pero en concreto en la de después del 4º juego que se llevó Lee, el responsable que hablaba por parte de AlphaGo le dio efusivamente las gracias por su generosidad de prestarse a participar en esto porque, reconocía el tipo, dentro del equipo de desarrollo habían llegado ya al límite de conocimiento para poder mejorar la IA y ponía en valor el poder contar con rivales de nivel TOP como Lee que dieran lugar a situaciones de juego aún más avanzadas para poder continuar con la mejora de la IA.

kalamidad21 · 15 de Marzo de 2016, 19:26:12

la cuestión, la verdadera cuestión, es cuando el ordenador aprenderá sólo, in intervención humana.

Sin que nadie le filtre las partidas. Dándole todas las partidas que quiera, contra otros rivales, o estudiando partidas anteriores (sin filtrar) y sacando conclusiones el solito (la máquina).

maltzur · 16 de Marzo de 2016, 02:20:46

Eso aún estamos lejos. Todos los sistemas expertos aun requieren bastante entrenamiento humano. Aunque cuando yo estudiaba complejidad algorítmica los profesores veían muy lejos poder derrotar a un maestro de go. Y mira tu por donde no ha tardado tanto.

kalamidad21 · 16 de Marzo de 2016, 07:53:36

Cita de: maltzur en 16 de Marzo de 2016, 02:20:46
Eso aún estamos lejos. Todos los sistemas expertos aun requieren bastante entrenamiento humano. Aunque cuando yo estudiaba complejidad algorítmica los profesores veían muy lejos poder derrotar a un maestro de go. Y mira tu por donde no ha tardado tanto.

Recuerda además que estamos cerca de un salto de capacidad con ordenadores cuánticos...., que no está tan lejos ya.

Lupus · 27 de Marzo de 2016, 13:48:14

Alguno de ustedes jugais regularmente online?
Teneis cuenta en OGS? Llevo un mes o dos y jugaria encantado contra cualquier compi bskero

Lopez de la Osa · 28 de Marzo de 2016, 09:03:21

Cita de: Lupus en 27 de Marzo de 2016, 13:48:14
Alguno de ustedes jugais regularmente online?
Teneis cuenta en OGS? Llevo un mes o dos y jugaria encantado contra cualquier compi bskero

¿OGS es https://online-go.com/? Entonces yo te sirvo; allí soy Lopez de la Osa.

Noticias:

Búsqueda

Usuario

Tiendas Amigas

Licencia CC

Patrocinadores

Ordenador vence a jugador profesional de GO 5-0

Pensator

kalamidad21

ewok

Wkr

ewok

mazmaz

Jsper

ewok

Pensator

ewok

kalamidad21

maltzur

kalamidad21

Lupus

Lopez de la Osa