Welcome to La BSK. Please login or sign up.

16 de Marzo de 2025, 19:47:40

Login with username, password and session length

Licencia CC

Patrocinadores

Dracotienda
Diario de WKR
Planeton Games
Dracotienda
Diario de WKR
Planeton Games

Ordenador vence a jugador profesional de GO 5-0

Iniciado por kalamidad21, 27 de Enero de 2016, 22:57:15

Tema anterior - Siguiente tema

kalamidad21

Resumen, la partida más brillante de uno de los jugadores de Go más brillante, consigue encontrar un bug, en una rara situación especial, en que el ordenador se vuelve tonto, y jugando con precisión consigue aprovechar la ventaja obtenida para obtener una de sus más famosas victorias. Se duda de que se vaya a encontrar en otra igual.

¿Es más o menos correcto el resumen?
Si no meneas el árbol, no cae la fruta

ewok

Yo no lo llamaría bug ("debilidad" en el juego de alphago creo que sería más apropiado) pero por lo demás creo que correcto, sí  :D

Wkr

Básicamente, se trataba una jugada no contemplada en su heurística. Alphago no encontró una solución óptima, ni el camino más corto. Vamos, el coreano hizo una jugada que dio como resultado un "malfunction". XD Lamentablemente, ahora supongo que ya la tendrá en cuenta (en teoría, alphago aprende, o sus programadores habrán modificado el algoritmo para mejorar su heurística y evitar colapsos futuros). Así que va a ser difícil que se la vuelvan a colar.

ewok

Si no lo he entendido mal (aviso ya que no controlo de Go), la cosa va un poco así:
.- El estilo de juego 'humano' tiende a basar la toma de decisiones según la proyección de la jugada en cuestión contra el devenir global de la partida.
.- AlphaGo, por contra, evalúa cada pequeña jugada en sí misma calculándole un factor, cuánto valor representa perder cada pequeña batalla en vista a la partida en global.

Por lo que he entendido, Lee logró leer correctamente este comportamiento y planteó en la cuarta partida una estrategia de intentar "pequeñas victorias" en el borde/esquinas dejando a priori "vendido" el centro del tablero (lo cuál parece no ser una estrategia muy lógica o dentro de los cánones).

AlphaGo, mientras, asumía que los pequeños botines no representaban una amenaza real y, a partir del contraataque en el centro de Lee, no ha sido capaz de gestionar la situación.

Más allá de que el partido está ya visto para sentencia, súper interesante el tema, la verdad.

mazmaz

AlphaGo vuelve a ganar y quedan 4-1. La partida parece que fue la más disputada y AlphaGo logró remontar un error temprano.

Jsper

Escribo sólo para dar las GRACIAS por este hilo tan interesante.

Entre 'independentismos catalanes' e hilos de venta cícliclos, se agradece de veras recuperar el verdadero espíritu de la BSK.
¡Busco fanzine Mondo Brutto nº1 y ofrezco juegos!

Me invaden más de 500

http://doceartistasyungandul.blogspot.com.es/

ewok

Pues sí, acaba de terminar el 5º juego con victoria para AlphaGo con blancas por +2.5pts

Parece que el komi para blancas ha sido de 7.5, lo que no sé es si éste ha sido el komi para los cinco juegos o solo para éste último, entiendo que para todos.
Yo pensaba que el komi que se usaba habitualmente eran 5.5, ¿algún entendido?

Habría ganado AlphaGo igualmente por +0.5 pero habla de lo ajustado que ha debido ser este último juego.

Pensator

Por otra parte, hay que reconocer el merito y las agallas de Sedol. En teoria en la quinta partida sorteaban color, pero el pidio jugar a Google jugar con negras, porque habia detectado que cuando AlphaGo jugaba con Negras era un poco peor y el queria el reto al máximo.

Es decir, con negras mueves primero pero tienes que recuperar 7.5 pts, a Alphago le es mas facil jugar segundo y defender esos 7.5pts que al reves. Y Sedol quiso ponerselo facil Alphago, para aunque hubiera perdido el computo global,  haberle ganado con ambos colores.

Por cierto, la 4a partida no fue un bug, los comentaristas daban la victoria a AlphaGo, lo que la jugada de Lee Sedol fue increible. El caos de Alphago fue cuando vio que en principio perderia la partida y entonces fue cuando ya perdio los papeles mas de lo que los perderia un gran maestro.

Tambien han dicho que cuando va ganando claramente Alphago, aun juega muy conservador y no sabe aprovechar esa situación como un gran maestro (aunque acaba ganando, pero supongo para el lo importante es ganar, le da igual que sea por 0,5 que por 70).

Por otra parte, sin tener ni por asomo nivel para comprender lo que pasa en su totalidad, si que me da la sensación, que aunque autoaprenda el programa, si no lo tocaran los desarrolladores y lo dejaran por si solo, al cabo de X partidas, 100, 500, 1000, las que fueran... Creo que Lee Sedol acabaria pillandole el truquillo al programa (teniendo en cuenta el factor autoaprendizaje).



ewok

Cita de: Pensator en 15 de Marzo de 2016, 13:02:20
Por otra parte, hay que reconocer el merito y las agallas de Sedol. En teoria en la quinta partida sorteaban color, pero el pidio jugar a Google jugar con negras, porque habia detectado que cuando AlphaGo jugaba con Negras era un poco peor y el queria el reto al máximo.

Es decir, con negras mueves primero pero tienes que recuperar 7.5 pts, a Alphago le es mas facil jugar segundo y defender esos 7.5pts que al reves. Y Sedol quiso ponerselo facil Alphago, para aunque hubiera perdido el computo global,  haberle ganado con ambos colores.

Por cierto, la 4a partida no fue un bug, los comentaristas daban la victoria a AlphaGo, lo que la jugada de Lee Sedol fue increible. El caos de Alphago fue cuando vio que en principio perderia la partida y entonces fue cuando ya perdio los papeles mas de lo que los perderia un gran maestro.

Tambien han dicho que cuando va ganando claramente Alphago, aun juega muy conservador y no sabe aprovechar esa situación como un gran maestro (aunque acaba ganando, pero supongo para el lo importante es ganar, le da igual que sea por 0,5 que por 70).

Por otra parte, sin tener ni por asomo nivel para comprender lo que pasa en su totalidad, si que me da la sensación, que aunque autoaprenda el programa, si no lo tocaran los desarrolladores y lo dejaran por si solo, al cabo de X partidas, 100, 500, 1000, las que fueran... Creo que Lee Sedol acabaria pillandole el truquillo al programa (teniendo en cuenta el factor autoaprendizaje).

Gracias por el aporte, no sabía que había pedido Lee jugar con negras expresamente este 5º juego, qué crack  :o
La verdad que su actitud ha sido exquisita desde la primera partida hasta el final.
Alucinante verle después de cada final de partida quedarse en la mesa un buen rato asimilando lo que ha ocurrido en la contienda, con un notable aspecto de estar totalmente exhausto.

No he visto todas las comparecencias que han ido haciendo tras cada juego pero en concreto en la de después del 4º juego que se llevó Lee, el responsable que hablaba por parte de AlphaGo le dio efusivamente las gracias por su generosidad de prestarse a participar en esto porque, reconocía el tipo, dentro del equipo de desarrollo habían llegado ya al límite de conocimiento para poder mejorar la IA y ponía en valor el poder contar con rivales de nivel TOP como Lee que dieran lugar a situaciones de juego aún más avanzadas para poder continuar con la mejora de la IA.

kalamidad21

la cuestión, la verdadera cuestión, es cuando el ordenador aprenderá sólo, in intervención humana.

Sin que nadie le filtre las partidas. Dándole todas las partidas que quiera, contra otros rivales, o estudiando partidas anteriores (sin filtrar) y sacando conclusiones el solito (la máquina).

Si no meneas el árbol, no cae la fruta

maltzur

Eso aún  estamos lejos.  Todos los sistemas expertos aun requieren bastante entrenamiento humano.  Aunque cuando yo estudiaba complejidad algorítmica los profesores veían muy lejos poder derrotar a un maestro de go.  Y mira tu por donde no ha tardado tanto. 
Un abrazo

Maltzur  Baronet

kalamidad21

Cita de: maltzur en 16 de Marzo de 2016, 02:20:46
Eso aún  estamos lejos.  Todos los sistemas expertos aun requieren bastante entrenamiento humano.  Aunque cuando yo estudiaba complejidad algorítmica los profesores veían muy lejos poder derrotar a un maestro de go.  Y mira tu por donde no ha tardado tanto.

Recuerda además que estamos cerca de un salto de capacidad con ordenadores cuánticos...., que no está tan lejos ya.
Si no meneas el árbol, no cae la fruta

Lupus

Alguno de ustedes jugais regularmente online?
Teneis cuenta en OGS?  Llevo un mes o dos y jugaria encantado contra cualquier compi bskero
Lupus in fabula.

Lopez de la Osa

Cita de: Lupus en 27 de Marzo de 2016, 13:48:14
Alguno de ustedes jugais regularmente online?
Teneis cuenta en OGS?  Llevo un mes o dos y jugaria encantado contra cualquier compi bskero

¿OGS es https://online-go.com/? Entonces yo te sirvo; allí soy Lopez de la Osa.