Niantic, la empresa detrás del popular juego de realidad aumentada “Pokémon Go”, pero también de “Ingress”, reveló recientemente que está desarrollando un “gran modelo geoespacial” (LGM) que permitirá a los ordenadores comprender mejor el mundo que los rodea. El nombre de esta IA es una referencia directa a grandes modelos de lenguaje (LLM), como GPT (ChatGPT) de OpenAI, que se entrenan con grandes cantidades de contenido recuperado de Internet. “El LGM permitirá a los ordenadores no sólo percibir y comprender espacios físicos, sino también interactuar con ellos de nuevas formas, formando una parte esencial de las gafas de realidad aumentada y otros campos como la robótica, la creación de contenidos y los sistemas autónomos”, explica Niantic en su sitio web.
Para entrenar este modelo, la compañía utilizó imágenes y ubicaciones recopiladas por jugadores invitados a “escanear” lugares del mundo con sus teléfonos inteligentes, como monumentos, puentes o estatuas desde diferentes ángulos. “Durante los últimos cinco años, hemos preparado nuestro Sistema de Posicionamiento Visual (VPS). Este último utiliza la más mínima imagen de un teléfono para determinar su posición y orientación en un mapa 3D creado por personas que escanearon lugares interesantes en nuestros juegos y en Scaniverse (nota del editor, una aplicación para iOS y Android)”, explica Niantic. La empresa cree que tiene una ventaja respecto a las imágenes recopiladas por los vehículos de Google para su servicio de viaje virtual Street View. “Estos datos son únicos porque están tomados desde la perspectiva de los peatones e incluyen lugares inaccesibles para los coches”, explica la firma.
Según estos datos, el LGM debería poder navegar en el espacio como un ser humano. Niantic pone el ejemplo de una iglesia: si el sistema sólo ve la fachada, en gran parte fotografiada, “puede extrapolar características comunes y predecir, por ejemplo, la estructura trasera de una iglesia, incluso si nunca ha sido capturada directamente”, según en muchas otras fotos de iglesias alrededor del mundo.
La compañía dice que hasta ahora ha entrenado más de 50 millones de redes neuronales con más de 150 billones de parámetros que deberían permitir navegar en un millón de lugares.