Extracción de datos oscuros de CAD para crear gemelos digitales
Cómo una empresa de desarrollo de software de ingeniería abordó uno de los principales desafíos a los que se enfrentan las iniciativas de conversión de CAD a SIG.
Comparta
CATEGORÍA: ingeniería empresarial
Este artículo, escrito por el autor Gavin Schrock, se publicó originalmente en GoGeomatics
10 de noviembre del 2023
En teoría, recopilar características de los planos técnicos para rellenar y aumentar los SIG debería ser una propuesta bastante sencilla. Sin embargo, la realidad es que esto rara vez es fácil de ejecutar. Sin duda, si el sistema de cuadrícula y los símbolos de los dibujos técnicos de CAD, distinguidos por niveles (o capas) y celdas (o bloques), se presentan en un marco de referencia espacial cercano, esto debería traducirse sin problemas en un esquema de SIG, ¿cierto? Suele decirse que el problema está en los detalles, pero, en el caso de archivos CAD existentes, el problema puede ser la incapacidad de reconocer los detalles.
“El problema de los estándares CAD es que no siempre se siguen estrictamente, además de que evolucionan”, dijo Mark Stefanchuk, jefe de Tecnología en Phocaz Inc. “Por ejemplo, antes del 2000, los niveles estaban numerados; luego, esto evolucionó a nombres de nivel. Los diseñadores tienden a no utilizar estándares CAD, especialmente cuando está apurados. Nos hemos encontrado con situaciones en las que dejan caer las celdas a sus elementos base, como líneas, círculos, cuadros de texto, etc., o las agrupan y perdemos la atribución que preferiríamos mantener”.
Hay desconexiones con empresas de diseño contratadas, proyectos financiados que requieren estándares diferentes y la evolución de la sabiduría convencional sobre esquemas de nomenclatura de niveles/celdas. Por ejemplo, algunas entidades de ingeniería han ampliado los estándares para distinguir entre características puramente de diseño y de construcción (o planos as built). “De modo que si necesitamos, de nuevo, hacer evolucionar los estándares CAD, tenemos que desarrollar un medio para pasar de lo que existía hace años, a lo que existe hoy, a lo que queremos en el futuro”, dijo Stefanchuk. “Eso ocurre en casi todas las organizaciones: algunas controlan mejor sus estándares que otras. Ciertamente, en los clientes de los departamentos de transporte, por ejemplo, vemos anomalías, de un proyecto a otro, personas que se desintegran o celdas que explotan”.
Datos oscuros
“Una de las cuestiones que suelen plantearse en las conversaciones sobre la migración CAD-SIG es por qué se quiere trabajar con datos heredados”, afirma Mary A. Ramsey, socia fundadora y directora ejecutiva de Phocaz Inc.
Nuestro pensamiento, y el de nuestros clientes, es que cualquiera que tenga datos heredados ha invertido considerablemente, incluso millones de dólares, en obtener esos datos en primer lugar”. Puede ser una inversión enorme, durante décadas de creación de registros CAD; tiene sentido al menos intentar extraer tanto como sea posible de esos registros.
“En el caso de los departamentos de transporte, es dinero de los contribuyentes el que se invirtió en ello. Se ha hecho una inversión considerable en estos activos digitales, ahora hay que obtener más recompensas de ella. Así que, absolutamente, hay que empezar a analizar los datos que están ahí. Aquello que no se puede extraer automáticamente, por ejemplo, por nivel y nombre de celda, eso son los “datos oscuros”. Sin embargo, es el plano, como geometría: imagine el valor que hay si pudiera extraerse en su totalidad”. Los datos oscuros en infraestructuras son un tema de gran interés. En el contexto de las infraestructuras, los datos oscuros se refieren a datos valiosos a los que no se puede acceder fácilmente debido a la evolución de las convenciones de datos, la falta de cumplimiento de las normas, la dependencia excesiva del conocimiento institucional o la mala gestión de los datos. La IA está permitiendo nuevas formas de extraerlos. Y ese es exactamente el enfoque que adoptó Phocaz para extraer datos oscuros del archivo CAD de clientes del sector del transporte.
Otra pregunta es “¿por qué no utilizar cartografía móvil y drones?”. La cartografía móvil y la captura de datos con drones han evolucionado espléndidamente en los últimos años. Avances en precisión, exactitud posicional, automatización del reconocimiento de características y simplificación de las operaciones en campo. Pero la realidad es que captar decenas de miles de kilómetros de corredores viales costaría muchos millones y, aun así, estas tecnologías no podrían captar todas las características. Los costos irrecuperables de décadas de diseño CAD y planos de registro destacan como un recurso potencialmente rentable para poblar/ampliar sustancialmente un SIG empresarial (que están evolucionando hacia gemelos digitales).
Mejora de la productividad
"Comenzamos Phocaz como un medio para proporcionar servicios de desarrollo de software principalmente para el espacio de diseño asistido por computadora", dijo Ramsey. "Específicamente para usuarios de ingeniería civil; Civil 3D, Bentley MicroStation y OpenRoads (por supuesto, en su momento, habría sido InRoads), etc. En esencia, desarrollábamos y manteníamos complementos para nuestros clientes que se ejecutaban en esas plataformas y productos base. Seguimos haciendo ese tipo de trabajo hoy en día, mucho trabajo para los DOT en ese sentido, y también para otros clientes de infraestructura".
Phocaz sobre su solución de CAD a SIG cuando un antiguo cliente, el Departamento de Transporte de Georgia (GDOT, por sus siglas en inglés), acudió a ellos con esta petición: ¿es posible recopilar datos de un archivo CAD, automatizar la extracción e introducirlos en nuestro SIG empresarial? Esta fue la génesis de lo que GDOT denominó CLIP, del inglés “CAD Level Integration Process” (Proceso de integración a nivel CAD). Primero, Phocaz identificó las herramientas existentes, algunas incluso dentro del entorno CAD, diseñadas para ello. “Descubrimos muy pronto que estos procesos eran un poco lentos y no habrían resultado prácticos teniendo en cuenta la enormidad del archivo CAD que el DOT deseaba extraer. Por no hablar de cómo gestionar la producción y la gran cantidad de datos que generaría tal empresa”.
La solución debía ser escalable para satisfacer las necesidades del GDOT y otros clientes de grandes infraestructuras. “Por ejemplo, el GDOT gestiona aproximadamente 128 747 kilómetros de carriles centrales y rutas de ayuda federal”, dijo Stefanchuk. “Eso representa alrededor de un tercio de las carreteras del estado; probablemente se acerque más a los 402 336 kilómetros de carriles en el estado”. Georgia no está sola en la oportunidad (y el desafío) de “extraer” tantos kilómetros de archivos CAD de autopistas; eche un vistazo a los totales de kilómetros de carriles de cada uno de los 50 estados. Phocaz comenzó a desarrollar algoritmos basados en IA, adoptó un enfoque de gemelo digital y recurrió a Projectwise de Bentley Systems para la producción y la gestión de datos.
El automóvil robot virtual
Al principio, se pensó simplemente en escanear los planos CAD en busca de las características más fáciles de reconocer por los nombres de los niveles y las celdas. No obstante, resultó mejor simplemente “recorrer los carriles digitales” una sola vez y extraer las características de forma exhaustiva.
El concepto era que la IA examinara el plano al progresar por los carriles y captara las características a medida que avanzara. Casi como conducir por cada carril con un vehículo equipado con LiDAR o cartografía móvil de imágenes (pero a una fracción del costo). Pero antes de que el automóvil de IA pueda iniciar sus viajes, es necesario que exista un entorno espacial coherente. Afortunadamente, como señala Stefanchuk, el enfoque de diseño en CAD ha consistido en trabajar en un modelo, extraer las referencias y cortar las hojas a partir de ahí. Así que, en casi todos los casos, el plano está listo para “ser conducido”. En el caso de sus clientes de DOT que trabajan en un entorno DGN (MicroStation), es aquí donde su elección de Bentley ProjectWise demostró ser especialmente adecuada para gestionar los planos, el progreso de la extracción y los datos resultantes.
Futuras aplicaciones
De modo que si necesitamos, de nuevo, hacer evolucionar los estándares CAD, tenemos que desarrollar un medio para pasar de lo que existía hace años, a lo que existe hoy, a lo que queremos en el futuro.
—Mark Stefanchuk
ProjectWise es un conjunto de aplicaciones de gestión de proyectos de Bentley Systems, que puede servir como centro de datos de varias disciplinas y formatos, durante todo el ciclo de vida del proyecto, y permite trabajar en un entorno de gemelo digital. Dado que muchos de sus clientes del sector del transporte trabajan principalmente en un entorno Bentley (por ejemplo, DGN y MicroStation, y paquetes de software de diseño relacionados), tenía sentido gestionar los proyectos CLIP en este conjunto.
“El automóvil CLIP, o automóvil robot, como lo llamamos, es realmente una herramienta de sesión visualizada para que entendamos lo que ocurre con nuestros algoritmos”, explica Stefanchuk. “El usuario final nunca va a ver eso”. Aunque tengo que decir que fue divertido ver el automóvil robot representado en una demostración. “Lo que quieren, en última instancia, son los gráficos de los ejes de las características dentro del entorno SIG y las propiedades asignadas a estas”.
Para averiguar cuáles son esas propiedades en cualquier punto de la autopista, Phocaz ha desarrollado una herramienta que puede buscar y encontrar esas características. La IA se entrena en los diversos aspectos espaciales de las características, como las marcaciones de los carriles para bicicletas (que pueden variar mucho incluso de un condado a otro), y aplica otras reglas, como la distancia a la que hay que mirar para cubrir la anchura estándar del derecho de vía. “Tuvimos que conceptualizar y visualizar lo que queríamos que hicieran los algoritmos”, explica Stefanchuk. “Pensamos en una carretera sinuosa que recorriera el campo, en cómo la conduciríamos en el mundo físico y en lo que podríamos ver por las ventanillas delanteras y laterales. Luego, cómo enseñar a la IA a 'viajar' por los carriles CAD canalizados y aprender de lo que probablemente vería".
“Hay un par de aspectos en los que el CLIP/automóvil robot es realmente una ventaja”, afirma Stefanchuk. “Una de ellas es que no tenemos que recopilar todos los datos a la vez, solo tenemos que recopilar lo que vemos en ese momento, tomar decisiones al respecto, guardarlo hasta que estemos listos para informar sobre ello y seguir avanzando por la autopista”. Cuando nos topamos con algo como una marca en el pavimento, podemos utilizar algunos modelos visuales de IA para averiguar qué representa esa marca”.
“Lo que aprendimos del proyecto CLIP es que podemos empezar con un símbolo, como una flecha de giro a la derecha o a la izquierda, y enseñar a una IA a detectarlo”, explica Stefanchuk. “Pero podemos tomar otras decisiones basándonos en lo que podemos deducir de eso, como por qué tipo de carril estoy circulando. ¿Estamos circulando por un carril de giro a la derecha, por un carril de paso, por un carril de giro a la izquierda, por un carril de giro en U, etc.?”.
Phocaz no se centró solo en las marcas en el pavimento. Con el mismo enfoque que usaron para las marcas en el pavimento, pueden crear un modelo de aprendizaje automático para cualquier celda que se encuentre en cualquier biblioteca de celdas. "Nuestro cerebro de IA es un modelo de aprendizaje automático (MLM, del inglés Machine Learning Model)", dijo Stefanchuk. "Nuestro software, una aplicación separada de CLIP (llamada Phorz AI), guiará al usuario a través de la creación de su propio MLM a partir de una o varias celdas (símbolos) como una flecha de giro, una ciclovía, una entrada de vehículos, una alcantarilla, etc. El MLM que crea un usuario se puede aplicar para detectar estos objetos en cualquier modelo de iTwin (gemelo digital). La idea era que pudiéramos hacer que fuera lo suficientemente fácil para cualquier persona crear un MLM capaz de detectar características en un proyecto CAD. En el caso del CLIP de GDOT, tiene un MLM que entrenamos para que no tengan que realizar este paso". Para los proyectos de otros clientes, se crea un modelo maestro, pero se deja la puerta abierta para que cualquier usuario aumente y enseñe a la IA, ya que las celdas y los símbolos pueden variar de una ciudad a otra, de un condado a otro, etc.
Phocaz ha sido galardonada recientemente como finalista en la categoría de Ingeniería Empresarial de los premios anuales Year in Infrastructure Going Digital Awards, celebrados en Singapur el 11 y 12 de octubre del 2023. En el mismo evento, en el discurso de apertura de Julien Moutte, director de tecnología de Bentley Systems, se hizo una demostración de CLIP para extraer flechas de giro hacia la izquierda a partir de planos CAD de autopistas. "GDOT siempre creyó que sus planos CAD podrían ser una rica fuente de datos de activos", dijo Moutte. "Pero acceder a esos datos requería recopilar manualmente diseños y dibujos, miles de ellos, y luego inspeccionar cada activo de forma visual, lo que requeriría incontables horas. Para iluminar los datos oscuros, Phocaz utilizó ProjectWise con tecnología de iTwin para crear gemelos digitales que se pueden analizar de manera más eficiente al usar IA con detección de características y referencias espaciales. Phocaz fue aún más lejos y utilizó una novedosa técnica de IA para llenar los vacíos entre los modelos. Crearon un agente de IA que puede circular virtualmente por los carriles del gemelo digital y detectar las líneas centrales. Con la automatización de la IA, el proceso de extracción de los datos ya no requiere tiempo prolongado y altos costos para sus clientes.
Futuras aplicaciones
“CLIP es un flujo de trabajo único que hemos desarrollado a fin de resolver este problema para nuestros clientes del sector del transporte”, afirma Ramsey. “Podemos empezar con el contexto del requisito previo con el que trabajamos: las carreteras. Así que no necesariamente podríamos aplicarlo a la arquitectura, por ejemplo. Sin embargo, una vez que entendemos cuál es ese contexto, podemos empezar a pensar en cómo recopilamos datos de ese tipo de diseños”.
¿A qué aplicaciones para infraestructuras podría adaptarse este enfoque? Los servicios públicos vienen inmediatamente a la mente. Existen redes de transmisión y distribución y, en el caso de las redes de telefonía y comunicaciones, existen elementos de conectividad basados en reglas que podrían ayudar a afinar el análisis tanto de las características lineales como de los tipos de accesorios. En lo que respecta a los servicios públicos subterráneos, teniendo en cuenta lo poco práctico que resulta localizar físicamente todos los elementos, la automatización de la extracción de características CAD puede resultar muy valiosa. No se descarta que con este tipo de solución se consiga extraer características de planos de ingeniería escaneados. Sin embargo, existen problemas de referencia espacial (escala y registro posicional), además de la calidad/integridad de las conversiones de ráster a vector (aunque también se ha avanzado mucho en el uso de la IA para mejorarlas).
A medida que los municipios, las empresas de servicios públicos y los campus tratan de construir gemelos digitales, el costo de la captura total de datos físicos y los estudios de construcción se erigen como un obstáculo para una adopción más amplia. Sin embargo, pocos elementos se construyeron sin algún tipo de planos de diseño y, al menos para aquellos de las últimas cuatro décadas, es probable que existan planos CAD que puedan extraerse de este modo. En los millones de archivos CAD que hay por ahí se esconde un enorme tesoro de datos oscuros. Es hora de hacer un mejor uso de él.