Cercetătorii au publicat o adevărată senzație în lumea ingineriei și a inteligenței artificiale: GenCAD, prima rețea neuronală open-source capabilă să genereze un model CAD parametric complet funcțional dintr-o fotografie.
Dar aceasta nu este doar o randare frumoasă - vorbim despre un script care poate fi încărcat imediat în editor, modificat și... trimis în producție.

Dezvoltatorii subliniază faptul că soluțiile existente de tip imagine-mesh funcționează cu voxeli, nori de puncte și mesh-uri poligonale - aspecte frumoase, dar inutile pentru inginerie. GenCAD merge mai departe. Nu produce un model gol, ci o secvență de comenzi care construiesc un model ingineresc complet.
Inima GenCAD este arhitectura complexă:
- un transformator-encoder care comprimă comenzile într-un nucleu compact;
- învățare contrastivă, alinierea limbajului comenzilor și a imaginii vizuale;
- model de difuzie care transformă o fotografie într-o reprezentare latentă;
- un decodor care reconstruiește instrucțiuni parametrice din acest set.

Principala caracteristică este editabilitatea. Scriptul rezultat poate fi adaptat nevoilor de producție, parametrii individuali pot fi modificați și poate fi integrat instantaneu în fluxurile de lucru.
Odată cu lansarea codului pe GitHub, cercetătorii au pus la dispoziție și setul de date și modelele antrenate. Acesta nu este doar un pas către automatizarea proiectării - este o revoluție pentru întreaga industrie prelucrătoare.


