Visión Transformers y Segment Anything: De las Convoluciones a la Atención
La visión artificial ha avanzado de manera exponencial con el advenimiento de los Vision Transformers (ViT) y el Segment Anything Model (SAM) de Meta. Estos modelos no solo están redefiniendo cómo entendemos la segmentación y la clasificación de imágenes, sino que también están marcando un cambio crucial respecto a las tradicionales redes convolucionales (CNN). En… Lee más