{"id":21032,"date":"2023-07-14T02:00:45","date_gmt":"2023-07-14T02:00:45","guid":{"rendered":"https:\/\/domosistemas.com\/?p=21032"},"modified":"2023-07-14T02:00:45","modified_gmt":"2023-07-14T02:00:45","slug":"un-nuevo-sistema-del-mit-entrena-la-generacion-y-reconocimiento-de-imagenes-de-forma-conjunta","status":"publish","type":"post","link":"https:\/\/domosistemas.com\/?p=21032","title":{"rendered":"Un nuevo sistema del MIT entrena la generaci\u00f3n y reconocimiento de im\u00e1genes de forma conjunta"},"content":{"rendered":"<div>\n<p>Los investigadores del Laboratorio de Ciencias de la Computaci\u00f3n e Inteligencia Artificial (CSAIL) del Instituto Tecnol\u00f3gico de Massachusetts (<a href=\"https:\/\/web.mit.edu\/\" target=\"_blank\" rel=\"noopener\">MIT<\/a>) han entrenado la generaci\u00f3n y reconocimiento de im\u00e1genes en un mismo sistema para inferir las partes faltantes de una imagen. Al completar con \u00e9xito los espacios en blanco, el sistema, conocido como codificador generativo enmascarado (MAGE), logra dos objetivos al mismo tiempo: identificar im\u00e1genes con precisi\u00f3n y crear otras nuevas con un parecido con la realidad.<\/p>\n<figure id=\"attachment_124044\" aria-describedby=\"caption-attachment-124044\" style=\"width: 800px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" loading=\"lazy\" class=\"size-full wp-image-124044\" src=\"https:\/\/static.casadomo.com\/media\/2023\/07\/mit-sistema-mage-entranmiento-generacion-reconocimiento-imagenes.png\" alt=\"Sistema MAGE.\" width=\"800\" height=\"405\" srcset=\"https:\/\/static.casadomo.com\/media\/2023\/07\/mit-sistema-mage-entranmiento-generacion-reconocimiento-imagenes.png 800w, https:\/\/static.casadomo.com\/media\/2023\/07\/mit-sistema-mage-entranmiento-generacion-reconocimiento-imagenes-300x152.png 300w, https:\/\/static.casadomo.com\/media\/2023\/07\/mit-sistema-mage-entranmiento-generacion-reconocimiento-imagenes-768x389.png 768w, https:\/\/static.casadomo.com\/media\/2023\/07\/mit-sistema-mage-entranmiento-generacion-reconocimiento-imagenes-180x91.png 180w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\"><figcaption id=\"caption-attachment-124044\" class=\"wp-caption-text\">El sistema MAGE tiene la capacidad de identificar im\u00e1genes y crear otras nuevas.<\/figcaption><\/figure>\n<p>Este sistema de doble prop\u00f3sito permite innumerables aplicaciones potenciales, como la identificaci\u00f3n y clasificaci\u00f3n de objetos dentro de las im\u00e1genes, el aprendizaje r\u00e1pido a partir de ejemplos m\u00ednimos, la creaci\u00f3n de im\u00e1genes en condiciones espec\u00edficas como texto o clase, y la mejora de im\u00e1genes existentes.<\/p>\n<p>El sistema MAGE no funciona con p\u00edxeles sin procesar, sino que convierte las im\u00e1genes en lo que se denomina \u2018tokens sem\u00e1nticos\u2019, que son versiones compactas, aunque abstractas, de una secci\u00f3n de imagen. Los tokens crean una versi\u00f3n abstracta de una imagen que se puede usar para tareas de procesamiento complejas, al tiempo que conserva la informaci\u00f3n de la imagen original. El paso de tokenizaci\u00f3n se puede entrenar dentro de un marco autosupervisado, lo que le permite entrenarse previamente en grandes conjuntos de datos de im\u00e1genes sin etiquetas.<\/p>\n<p>Cuando MAGE utiliza el modelado de fichas enmascaradas, oculta aleatoriamente algunos de estos tokens, creando un rompecabezas incompleto, y luego entrena una red neuronal para llenar los vac\u00edos. De esta forma, aprende tanto a comprender los patrones de una imagen (reconocimiento de im\u00e1genes) como a generar otros nuevos (generaci\u00f3n de im\u00e1genes).<\/p>\n<p>Adem\u00e1s de su capacidad para generar im\u00e1genes realistas desde cero, MAGE tambi\u00e9n permite la generaci\u00f3n de im\u00e1genes condicionales. Los usuarios pueden especificar ciertos criterios para las im\u00e1genes que desean que MAGE genere, y la herramienta crear\u00e1 la imagen adecuada. Tambi\u00e9n es capaz de realizar tareas de edici\u00f3n de im\u00e1genes, como eliminar elementos de una imagen manteniendo una apariencia realista.<\/p>\n<h2>Tareas de reconocimiento<\/h2>\n<p>Las tareas de reconocimiento son otro punto fuerte de MAGE. Con su capacidad para entrenar previamente en grandes conjuntos de datos sin etiquetar, puede clasificar im\u00e1genes usando solo las representaciones aprendidas. Adem\u00e1s, sobresale en el aprendizaje de pocas tomas, logrando resultados en grandes conjuntos de datos de im\u00e1genes, como ImageNet, con solo un pu\u00f1ado de ejemplos etiquetados.<\/p>\n<p>La validaci\u00f3n del desempe\u00f1o de MAGE ha dado como resultado nuevos r\u00e9cords en la generaci\u00f3n de nuevas im\u00e1genes, superando a los modelos anteriores con una mejora significativa. Por otro lado, MAGE super\u00f3 las tareas de reconocimiento, logrando una precisi\u00f3n del 80,9% en el sondeo lineal y una precisi\u00f3n del 71,9% en 10 disparos en ImageNet.<\/p>\n<p>La entrada <a rel=\"nofollow\" href=\"https:\/\/www.casadomo.com\/2023\/07\/14\/nuevo-sistema-mit-entrena-generacion-reconocimiento-imagenes-forma-conjunta\">Un nuevo sistema del MIT entrena la generaci\u00f3n y reconocimiento de im\u00e1genes de forma conjunta<\/a> aparece primero en <a rel=\"nofollow\" href=\"https:\/\/www.casadomo.com\/\">CASADOMO<\/a>.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Los investigadores del Laboratorio de Ciencias de la Computaci\u00f3n e Inteligencia Artificial (CSAIL) del Instituto Tecnol\u00f3gico de Massachusetts (MIT) han entrenado la generaci\u00f3n y reconocimiento de im\u00e1genes en un mismo sistema para inferir las partes faltantes de una imagen. Al completar con \u00e9xito los espacios en blanco, el sistema, conocido como codificador generativo enmascarado (MAGE), &hellip; <a href=\"https:\/\/domosistemas.com\/?p=21032\" class=\"more-link\">Sigue leyendo <span class=\"screen-reader-text\">Un nuevo sistema del MIT entrena la generaci\u00f3n y reconocimiento de im\u00e1genes de forma conjunta<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-21032","post","type-post","status-publish","format-standard","hentry","category-casadomo-com"],"_links":{"self":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts\/21032","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=21032"}],"version-history":[{"count":0,"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts\/21032\/revisions"}],"wp:attachment":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=21032"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=21032"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=21032"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}