{"id":25177,"date":"2024-07-30T02:00:03","date_gmt":"2024-07-30T02:00:03","guid":{"rendered":"https:\/\/domosistemas.com\/?p=25177"},"modified":"2024-07-30T02:00:03","modified_gmt":"2024-07-30T02:00:03","slug":"maia-el-sistema-de-automatizacion-de-tareas-de-interpretacion-de-los-modelos-de-vision-artificial-del-mit","status":"publish","type":"post","link":"https:\/\/domosistemas.com\/?p=25177","title":{"rendered":"MAIA, el sistema de automatizaci\u00f3n de tareas de interpretaci\u00f3n de los modelos de visi\u00f3n artificial del MIT"},"content":{"rendered":"<div>\n<p>A medida que los modelos de inteligencia artificial (IA) se vuelven cada vez m\u00e1s comunes y se integran en diversos sectores es fundamental comprender c\u00f3mo funcionan en profundidad. Los modelos de visi\u00f3n artificial que contienen millones de neuronas son demasiado grandes y complejos para estudiarlos a mano, lo que hace que la interpretaci\u00f3n a escala sea una tarea muy dif\u00edcil. Para solventar este problema, los investigadores del Laboratorio de Ciencias de la Computaci\u00f3n e Inteligencia Artificial (CSAIL) del Instituto tecnol\u00f3gico de Massachussets (<a href=\"https:\/\/www.mit.edu\/\" target=\"_blank\" rel=\"noopener\">MIT<\/a>) han adoptado un enfoque automatizado para interpretar los modelos de visi\u00f3n artificial que eval\u00faan diferentes propiedades de las im\u00e1genes.<\/p>\n<figure id=\"attachment_141310\" aria-describedby=\"caption-attachment-141310\" style=\"width: 800px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-141310\" src=\"https:\/\/static.casadomo.com\/media\/2024\/07\/mit-maia-sistema-automatizacion-tareas-interpretacion-redes-neuronales-ia.png\" alt=\"Sistema MAIA.\" width=\"800\" height=\"463\" srcset=\"https:\/\/static.casadomo.com\/media\/2024\/07\/mit-maia-sistema-automatizacion-tareas-interpretacion-redes-neuronales-ia.png 800w, https:\/\/static.casadomo.com\/media\/2024\/07\/mit-maia-sistema-automatizacion-tareas-interpretacion-redes-neuronales-ia-300x174.png 300w, https:\/\/static.casadomo.com\/media\/2024\/07\/mit-maia-sistema-automatizacion-tareas-interpretacion-redes-neuronales-ia-768x444.png 768w, https:\/\/static.casadomo.com\/media\/2024\/07\/mit-maia-sistema-automatizacion-tareas-interpretacion-redes-neuronales-ia-180x104.png 180w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\"><figcaption id=\"caption-attachment-141310\" class=\"wp-caption-text\">MAIA utiliza una estructura b\u00e1sica de modelos de visi\u00f3n y lenguaje equipados con herramientas para interpretar las redes neuronales.<\/figcaption><\/figure>\n<p>Denominado Multimodal Automated Interpretability Agent (MAIA), MAIA es un sistema que automatiza una variedad de tareas de interpretaci\u00f3n de redes neuronales utilizando una estructura b\u00e1sica de modelos de visi\u00f3n y lenguaje equipados con herramientas para experimentar en otros sistemas de inteligencia artificial (IA).<\/p>\n<p>Este sistema automatizado ha demostrado abordar tres tareas clave: etiquetar los componentes individuales dentro de los modelos de visi\u00f3n y describir los conceptos visuales que los activan; limpiar los clasificadores de im\u00e1genes eliminando caracter\u00edsticas irrelevantes para hacerlos m\u00e1s robustos ante nuevas situaciones, y buscar sesgos ocultos en los sistemas de IA para ayudar a descubrir posibles problemas de imparcialidad en sus resultados.<\/p>\n<p>En una tarea de ejemplo, los investigadores le pidieron a MAIA que describiera los conceptos que una neurona en particular dentro de un modelo de visi\u00f3n es responsable de detectar. Para investigar esta cuesti\u00f3n, MAIA primero utiliza una herramienta que recupera ejemplares de conjuntos de datos de ImageNet, que activan al m\u00e1ximo la neurona. Para esta neurona de ejemplo, esas im\u00e1genes muestran personas con atuendo formal y primeros planos de sus barbillas y cuellos.<\/p>\n<p>MAIA formula varias hip\u00f3tesis sobre lo que impulsa la actividad de la neurona: expresiones faciales, barbillas o corbatas. Posteriormente, usa sus herramientas para dise\u00f1ar experimentos para probar cada hip\u00f3tesis individualmente generando y editando im\u00e1genes sint\u00e9ticas.<\/p>\n<h2>Evaluaci\u00f3n del comportamiento de las neuronas<\/h2>\n<p>Las explicaciones de MAIA sobre el comportamiento de las neuronas se eval\u00faan de dos maneras clave. En primer lugar, se utilizan sistemas sint\u00e9ticos con comportamientos reales conocidos para evaluar la precisi\u00f3n de las interpretaciones de MAIA. En segundo lugar, para las neuronas reales dentro de sistemas de IA entrenados sin descripciones reales, los autores dise\u00f1an un nuevo protocolo de evaluaci\u00f3n automatizada que mide c\u00f3mo las descripciones de MAIA predicen el comportamiento de las neuronas en datos no vistos.<\/p>\n<p>El m\u00e9todo dirigido por CSAIL super\u00f3 a los m\u00e9todos de referencia que describen neuronas individuales en una variedad de modelos de visi\u00f3n, como ResNet, CLIP y el transformador de visi\u00f3n DINO. MAIA tambi\u00e9n tuvo un buen desempe\u00f1o en el nuevo conjunto de datos de neuronas sint\u00e9ticas con descripciones de verdad fundamental conocidas. Tanto para los sistemas reales como para los sint\u00e9ticos, las descripciones a menudo estuvieron a la par con las descripciones escritas por expertos humanos.<\/p>\n<p>La entrada <a href=\"https:\/\/www.casadomo.com\/2024\/07\/30\/maia-sistema-automatizacion-tareas-interpretacion-modelos-vision-artificial-mit\">MAIA, el sistema de automatizaci\u00f3n de tareas de interpretaci\u00f3n de los modelos de visi\u00f3n artificial del MIT<\/a> aparece primero en <a href=\"https:\/\/www.casadomo.com\/\">CASADOMO<\/a>.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>A medida que los modelos de inteligencia artificial (IA) se vuelven cada vez m\u00e1s comunes y se integran en diversos sectores es fundamental comprender c\u00f3mo funcionan en profundidad. Los modelos de visi\u00f3n artificial que contienen millones de neuronas son demasiado grandes y complejos para estudiarlos a mano, lo que hace que la interpretaci\u00f3n a escala &hellip; <a href=\"https:\/\/domosistemas.com\/?p=25177\" class=\"more-link\">Sigue leyendo <span class=\"screen-reader-text\">MAIA, el sistema de automatizaci\u00f3n de tareas de interpretaci\u00f3n de los modelos de visi\u00f3n artificial del MIT<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-25177","post","type-post","status-publish","format-standard","hentry","category-casadomo-com"],"_links":{"self":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts\/25177","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=25177"}],"version-history":[{"count":0,"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts\/25177\/revisions"}],"wp:attachment":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=25177"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=25177"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=25177"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}