{"id":26780,"date":"2024-12-13T03:00:59","date_gmt":"2024-12-13T03:00:59","guid":{"rendered":"https:\/\/domosistemas.com\/?p=26780"},"modified":"2024-12-13T03:00:59","modified_gmt":"2024-12-13T03:00:59","slug":"nuevo-metodo-que-elimina-fallas-en-el-entrenamiento-de-los-modelos-de-aprendizaje-automatico","status":"publish","type":"post","link":"https:\/\/domosistemas.com\/?p=26780","title":{"rendered":"Nuevo m\u00e9todo que elimina fallas en el entrenamiento de los modelos de aprendizaje autom\u00e1tico"},"content":{"rendered":"<div>\n<p>Los modelos de aprendizaje autom\u00e1tico pueden fallar cuando intentan hacer predicciones para individuos que estaban subrepresentados en los conjuntos de datos en los que fueron entrenados. Para solucionar este problema, los investigadores del Instituto Tecnol\u00f3gico de Massachussets (<a href=\"https:\/\/web.mit.edu\/\" target=\"_blank\" rel=\"noopener\">MIT<\/a>) desarrollaron una nueva t\u00e9cnica que identifica y elimina puntos espec\u00edficos en un conjunto de datos de entrenamiento para los modelos de aprendizaje autom\u00e1tico, que contribuyen en mayor medida a las fallas de un modelo en subgrupos minoritarios. Al eliminar muchos menos puntos de datos que otros enfoques, esta t\u00e9cnica mantiene la precisi\u00f3n general del modelo y, al mismo tiempo, mejora su desempe\u00f1o en relaci\u00f3n con los grupos subrepresentados.<\/p>\n<figure id=\"attachment_147347\" aria-describedby=\"caption-attachment-147347\" style=\"width: 800px\" class=\"wp-caption aligncenter\"><img fetchpriority=\"high\" decoding=\"async\" class=\"size-full wp-image-147347\" src=\"https:\/\/static.casadomo.com\/media\/2024\/12\/mit-metodo-modelo-aprendizaje-automatico.png\" alt=\"Modelo de aprendizaje profundo.\" width=\"800\" height=\"484\" srcset=\"https:\/\/static.casadomo.com\/media\/2024\/12\/mit-metodo-modelo-aprendizaje-automatico.png 800w, https:\/\/static.casadomo.com\/media\/2024\/12\/mit-metodo-modelo-aprendizaje-automatico-300x182.png 300w, https:\/\/static.casadomo.com\/media\/2024\/12\/mit-metodo-modelo-aprendizaje-automatico-768x465.png 768w, https:\/\/static.casadomo.com\/media\/2024\/12\/mit-metodo-modelo-aprendizaje-automatico-180x109.png 180w\" sizes=\"(max-width: 800px) 100vw, 800px\"><figcaption id=\"caption-attachment-147347\" class=\"wp-caption-text\">Gracias al nuevo m\u00e9todo de entrenamiento, los modelos de aprendizaje son mucho m\u00e1s precisos al eliminar las muestras que generan fallas.<\/figcaption><\/figure>\n<p>Adem\u00e1s, la t\u00e9cnica puede identificar fuentes ocultas de sesgo en un conjunto de datos de entrenamiento que no tiene etiquetas. Los datos sin etiquetas son mucho m\u00e1s frecuentes que los etiquetados para muchas aplicaciones. Este m\u00e9todo tambi\u00e9n podr\u00eda combinarse con otros enfoques para mejorar la imparcialidad de los modelos de aprendizaje autom\u00e1tico implementados en situaciones de alto riesgo.<\/p>\n<h2>Identificaci\u00f3n de ejemplos de entrenamientos para eliminar errores<\/h2>\n<p>A menudo, los modelos de aprendizaje autom\u00e1tico se entrenan utilizando grandes conjuntos de datos recopilados de muchas fuentes de Internet. Estos conjuntos de datos son demasiado grandes para ser seleccionados cuidadosamente a mano, por lo que pueden contener ejemplos incorrectos que afecten el rendimiento del modelo. Los cient\u00edficos tambi\u00e9n saben que algunos puntos de datos afectan el desempe\u00f1o de un modelo en ciertas tareas posteriores m\u00e1s que otras.<\/p>\n<p>Los investigadores del MIT combinaron estas dos ideas en un enfoque que identifica y elimina estos puntos de datos problem\u00e1ticos. Buscan resolver un problema conocido como error del peor grupo, que ocurre cuando un modelo tiene un rendimiento inferior al esperado en subgrupos minoritarios en un conjunto de datos de entrenamiento.<\/p>\n<p>La nueva t\u00e9cnica de los investigadores est\u00e1 impulsada por un trabajo previo en el que introdujeron un m\u00e9todo, llamado TRAK, que identifica los ejemplos de entrenamiento m\u00e1s importantes para la salida de un modelo espec\u00edfico. Para esta nueva t\u00e9cnica, los investigadores toman predicciones incorrectas que el modelo hizo sobre subgrupos minoritarios y usan TRAK para identificar qu\u00e9 ejemplos de entrenamiento contribuyeron m\u00e1s a esa predicci\u00f3n incorrecta. Luego eliminan esas muestras espec\u00edficas y vuelven a entrenar el modelo con los datos restantes.<\/p>\n<p>Dado que tener m\u00e1s datos generalmente produce un mejor rendimiento general, eliminar solo las muestras que generan fallas en los peores grupos mantiene la precisi\u00f3n general del modelo y al mismo tiempo mejora su rendimiento en subgrupos minoritarios.<\/p>\n<h2>Mayor precisi\u00f3n con el m\u00e9todo TRAK<\/h2>\n<p>En tres conjuntos de datos de aprendizaje autom\u00e1tico, su m\u00e9todo super\u00f3 a m\u00faltiples t\u00e9cnicas. En un caso, mejor\u00f3 la precisi\u00f3n del peor grupo al tiempo que eliminaba alrededor de 20.000 muestras de entrenamiento menos que un m\u00e9todo de equilibrio de datos convencional. Su t\u00e9cnica tambi\u00e9n logr\u00f3 una mayor precisi\u00f3n que los m\u00e9todos que requieren realizar cambios en el funcionamiento interno de un modelo.<\/p>\n<p>Dado que el m\u00e9todo MIT implica cambiar un conjunto de datos, ser\u00eda m\u00e1s f\u00e1cil de usar para un profesional y se puede aplicar a muchos tipos de modelos. Tambi\u00e9n se puede utilizar cuando se desconoce el sesgo porque los subgrupos de un conjunto de datos de entrenamiento no est\u00e1n etiquetados. Al identificar los puntos de datos que m\u00e1s contribuyen a una caracter\u00edstica que el modelo est\u00e1 aprendiendo, pueden comprender las variables que est\u00e1 utilizando para hacer una predicci\u00f3n.<\/p>\n<p>La entrada <a href=\"https:\/\/www.casadomo.com\/2024\/12\/13\/nuevo-metodo-elimina-fallas-entrenamiento-modelos-aprendizaje-automatico\">Nuevo m\u00e9todo que elimina fallas en el entrenamiento de los modelos de aprendizaje autom\u00e1tico<\/a> aparece primero en <a href=\"https:\/\/www.casadomo.com\/\">CASADOMO<\/a>.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Los modelos de aprendizaje autom\u00e1tico pueden fallar cuando intentan hacer predicciones para individuos que estaban subrepresentados en los conjuntos de datos en los que fueron entrenados. Para solucionar este problema, los investigadores del Instituto Tecnol\u00f3gico de Massachussets (MIT) desarrollaron una nueva t\u00e9cnica que identifica y elimina puntos espec\u00edficos en un conjunto de datos de entrenamiento &hellip; <a href=\"https:\/\/domosistemas.com\/?p=26780\" class=\"more-link\">Sigue leyendo <span class=\"screen-reader-text\">Nuevo m\u00e9todo que elimina fallas en el entrenamiento de los modelos de aprendizaje autom\u00e1tico<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-26780","post","type-post","status-publish","format-standard","hentry","category-casadomo-com"],"_links":{"self":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts\/26780","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=26780"}],"version-history":[{"count":0,"href":"https:\/\/domosistemas.com\/index.php?rest_route=\/wp\/v2\/posts\/26780\/revisions"}],"wp:attachment":[{"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=26780"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=26780"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/domosistemas.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=26780"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}