La Inteligencia Artificial (IA) es quizás la tecnología más disruptiva que ha surgido en el proceso de transformación digital en el cual estamos todos inmersos, organizaciones y ciudadanos. En la presente década numerosas serán las novedades que surgirán en torno a ella. Y, como ocurre con este tipo de tecnologías, dada su propia complejidad, también numerosos serán los argumentos a favor y en contra que esgrimirán los voceros de la innovación tecnológica y los autodenominados defensores de la gobernanza y privacidad de datos. Y en medio de ese ruido argumentativo, organizaciones y ciudadanos iremos incorporando estas soluciones tecnológicas, como ocurre con todo lo nuevo en TICs, casi de manera inconsciente.

Pero la Inteligencia Artificial no existiría sin los datos. Ellos son precisamente el combustible, pues no sólo justifica su necesidad sino que alimenta su evolución. La inmensa cantidad de datos que se han acumulado a nivel global desde el inicio del proceso de transformación digital es el principio del nudo gordiano que hay que comenzar a desatar para alcanzar cierto grado de entendimiento de esta problemática.

Como ya mencionamos. siendo los datos un elemento esencial de la IA, no debería resultarnos extraño que las novedades en este campo se encuentran casi siempre protagonizadas por las BigTech, esos megapolos tecnológicos (Google, Facebook, etc) que monopolizan desde hace décadas la acumulación de datos que gentilmente o inadvertidamente las organizaciones y los ciudadanos les brindamos.

Facebook lleva ya varios años mejorando su algoritmo. A escasos tres años de crear su “newsfeed” (El  contenido que cualquier persona ve en nuestro perfil cuando ingresa: las imágenes, los vídeos, el texto), y a dos del botón “Me gusta”, Facebook implementó su primer algoritmo para presentar las noticias conforme a un orden determinado (los posteos con más “Me Gusta” aparecen en primer término). Pero recién en 2015 abre la puerta a los usuarios para que contribuyeran a alimentar su algoritmo con datos de preferencias mediante la facilidad “Ver en Primer Término”. A partir de allí, se incorporaron las categorías de tiempo de visita y las reacciones (emociones) que generaban los contenidos. En 2020 Facebook vuelve a abrir a los usuarios la posibilidad de interactuar (brindar mejor información, en criollo) con el algoritmo para que pudieran “controlar sus propios datos”.

Pero volvamos al algoritmo de Facebook, esa especie de fórmula matemática diseñada y, por qué no, condicionada por su creador, para que la solución de IA, específicamente generada para convertir el dato en información, pueda “aprender”. En resumidas palabras, pueda bucear en el océano de datos que se ponen a su disposición durante su entrenamiento y alcanzar el objetivo propuesto por su creador, pero sin su intervención directa.

En esta oportunidad, el equipo de I+D de Facebook anuncia que han desarrollado un nuevo modelo de IA, es decir un algoritmo, que permitiría generar cierto aprendizaje a partir de un grupo aleatorio de imágenes no etiquetadas disponibles en Internet, específicamente aquellas generadas en Instagram. Esta red social, muy popular a nivel global, ostenta la nada despreciable cantidad de 1.000 millones de usuarios activos por mes; guarismo que la coloca en segundo lugar después de Facebook (2700 millones de usuarios activos por mes), pero muy lejos del resto de redes sociales, según datos 2020 de Statista. Sólo por mencionar a una de ellas, Twitter, ocupa el tercer lugar con 86 millones. Imaginemos entonces la cantidad de contenido en imágenes, en fin de datos, de lo que estamos hablando.

Este método, conocido como “aprendizaje autosupervisado”, permite a los sistemas de IA “aprender”a partir de los datos provistos, sin tener que recurrir a complejas bases de datos etiquetados (identificados, clasificados y relacionados en buen romance) para poder ejecutar una tarea determinada. De esta manera es que llegan a lograr el reconocimiento de un “objeto” (cosa o persona) en una fotografía o la traducción de un bloque de texto. Eso es precisamente lo que realiza el algoritmo de Facebook al que denominaron SEER (SElf-SupERvised – Autosupervisado). Alimentado con mil millones de imágenes disponibles en Instagram de manera pública (las que nosotros mismos subimos, está claro?), que no han sido intervenidas (modificadas, recortadas, etc..) previamente y tampoco están etiquetadas, como ocurre en la mayoría de los adiestramientos en IA, SEER pueda ejecutar de manera autónoma el análisis de los mismos, ofreciendo como resultado un producto con elevada precisión como el reconocimiento eficaz de un “objeto”.

SEER es el primer modelo auto-supervisado de visión artificial que es entrenado con imágenes aleatorias de Internet.”

Priya Gopal, ingeniera en software del laboratorio de IA de Facebbok

Este tipo de modelo de IA es el que más atención ha despertado en los últimos años en la comunidad científica, sobre todo porque reduce notablemente la intervención humana en el proceso y porque permite abarcar un universo mucho mayor de datos. Hasta el momento se habían alcanzado logros en el área del procesamiento del lenguaje, obteniendo notorios avances en aplicaciones de traducción automática, generación automática de preguntas, etc. Sin embargo, el nuevo algoritmo de Facebook eleva los esfuerzos alcanzados a un nivel diferente, el de la visión artificial.

Hasta el momento todos los demás modelos de visión artificial fueron desarrollados a partir de los conjuntos de datos provistos por ImageNet, una inmensa base de datos de millones de imágenes que han sido etiquetadas (clasificadas) por investigadores de IA y puestas a disposición de la comunidad dedicada a la visión artificial. Pero dado que las primeras pruebas de SEER demostraron una capacidad superior, específicamente en detección de objetos, segmentación y clasificación de imágenes, los investigadores de Facebook fueron por otro camino.

Luego de adaptar un trabajo anterior en aprendizaje supervisado, conocido como SwAV, que permite agrupar imágenes que presentan conceptos similares, avanzaron en un algoritmo de aprendizaje profundo (deep-learning) que representa los patrones de conectividad de las neuronas en el cerebro humano a fin de asignar importancia a los diferentes objetos ubicados en una misma imagen. Todo esto, junto a una base de datos compuesta por miles de millones de fotografías como la de Instagram, conformó el hito alcanzado por Facebook, cuyo impacto tecnológico apenas podemos imaginar.

Aunque resta mucho trabajo de investigación por realizar, Facebook adelanta que estos avances mejorarán la descripción automática de contenidos contrarios a las políticas de la empresa y fuera de ella, en sectores vitales como el da la salud. Mientras tanto, Facebook desarrolló la biblioteca VISSL, basada en PyTorch, otra biblioteca

Aunque resta mucho trabajo de investigación por realizar, Facebook adelanta que estos avances mejorarán la descripción automática de contenidos contrarios a las políticas de la empresa y fuera de ella, en sectores vitales como el de la salud. Mientras tanto, Facebook desarrolló la biblioteca VISSL, basada en PyTorch para aprendizaje supervisado en visión artificial, que puso a disposición de la comunidad de investigadores en visión artificial para probar la tecnología.

Fuentes: