Aprendizaje efectivo: el futuro cercano de la IA

Publicado: 2017-11-09

Estas técnicas de aprendizaje efectivas no son nuevas técnicas de aprendizaje profundo/aprendizaje automático, sino que mejoran las técnicas existentes como trucos

Ciertamente, no hay duda de que el futuro final de la IA es alcanzar y superar la inteligencia humana. Pero esta es una hazaña descabellada de lograr. Incluso los más optimistas entre nosotros apuestan a que la IA de nivel humano (AGI o ASI) estará tan lejos como dentro de 10 a 15 años, y los escépticos incluso están dispuestos a apostar que tomará siglos, si es que es posible. Bueno, de eso no se trata el post.

Aquí vamos a hablar sobre un futuro más tangible y cercano y discutir los potentes y emergentes algoritmos y técnicas de IA que, en nuestra opinión, van a dar forma al futuro cercano de la IA.

La IA ha comenzado a mejorar a los humanos en algunas tareas seleccionadas y específicas. Por ejemplo, vencer a los médicos en el diagnóstico de cáncer de piel y derrotar a los jugadores de Go en el campeonato mundial. Pero los mismos sistemas y modelos fallarán al realizar las tareas diferentes de las que fueron entrenados para resolver. Esta es la razón por la que, a largo plazo, un sistema generalmente inteligente que realiza un conjunto de tareas de manera eficiente sin necesidad de reevaluación se denomina futuro de la IA.

Pero, en el futuro cercano de la IA, mucho antes de que surja el AGI, ¿cómo es posible que los científicos hagan que el algoritmo impulsado por la IA supere los problemas que enfrentan hoy para salir de los laboratorios y convertirse en objetos de uso diario?

Cuando miras a tu alrededor, la IA está ganando un castillo a la vez (lee nuestras publicaciones sobre cómo la IA está superando a los humanos, parte uno y parte dos). ¿Qué podría salir mal en un juego de ganar-ganar? Los humanos están produciendo más y más datos (que es el forraje que consume la IA) con el tiempo y nuestras capacidades de hardware también están mejorando. Después de todo, los datos y una mejor computación son las razones por las que la revolución del aprendizaje profundo comenzó en 2012, ¿verdad? La verdad es que más rápido que el crecimiento de los datos y la computación es el crecimiento de las expectativas humanas. Los científicos de datos tendrían que pensar en soluciones más allá de lo que existe en este momento para resolver problemas del mundo real. Por ejemplo, la clasificación de imágenes, como pensaría la mayoría de la gente, es un problema científicamente resuelto (si resistimos la tentación de decir 100% de precisión o GTFO).

Podemos clasificar imágenes (digamos en imágenes de gatos o imágenes de perros) que coincidan con la capacidad humana usando IA. Pero, ¿se puede usar esto para casos de uso del mundo real? ¿Puede la IA ofrecer una solución para problemas más prácticos a los que se enfrentan los humanos? En algunos casos, sí, pero en muchos casos aún no hemos llegado.

Lo guiaremos a través de los desafíos que son los principales obstáculos para desarrollar una solución del mundo real utilizando IA. Supongamos que desea clasificar imágenes de perros y gatos. Usaremos este ejemplo a lo largo de la publicación.

Nuestro algoritmo de ejemplo: Clasificación de las imágenes de perros y gatos

El siguiente gráfico resume los desafíos:

Desafíos involucrados en el desarrollo de una IA del mundo real

Analicemos estos desafíos en detalle:

Aprendiendo con menos datos

Los datos de entrenamiento que consumen los algoritmos de aprendizaje profundo más exitosos requieren que se etiqueten de acuerdo con el contenido o la característica que contienen. Este proceso se llama anotación.
Los algoritmos no pueden usar los datos que se encuentran naturalmente a su alrededor. La anotación de unos pocos cientos (o unos pocos miles de puntos de datos) es fácil, pero nuestro algoritmo de clasificación de imágenes a nivel humano tomó un millón de imágenes anotadas para aprender bien.
Entonces, la pregunta es si es posible anotar un millón de imágenes. Si no, ¿cómo puede la IA escalar con una menor cantidad de datos anotados?

Resolver diversos problemas del mundo real

Si bien los conjuntos de datos son fijos, el uso en el mundo real es más diverso (por ejemplo, un algoritmo entrenado en imágenes en color puede fallar gravemente en imágenes en escala de grises a diferencia de los humanos).
Si bien hemos mejorado los algoritmos de Computer Vision para detectar objetos para que coincidan con los humanos. Pero como se mencionó anteriormente, estos algoritmos resuelven un problema muy específico en comparación con la inteligencia humana, que es mucho más genérica en muchos sentidos.
Nuestro algoritmo de IA de ejemplo, que clasifica gatos y perros, no podrá identificar una especie rara de perro si no se alimenta con imágenes de esa especie.

Ajuste de los datos incrementales

Otro desafío importante son los datos incrementales. En nuestro ejemplo, si estamos tratando de reconocer gatos y perros, podríamos entrenar nuestra IA para una cantidad de imágenes de gatos y perros de diferentes especies mientras implementamos por primera vez. Pero en el descubrimiento de una nueva especie por completo, necesitamos entrenar el algoritmo para reconocer "Kotpies" junto con las especies anteriores.
Si bien las nuevas especies pueden ser más similares a otras de lo que pensamos y pueden entrenarse fácilmente para adaptar el algoritmo, hay puntos en los que esto es más difícil y requiere un nuevo entrenamiento y una reevaluación completos.
La pregunta es ¿podemos hacer que la IA sea al menos adaptable a estos pequeños cambios?

Para hacer que la IA se pueda usar de inmediato, la idea es resolver los desafíos antes mencionados mediante un conjunto de enfoques llamados Aprendizaje efectivo (tenga en cuenta que no es un término oficial, solo lo estoy inventando para evitar escribir Meta-Learning, Transfer Learning, Pocos Shot Learning, Adversarial Learning y Multi-Task Learning todo el tiempo). Nosotros, en ParallelDots, ahora estamos utilizando estos enfoques para resolver problemas específicos con la IA, ganando pequeñas batallas mientras nos preparamos para una IA más integral para conquistar guerras más grandes. Permítanos presentarle estas técnicas una a la vez.

Cabe destacar que la mayoría de estas técnicas de Aprendizaje Efectivo no son algo nuevo. Simplemente están viendo un resurgimiento ahora. Los investigadores de SVM (Support Vector Machines) han estado utilizando estas técnicas durante mucho tiempo. El aprendizaje adversario, por otro lado, es algo que surgió del trabajo reciente de Goodfellow en GAN y Neural Reasoning es un nuevo conjunto de técnicas para las cuales los conjuntos de datos han estado disponibles muy recientemente. Profundicemos en cómo estas técnicas ayudarán a dar forma al futuro de la IA.

Transferencia de aprendizaje

¿Qué es?

Como sugiere el nombre, el aprendizaje se transfiere de una tarea a otra dentro del mismo algoritmo en Transfer Learning. Los algoritmos entrenados en una tarea (tarea de origen) con un conjunto de datos más grande se pueden transferir con o sin modificaciones como parte del algoritmo que intenta aprender una tarea diferente (tarea de destino) en un conjunto de datos (relativamente) más pequeño.

Algunos ejemplos

El uso de parámetros de un algoritmo de clasificación de imágenes como extractor de características en diferentes tareas, como la detección de objetos, es una aplicación simple de Transfer Learning. Por el contrario, también se puede utilizar para realizar tareas complejas. El algoritmo que Google desarrolló para clasificar la retinopatía diabética mejor que los médicos hace un tiempo atrás se hizo usando Transfer Learning. Sorprendentemente, el detector de retinopatía diabética era en realidad un clasificador de imágenes del mundo real (clasificador de imágenes de perros/gatos) Transfer Learning para clasificar escaneos oculares.

¡Dime más!

Encontrará a los científicos de datos llamando a las partes transferidas de las redes neuronales desde la tarea de origen a la de destino como redes preentrenadas en la literatura de aprendizaje profundo. El ajuste fino se produce cuando los errores de la tarea de destino se propagan ligeramente hacia atrás en la red preentrenada en lugar de utilizar la red preentrenada sin modificar. Se puede ver una buena introducción técnica a Transfer Learning en Computer Vision aquí. Este concepto simple de Aprendizaje por Transferencia es muy importante en nuestro conjunto de metodologías de Aprendizaje Efectivo.

Cómo Metaverse transformará la industria automotriz india

Recursos

¿Qué significa la disposición contra la especulación para las nuevas empresas indias?

Cómo las empresas emergentes de Edtech están ayudando a mejorar las habilidades y preparar a la fuerza laboral para el futuro

Recursos

Cómo las empresas emergentes de Edtech están ayudando a la fuerza laboral de la India a mejorar y prepararse para el futuro...

Noticias

Acciones tecnológicas de la nueva era esta semana: los problemas de Zomato continúan, EaseMyTrip publica...

Características

Startups indias toman atajos en busca de financiación

Según se informa, la empresa de marketing digital Logicserve Digital ha recaudado INR 80 Cr en fondos de la firma alternativa de gestión de activos Florintree Advisors.

Noticias

La plataforma de marketing digital Logicserve obtiene fondos de INR 80 Cr, cambia de marca como LS Dig...