Identificación de atributos subjetivos de entidades

Publicado: 2022-05-13

Identificación de atributos subjetivos de UGC de entidades

Esta patente recientemente concedida trata sobre la identificación de atributos subjetivos de entidades.

No he visto una patente sobre atributos subjetivos de entidades o respuestas a esas entidades.

Un aspecto crítico de esto es que es contenido generado por el usuario.

Nos dicen que el contenido generado por el usuario (UGC, por sus siglas en inglés) es cada vez más común en la Web debido a la creciente popularidad de las redes sociales, los blogs, los sitios web de reseñas, etc.

A menudo vemos contenido generado por el usuario en forma de comentarios, como:

  • Un comentario de un primer usuario sobre el contenido compartido por un segundo usuario dentro de una red social
  • Comentarios de usuarios en respuesta a un artículo en el blog de un columnista
  • Un comentario de un videoclip publicado en un sitio web de alojamiento de contenido
  • Reseñas (como de productos, películas)
  • Acciones (como ¡Me gusta!, ¡No me gusta!, +1, compartir, marcar, incluir en la lista de reproducción, etc.)
  • Así sucesivamente

Bajo esta patente, se proporciona una forma de identificar y predecir atributos subjetivos para entidades (como clips multimedia, imágenes, artículos de periódicos, entradas de blogs, personas, organizaciones, negocios comerciales, etc.).

Empieza con:

  • Identificar un primer conjunto de atributos subjetivos para una primera entidad en función de una reacción a la primera entidad (como comentarios en un sitio web, una demostración de aprobación de la primera entidad (como "¡Me gusta!", etc.)
  • Compartiendo la primera entidad
  • Marcar la primera entidad
  • Agregar la primera entidad a una lista de reproducción
  • Entrenamiento de un clasificador (como una máquina de vectores de soporte, AdaBoost, una red neuronal, un árbol de decisiones en un conjunto de asignaciones de entrada-salida, donde el conjunto de asignaciones de entrada-salida comprende una asignación de entrada-salida cuya entrada proporciona un vector de características para la primera entidad, cuya salida se basa en el primer conjunto de atributos subjetivos
  • Proporcionar un vector de características para una segunda entidad al clasificador entrenado para obtener un segundo conjunto de atributos subjetivos para la segunda entidad

Se proporciona una memoria y un procesador para identificar y predecir atributos subjetivos para entidades.

Un medio de almacenamiento legible por computadora tiene instrucciones que hacen que un sistema informático realice operaciones que incluyen:

  • Identificar un primer conjunto de atributos subjetivos para una primera entidad en base a una reacción a la primera entidad
  • Obtención de un primer vector de características para la primera entidad
  • Entrenamiento de un clasificador en un conjunto de mapeos de entrada-salida, donde el conjunto de mapeos de entrada-salida comprende un mapeo de entrada-salida cuya entrada se basa en el primer vector de características y cuya salida se basa en el primer conjunto de atributos subjetivos
  • Obtención de un segundo vector de características para una segunda entidad
  • Proporcionar al clasificador, después del entrenamiento, el segundo vector de características para obtener un segundo conjunto de atributos subjetivos para la segunda entidad.

Esta patente sobre la identificación de atributos subjetivos para entidades = se encuentra en:

Identificación de atributos subjetivos mediante el análisis de señales de curación
Inventores: Hrishikesh Aradhye y Sanketh Shetty
Cesionario: Google LLC
Patente de EE. UU.: 11,328,218
Concedido: 10 de mayo de 2022
Archivado: 6 de noviembre de 2017

Resumen:

Se divulga un sistema y método para identificar y predecir atributos subjetivos para entidades (como clips de medios, películas, programas de televisión, imágenes, artículos de periódicos, entradas de blogs, personas, organizaciones, negocios comerciales, etc.).

En un aspecto, los atributos subjetivos para un primer elemento de medios se identifican en base a una reacción al primer elemento de medios, y se determinan las puntuaciones de relevancia para las cualidades personales con respecto al primer elemento de medios.

Un clasificador se entrena usando (i) una entrada de entrenamiento que comprende un conjunto de características para el primer elemento multimedia y una salida objetivo para la entrada de entrenamiento, comprendiendo la salida objetivo las puntuaciones de relevancia respectivas para los atributos subjetivos del primer elemento multimedia.

Identificación y predicción de atributos subjetivos para entidades

Formas de identificar y predecir atributos subjetivos para entidades (como clips multimedia, imágenes, artículos de periódicos, entradas de blogs, personas, organizaciones, negocios comerciales, etc.).

Los atributos subjetivos (como "lindo", "divertido", "impresionante", etc.) se definen y los atributos subjetivos para una entidad en particular se identifican en función de la reacción del usuario a la entidad, como:

  • Comentarios en un sitio web
  • ¡Me gusta!
  • Compartir la primera entidad con otros usuarios
  • Marcar la primera entidad
  • Agregar la primera entidad a una lista de reproducción
  • Etc

Las puntuaciones de relevancia para los atributos subjetivos se determinan sobre la entidad

Si el atributo subjetivo "lindo" aparece en una proporción significativa de los comentarios de un videoclip, es posible que se le asigne a "lindo" una puntuación de relevancia alta.

A continuación, la entidad se asocia con los atributos subjetivos identificados y las puntuaciones de relevancia (por ejemplo, mediante etiquetas aplicadas a la entidad, mediante entradas en una tabla de una base de datos relacional, etc.).

El procedimiento anterior se realiza para cada entidad en un conjunto dado de entidades (como clips de video en un repositorio de clips de video, etc.), y se genera un mapeo inverso de atributos subjetivos a entidades en el grupo basado en cualidades personales y puntajes de relevancia. .

El mapeo inverso se puede usar para identificar todas las entidades en el conjunto que coinciden con un atributo subjetivo determinado (como todas las entidades que se han asociado con el atributo subjetivo "gracioso", etc.), lo que permite:

  • Recuperación rápida de entidades relevantes para procesar búsquedas de palabras clave
  • Llenar listas de reproducción
  • entrega de anuncios
  • Generación de conjuntos de entrenamiento para el clasificador.
  • Así sucesivamente

Un clasificador (como una máquina de vectores de soporte [SVM], AdaBoost, una red neuronal, un árbol de decisiones, etc.) se entrena proporcionando un conjunto de ejemplos de entrenamiento, donde la entrada para un ejemplo de entrenamiento comprende un vector de características obtenido de un entidad particular (como un vector de características para un clip de video).

Puede contener valores numéricos sobre:

  • Color
  • Textura
  • Intensidad
  • Etiquetas de metadatos asociadas al videoclip
  • Etc

La salida tiene puntajes de relevancia para cada atributo subjetivo en el vocabulario de la entidad particular.

El clasificador entrenado puede entonces predecir atributos subjetivos para entidades que no están en el conjunto de entrenamiento (como un videoclip recién subido, un artículo de noticias que aún no ha recibido ningún comentario, etc.).

Esta patente puede clasificar entidades de acuerdo con atributos subjetivos como "gracioso", "bonito", etc. según la reacción del usuario a las entidades.

Esta patente puede mejorar la calidad de las descripciones de las entidades, como etiquetas para un videoclip, mejorando la calidad de las búsquedas y la orientación de los anuncios.

Una arquitectura de sistema para identificar atributos subjetivos

La arquitectura del sistema incluye:

  • máquina servidor
  • tienda de la entidad
  • Las máquinas cliente están conectadas a una red.

La red puede ser pública (como Internet), una red privada (como una red de área local (LAN) o una red de área amplia (WAN)), o una combinación de las mismas.

Las máquinas cliente pueden ser terminales inalámbricos (smartphones, etc.), ordenadores personales (PC), portátiles, tabletas o cualquier otro dispositivo informático o de comunicación.

Las máquinas cliente pueden ejecutar un sistema operativo (SO) que administra el hardware y el software de las máquinas cliente.

Un navegador (que no se muestra) puede ejecutarse en las máquinas cliente (como en el sistema operativo de las máquinas cliente).

El navegador puede ser un navegador web que puede acceder a páginas web y contenido servido por un servidor web.

Las máquinas cliente también pueden cargar:

  • páginas web
  • clips multimedia
  • Entradas de blog
  • enlaces a artículos
  • Así sucesivamente

La máquina servidor incluye un servidor web y un administrador de atributos subjetivos. El servidor web y el administrador de atributos emocionales pueden ejecutarse en diferentes dispositivos.

El almacén de entidades es un almacenamiento persistente capaz de almacenar entidades como clips multimedia (como clips de video, clips de audio, clips que contienen tanto video como audio, imágenes, etc.) y otros tipos de elementos de contenido (como páginas web, archivos de texto). basados ​​en documentos, reseñas de restaurantes, reseñas de películas, etc.), así como estructuras de datos para etiquetar, organizar e indexar las entidades.

El almacén de entidades puede estar alojado en dispositivos de almacenamiento, como memoria principal, discos basados ​​en almacenamiento magnético u óptico, cintas o discos duros, NAS, SAN, etc.

El almacén de entidades puede alojarse en un servidor de archivos conectado a la red. Por el contrario, en otras implementaciones, el almacén de entidades puede alojarse en algún otro tipo de almacenamiento persistente, como el de la máquina servidor o diferentes máquinas acopladas a la máquina servidor a través de la red.

Las entidades almacenadas en el almacén de entidades pueden incluir contenido generado por el usuario que cargan las máquinas cliente y pueden incluir contenido proporcionado por proveedores de servicios como:

  • Organizaciones de noticias
  • Editores
  • bibliotecas
  • Pronto

El servidor puede servir páginas web y contenido de las tiendas de la entidad a los clientes.

El administrador de atributos subjetivos:

  • Identifica atributos subjetivos para entidades en función de la reacción del usuario (como comentarios, Me gusta, compartir, marcar, lista de reproducción, etc.)
  • Determina puntuaciones de relevancia para atributos subjetivos sobre entidades.
  • Asocia atributos subjetivos y puntajes de relevancia con entidades
  • Extrae características como las características de la imagen, como el color, la textura y la intensidad; funciones de audio como amplitud, relaciones de coeficientes espectrales; características textuales como frecuencias de palabras, longitud promedio de oraciones, parámetros de formato; metadatos asociados a la entidad; etc.) de entidades para generar vectores de características
  • Entrena un clasificador basado en los vectores de características y las puntuaciones de relevancia de los atributos subjetivos
  • Utiliza el clasificador entrenado para predecir atributos subjetivos para nuevas entidades en función de los vectores de características de las nuevas entidades.

Un administrador de atributos subjetivos

El administrador de atributos subjetivos puede ser el mismo que el administrador de atributos subjetivos y puede incluir:

  • Identificador de atributo subjetivo
  • Marcador de relevancia
  • Extractor de características
  • clasificador
  • Almacén de datos
  • .

Los componentes se pueden combinar o separar en más detalles.

El almacén de datos puede ser el mismo que el almacén de entidades o un almacén de datos diferente (como un búfer temporal o un almacén de datos permanente) para contener un vocabulario de atributos personales, entidades que se van a procesar, vectores de características asociados con entidades, atributos personales y puntajes de relevancia relacionados con las entidades, o alguna combinación de estos datos.

El almacén de datos puede estar alojado en dispositivos de almacenamiento, como la memoria principal, discos magnéticos u ópticos basados ​​en almacenamiento, cintas o discos duros, etc.

El administrador de atributos subjetivos notifica a los usuarios sobre los tipos de información almacenada en el almacén de datos y en el almacén de entidades y permite a los usuarios elegir que dicha información no se recopile ni se comparta con el administrador de atributos subjetivos.

El identificador de atributo subjetivo

El identificador de atributo personal identifica los atributos subjetivos de las entidades en función de la reacción del usuario a las entidades.

El identificador de atributo personal puede identificar atributos subjetivos a través del procesamiento de texto de los comentarios de los usuarios a una entidad publicados por un usuario en un sitio web de redes sociales.

El identificador de atributo subjetivo puede identificar atributos subjetivos para entidades en función de otros tipos de reacciones del usuario a las entidades, como:

  • '¡Me gusta!' o '¡No me gusta!'
  • Compartiendo la entidad
  • Marcar la entidad
  • Agregar la entidad a una lista de reproducción
  • Así sucesivamente

El identificador de atributo personal puede aplicar umbrales para determinar qué atributos están asociados con una entidad (por ejemplo, un atributo subjetivo debe aparecer en al menos N comentarios, etc.).

El marcador de relevancia determina las puntuaciones de relevancia para los atributos subjetivos de las entidades.

Por ejemplo, cuando el identificador de atributo subjetivo ha identificado los atributos subjetivos "bonito", "divertido" e "impresionante" en función de los comentarios de un clip multimedia publicado en un sitio web de redes sociales, el marcador de relevancia puede determinar puntuaciones de relevancia para cada uno de estos tres atributos subjetivos. atributos basados ​​en:

  • La frecuencia con la que estos atributos subjetivos aparecen en los comentarios.
  • Los usuarios particulares que proporcionaron los atributos subjetivos
  • Así sucesivamente

Por ejemplo, si hay 40 comentarios y aparece "lindo" en 20 palabras y "impresionante" en 8 comentarios, entonces se le puede asignar a "lindo" una puntuación de relevancia superior a "impresionante".

Las puntuaciones de relevancia se pueden asignar en función de la proporción de comentarios en los que aparece un atributo subjetivo (como una puntuación de 0,5 para "lindo" y una puntuación de 0,2 para "impresionante", etc.).

El anotador de relevancia puede quedarse solo con los k atributos subjetivos más relevantes y descartar otros atributos personales.

Por ejemplo, supongamos que el identificador de atributos personales identifica siete atributos emocionales que aparecen en los comentarios de los usuarios al menos tres veces. En ese caso, el calificador de relevancia puede, por ejemplo, conservar solo los cinco atributos subjetivos con las puntuaciones de relevancia más altas y descartar los otros dos atributos emocionales (por ejemplo, estableciendo sus puntuaciones de relevancia en cero, etc.).

Una puntuación de relevancia es un número natural entre 0,0 y 1,0 inclusive.

El extractor de características obtiene un vector de características para una entidad utilizando técnicas como:

  • Análisis de componentes principales
  • Incrustaciones semidefinidas
  • isomapas
  • Mínimos cuadrados parciales
  • Así sucesivamente

Los cálculos asociados con la extracción de características de una entidad son realizados por el propio extractor de características.

En algunos otros aspectos, estos cálculos los realiza otra entidad, como una biblioteca ejecutable de:

  • Rutinas de procesamiento de imágenes alojadas en la máquina del servidor [no representadas en las Figuras]
  • Rutinas de procesamiento de audio
  • Rutinas de procesamiento de texto
  • Etc

Los resultados se proporcionan al extractor de características.

El clasificador es una máquina de aprendizaje (como máquinas de vectores de soporte [SVM], AdaBoost, redes neuronales, árboles de decisión, etc.) que acepta como entrada un vector de características asociado con una entidad y genera puntajes de relevancia (como un número real entre 0 y 1 inclusive, etc.) para cada atributo subjetivo del vocabulario de atributos personales.

El clasificador consta de un solo clasificador.

El clasificador puede incluir múltiples clasificadores (como un clasificador para cada atributo subjetivo en el vocabulario de atributos personales, etc.).

Se reúne un conjunto de ejemplos positivos y criterios negativos para cada atributo subjetivo en el vocabulario de atributos personales.

El conjunto de ejemplos positivos para un atributo subjetivo puede incluir vectores de características para entidades asociadas con ese atributo personal en particular.

El conjunto de ejemplos negativos para un atributo subjetivo puede incluir vectores de características para entidades que no se han asociado con ese atributo personal en particular.

Cuando el conjunto de ejemplos positivos y el conjunto de criterios negativos son de tamaño desigual, el conjunto más extenso puede muestrearse para que coincida con el tamaño del grupo más pequeño.

Después del entrenamiento, el clasificador puede predecir atributos subjetivos para otras entidades que no están en el conjunto de entrenamiento proporcionando vectores de características para estas entidades como entrada al clasificador.

Se puede obtener un conjunto de atributos subjetivos a partir de la salida del clasificador al incluir todos los atributos emocionales con puntajes de relevancia distintos de cero. Se puede obtener un grupo de puntos subjetivos aplicando el umbral más pequeño a las puntuaciones numéricas (considerando todos los atributos personales que tienen una puntuación de al menos, digamos, 0,2 como miembros del conjunto).

Identificación de atributos subjetivos de entidades

El método se realiza procesando la lógica que puede comprender hardware (circuitos, lógica dedicada, etc.), software (como se ejecuta en un sistema informático de propósito general o una máquina dedicada), o ambos.

El método lo realiza la máquina del servidor, mientras que otras implementaciones pueden ser realizadas por otro dispositivo.

Varios componentes de los administradores de atributos subjetivos pueden ejecutarse en máquinas separadas (como el identificador de atributo personal y el marcador de relevancia pueden ejecutarse en un dispositivo mientras que el extractor de características y el clasificador se ejecutan en otro dispositivo, etc.).

Para simplificar la explicación, el método se representa y describe como una serie de actos.

Pero los actos pueden ocurrir en varios órdenes y con otros actos no presentados y descritos aquí.

Además, no todos los actos ilustrados pueden ser requeridos para instalar los métodos por el tema divulgado.

Además, los expertos en la materia comprenderán y apreciarán que el método podría representarse como una serie de estados interrelacionados mediante un diagrama de estados o eventos.

Además, debe apreciarse que los métodos descritos en esta especificación pueden almacenarse en un artículo de fabricación para facilitar el transporte y la transferencia de dichas metodologías a los dispositivos informáticos.

El término artículo de fabricación, como se usa aquí, pretende abarcar un programa informático accesible desde cualquier dispositivo legible por computadora o medio de almacenamiento.

Se genera un vocabulario de atributos subjetivos.

En algunos aspectos, el vocabulario de atributos subjetivos puede definirse. Por el contrario, en algunos otros factores, el vocabulario de atributos personales puede generarse de forma automatizada mediante la recopilación de términos y frases que se utilizan en las reacciones de los usuarios a las entidades. Por el contrario, en otros aspectos, el vocabulario puede generarse mediante una combinación de técnicas manuales y automatizadas.

El vocabulario se siembra con una pequeña cantidad de atributos subjetivos que se espera que se apliquen a las entidades. El vocabulario se amplía con el tiempo a medida que se identifican más términos o frases que aparecen en las reacciones de los usuarios mediante el procesamiento automatizado de las respuestas.

El vocabulario de atributos subjetivos puede organizarse jerárquicamente, posiblemente en base a "metaatributos" asociados con los atributos personales (como el atributo personal "gracioso" puede tener un metaatributo "positivo", mientras que el punto subjetivo "repugnante" puede tener un meta-atributo "negativo", etc.).

Se procesa previamente un conjunto S de entidades (como todas las entidades en el almacén de entidades, un subconjunto de entidades en el almacén de entidades, etc.).

Bajo un aspecto, el procesamiento previo de las entidades comprende identificar las reacciones del usuario a las entidades y luego entrenar un clasificador basado en las respuestas.

Cuando una entidad es una entidad física real

Cabe señalar que cuando una entidad es una entidad física real (como una persona, un restaurante, etc.), el procesamiento previo de la entidad se realiza a través de un "proxy cibernético" asociado con la entidad física (como un página de fans de un actor en un sitio web de redes sociales, una reseña de un restaurante en un sitio web, etc.); pero se considera que los atributos subjetivos se asocian con la entidad en sí (como el actor o el restaurante, no la página de fans del actor o la reseña del restaurante).

Un ejemplo de un método para realizar get se describe en detalle.

Se recibe una entidad E que no está en el conjunto S (como un videoclip recién subido, un artículo de noticias que aún no ha recibido ningún comentario, una entidad en la tienda de entidades que no estaba incluida en el conjunto de entrenamiento, etc.).

Se obtienen los atributos del sujeto y las puntuaciones de relevancia para la entidad E.

A continuación se describe en detalle una implementación de un primer método de ejemplo, y se describe el rendimiento de un segundo método de ejemplo.

Los atributos subjetivos y las puntuaciones de relevancia obtenidos se asocian con la entidad E (por ejemplo, aplicando las etiquetas correspondientes a la entidad, añadiendo un registro en una tabla de base de datos relacional, etc.).

La ejecución continúa hacia atrás.

Debe tenerse en cuenta que el clasificador puede volver a entrenarse (por ejemplo, después de cada 100 iteraciones del bucle, cada N días, etc.) mediante un proceso de reentrenamiento que puede ejecutarse simultáneamente.

Preprocesamiento de un conjunto de entidades

El método se realiza procesando la lógica que puede comprender hardware (circuitos, lógica dedicada, etc.), software (como se ejecuta en un sistema informático de propósito general o una máquina dedicada), o ambos.

El método se ejecuta, mientras que en otras implementaciones puede hacerlo otra máquina.

El conjunto de entrenamiento se inicializa en el conjunto vacío. Una entidad E es seleccionada y eliminada del conjunto S de entidades.

Los atributos subjetivos para la entidad E se identifican en función de las reacciones del usuario a la entidad E (como comentarios del usuario, Me gusta, marcar, compartir, agregar a una lista de reproducción, etc.).

La identificación de atributos subjetivos incluye realizar el procesamiento de los comentarios de los usuarios, por ejemplo:

  • Coincidencia de palabras en comentarios de usuarios con atributos subjetivos en el vocabulario
  • Combinar la coincidencia de palabras y otras técnicas de procesamiento del lenguaje natural, como el análisis sintáctico y semántico
  • Etc

Entidades que ocurren cerca de ubicaciones

Las reacciones de los usuarios pueden agregarse para entidades que ocurren en muchos lugares, como:

  • Entidades que aparecen en las listas de reproducción de muchos usuarios
  • Entidades que se han compartido y aparecen en una pluralidad de "noticias" de usuarios en un sitio web de redes sociales
  • Etc

Las diferentes ubicaciones pueden ponderarse en su contribución a las puntuaciones de relevancia en función de una variedad de factores, como:

El usuario particular asociado con la ubicación (por ejemplo, un usuario específico puede ser una autoridad en música clásica y, por lo tanto, los comentarios sobre una entidad en su suministro de noticias pueden tener más peso que los comentarios en otro suministro de noticias, etc.), reacciones de usuarios no textuales (como como "¡Me gusta!", "¡No me gusta!", "+1", etc.).

Además, la cantidad de ubicaciones en las que aparece la entidad también se puede usar para determinar los atributos subjetivos y las puntuaciones de relevancia (por ejemplo, las puntuaciones de relevancia de un videoclip pueden aumentar cuando el videoclip está en cientos de listas de reproducción de usuarios, etc.).

El bloque se realiza mediante un identificador de atributo subjetivo.

Las puntuaciones de relevancia para los atributos subjetivos las determina la entidad E.

Se determina una puntuación de relevancia para un atributo subjetivo particular en función de la frecuencia con la que el atributo personal aparece en los comentarios de los usuarios, los usuarios específicos que proporcionaron los detalles subjetivos en sus palabras (como algunos usuarios pueden saber por experiencia que son más precisos en sus comentarios que otros usuarios, etc.).

Por ejemplo, si hay 40 comentarios y aparece "lindo" en 20 palabras y "impresionante" en 8 comentarios, entonces se le puede asignar a "lindo" una puntuación de relevancia superior a "impresionante".

Los puntajes de relevancia pueden asignarse en función de la proporción de comentarios en los que aparece un atributo subjetivo (como un puntaje de 0,5 para "lindo" y un puntaje de 0,2 para "impresionante", etc.).

Bajo un aspecto, las puntuaciones de relevancia se normalizan para caer en intervalos [0, 1].

Por algunos aspectos, los atributos subjetivos identificados pueden descartarse en función de sus puntajes de relevancia (como retener los k atributos emocionales con puntajes de relevancia más altos, descartar cualquier atributo personal cuyo puntaje de relevancia esté por debajo de un umbral, etc.).

identificador de atributos subjetivos

Cabe señalar que un atributo subjetivo puede descartarse estableciendo su puntuación de relevancia en cero en algunos aspectos.

Los atributos subjetivos y las puntuaciones de relevancia están asociados con las entidades

Los atributos subjetivos y las puntuaciones de relevancia se asocian con las entidades (por ejemplo, mediante etiquetado, entradas en una tabla en una base de datos relacional, etc.).

Se obtiene un vector de características para la entidad E.

En un aspecto, el vector de características de un videoclip o una imagen fija puede contener valores numéricos sobre el color, la textura, la intensidad, etc., mientras que el vector de características de un clip de audio (o un videoclip con sonido) puede incluir valores numéricos sobre la amplitud. , coeficientes espectrales, etc., mientras que el vector de características de un documento de texto puede incluir:

  • Valores numéricos sobre frecuencias de palabras
  • Longitud promedio de la oración
  • Parámetros de formato
  • Así sucesivamente

Esto puede ser realizado por el extractor de características.

El vector de características y las puntuaciones de relevancia obtenidas se añaden al conjunto de entrenamiento.

El bloque comprueba si el conjunto S de entidades está vacío; si S no está vacío, la ejecución continúa; de lo contrario, continúa la ejecución.

El clasificador se entrena en todos los ejemplos del conjunto de entrenamiento, de modo que el vector de características de un ejemplo de entrenamiento se proporciona como entrada al clasificador y las puntuaciones de relevancia de los atributos subjetivos se proporcionan como salida.

Obtención de atributos subjetivos y puntajes de relevancia para una entidad

Se genera un vector de características para la entidad E.

Como se describió anteriormente, el vector de funciones de un videoclip o una imagen fija puede contener valores numéricos sobre el color, la textura, la intensidad, etc. Por el contrario, el vector de funciones de un clip de audio (o un videoclip con sonido) puede incluir valores numéricos. sobre amplitud, coeficientes espectrales, etc. Por el contrario, el vector de características para un documento de texto puede incluir valores numéricos sobre frecuencias de palabras, longitud promedio de oraciones, parámetros de formato, etc.

El clasificador entrenado proporciona el vector de características para obtener atributos subjetivos predichos y puntajes de relevancia para la entidad E.

Los atributos subjetivos previstos y las puntuaciones de relevancia se asocian con la entidad E (por ejemplo, mediante etiquetas aplicadas a la entidad E, mediante entradas en una tabla de una base de datos relacional, etc.).

Un segundo método para obtener atributos subjetivos y puntajes de relevancia para una entidad

El método se realiza procesando la lógica que puede comprender hardware (circuitos, lógica dedicada, etc.), software o una combinación de ambos.

El método lo realiza la máquina del servidor, mientras que otros pueden ser realizados por otro dispositivo.

Se genera un vector de características para la entidad E. El clasificador entrenado proporciona el vector de características para obtener atributos subjetivos predichos y puntajes de relevancia para la entidad E.

Los atributos subjetivos predichos obtenidos se sugieren a un usuario (como el usuario que cargó la entidad). Se obtiene un conjunto refinado de atributos personales del usuario, como a través de una página web en la que el usuario selecciona entre los atributos sugeridos y posiblemente añade nuevos atributos, etc.).

Una puntuación de relevancia predeterminada para las entidades

Se asigna una puntuación de relevancia predeterminada a cualquier atributo subjetivo nuevo que haya agregado el usuario.

La puntuación de relevancia predeterminada puede ser 1,0 en una escala de 0,0 a 1,0, la puntuación de relevancia predeterminada puede basarse en el usuario en particular (como una puntuación de 1,0 cuando se sabe que el usuario es muy bueno para sugerir atributos, una puntuación de 0,8 cuando se sabe que el usuario es algo bueno para sugerir atributos, etc.).

Las ramas de bloqueo se basan en si el usuario eliminó cualquiera de los atributos subjetivos sugeridos (por ejemplo, al no seleccionar el atributo).

La Entidad E se almacena como un ejemplo negativo de los atributos eliminados para el futuro reentrenamiento del clasificador. El conjunto refinado de atributos subjetivos y las puntuaciones de relevancia correspondientes se asocian con la entidad E (por ejemplo, mediante etiquetas aplicadas a la entidad E, mediante entradas en una tabla de una base de datos relacional, etc.).