Identificando Atributos Subjetivos de Entidades

Publicados: 2022-05-13

Identificando Atributos Subjetivos de Entidades de UGC

Esta patente recentemente concedida trata de identificar atributos subjetivos de entidades.

Eu não vi uma patente sobre atributos subjetivos de entidades ou respostas a essas entidades.

Um aspecto crítico disso é que é conteúdo gerado pelo usuário.

Fomos informados de que o conteúdo gerado pelo usuário (UGC) está se tornando mais comum na Web devido à crescente popularidade das redes sociais, blogs, sites de revisão etc.

Muitas vezes vemos conteúdo gerado pelo usuário na forma de comentários, como:

  • Um comentário de um primeiro usuário sobre o conteúdo compartilhado por um segundo usuário em uma rede social
  • Comentários do usuário em resposta a um artigo no blog de um colunista
  • Um comentário de um videoclipe postado em um site de hospedagem de conteúdo
  • Comentários (como de produtos, filmes)
  • Ações (como Curtir!, Não curtir!, +1, compartilhamento, favoritos, lista de reprodução etc.)
  • Assim por diante

Sob esta patente, é fornecida uma maneira de identificar e prever atributos subjetivos para entidades (como clipes de mídia, imagens, artigos de jornal, entradas de blog, pessoas, organizações, empresas comerciais, etc.).

Ele começa com:

  • Identificar um primeiro conjunto de atributos subjetivos para uma primeira entidade com base em uma reação à primeira entidade (como comentários em um site, uma demonstração de aprovação da primeira entidade (como “Curtir! etc.)
  • Compartilhando a primeira entidade
  • Marcando a primeira entidade
  • Adicionando a primeira entidade a uma lista de reprodução
  • Treinar um classificador (como uma máquina de vetor de suporte, AdaBoost, uma rede neural, uma árvore de decisão em um conjunto de mapeamentos de entrada-saída, onde o conjunto de mapeamentos de entrada-saída compreende um mapeamento de entrada-saída cuja entrada é Fornecendo um vetor de recursos para a primeira entidade, cuja saída é baseada no primeiro conjunto de atributos subjetivos
  • Fornecer um vetor de recursos para uma segunda entidade ao classificador treinado para obter um segundo conjunto de atributos subjetivos para a segunda entidade

Uma memória e um processador são fornecidos para identificar e prever atributos subjetivos para entidades.

Um meio de armazenamento legível por computador tem instruções que fazem com que um sistema de computador execute operações, incluindo:

  • Identificar um primeiro conjunto de atributos subjetivos para uma primeira entidade com base em uma reação à primeira entidade
  • Obtendo um primeiro vetor de recursos para a primeira entidade
  • Treinar um classificador em um conjunto de mapeamentos de entrada-saída, em que o conjunto de mapeamentos de entrada-saída compreende um mapeamento de entrada-saída cuja entrada é baseada no primeiro vetor de recursos e cuja saída é baseada no primeiro conjunto de atributos subjetivos
  • Obtendo um segundo vetor de recursos para uma segunda entidade
  • Fornecer ao classificador, após o treinamento, o segundo vetor de características para obter um segundo conjunto de atributos subjetivos para a segunda entidade

Esta patente sobre a identificação de atributos subjetivos para entidades =é encontrada em:

Identificando atributos subjetivos por análise de sinais de curadoria
Inventores: Hrishikesh Aradhye e Sanketh Shetty
Responsável: Google LLC
Patente dos EUA: 11.328.218
Concedido: 10 de maio de 2022
Arquivado: 6 de novembro de 2017

Resumo:

Um sistema e método para identificar e prever atributos subjetivos para entidades (como clipes de mídia, filmes, programas de televisão, imagens, artigos de jornal, entradas de blog, pessoas, organizações, empresas comerciais, etc.) são divulgados.

Em um aspecto, os atributos subjetivos para um primeiro item de mídia são identificados com base em uma reação ao primeiro item de mídia, e as pontuações de relevância para as qualidades pessoais com o primeiro item de mídia são determinadas.

Um classificador é treinado usando (i) uma entrada de treinamento compreendendo um conjunto de recursos para o primeiro item de mídia e uma saída de destino para a entrada de treinamento, a saída de destino compreendendo as respectivas pontuações de relevância para os atributos subjetivos do primeiro item de mídia.

Identificando e Prevendo Atributos Subjetivos para Entidades

Formas de identificar e prever atributos subjetivos para entidades (como clipes de mídia, imagens, artigos de jornal, entradas de blog, pessoas, organizações, empresas comerciais, etc.).

Atributos subjetivos (como “fofo”, “engraçado”, “incrível” etc.) são definidos e os atributos subjetivos para uma determinada entidade são identificados com base na reação do usuário à entidade, como:

  • Comentários em um site
  • Como!
  • Compartilhando a primeira entidade com outros usuários
  • Boomarking a primeira entidade
  • Adicionando a primeira entidade a uma lista de reprodução
  • etc.

As pontuações de relevância para os atributos subjetivos são determinadas sobre a entidade

Se o atributo subjetivo “fofo” aparecer em uma proporção significativa dos comentários de um videoclipe, “fofo” pode receber uma pontuação de relevância alta.

A entidade é então associada aos atributos subjetivos identificados e pontuações de relevância (como por meio de tags aplicadas à entidade, por meio de entradas em uma tabela de um banco de dados relacional, etc.).

O procedimento acima é executado para cada entidade em um determinado conjunto de entidades (como videoclipes em um repositório de videoclipes, etc.), e um mapeamento inverso de atributos subjetivos para entidades no grupo é gerado com base em qualidades pessoais e pontuações de relevância .

O mapeamento inverso pode então ser usado para identificar todas as entidades do conjunto que correspondem a um determinado atributo subjetivo (como todas as entidades que foram associadas ao atributo subjetivo “engraçado”, etc.), permitindo:

  • Recuperação rápida de entidades relevantes para processar pesquisas de palavras-chave
  • Preenchendo listas de reprodução
  • Entrega de anúncios
  • Gerando conjuntos de treinamento para o classificador
  • Assim por diante

Um classificador (como uma máquina de vetor de suporte [SVM], AdaBoost, uma rede neural, uma árvore de decisão, etc.) entidade específica (como um vetor de recurso para um videoclipe.

Pode conter valores numéricos sobre:

  • Cor
  • Textura
  • Intensidade
  • Tags de metadados associadas ao videoclipe
  • etc.

A saída tem pontuações de relevância para cada atributo subjetivo no vocabulário para a entidade específica.

O classificador treinado pode então prever atributos subjetivos para entidades que não estão no conjunto de treinamento (como um videoclipe recém-carregado, um artigo de notícias que ainda não recebeu comentários etc.).

Esta patente pode classificar entidades de acordo com atributos subjetivos como “engraçado”, “fofo” etc. com base na reação do usuário às entidades.

Essa patente pode melhorar a qualidade das descrições das entidades, como tags para um videoclipe, melhorando a qualidade das pesquisas e o direcionamento dos anúncios.

Uma Arquitetura de Sistema para Identificar Atributos Subjetivos

A arquitetura do sistema inclui:

  • Máquina do servidor
  • Loja de entidades
  • As máquinas clientes estão conectadas a uma rede

A rede pode ser pública (como a Internet), uma rede privada (como uma rede local (LAN) ou uma vasta rede de área (WAN)) ou uma combinação delas.

As máquinas clientes podem ser terminais sem fio (smartphones, etc.), computadores pessoais (PC), laptops, tablets ou quaisquer outros dispositivos de computação ou comunicação.

As máquinas clientes podem executar um sistema operacional (SO) que gerencia o hardware e o software das máquinas clientes.

Um navegador (não mostrado) pode ser executado nas máquinas clientes (como no sistema operacional das máquinas clientes).

O navegador pode ser um navegador da web que pode acessar páginas da web e conteúdo servido por um servidor da web.

As máquinas clientes também podem carregar:

  • paginas web
  • Clipes de mídia
  • Entradas do blog
  • links para artigos
  • Assim por diante

A máquina servidora inclui um servidor web e um gerenciador de atributos subjetivos. O servidor web e o gerenciador de atributos emocionais podem ser executados em dispositivos diferentes.

O armazenamento de entidade é um armazenamento persistente capaz de armazenar entidades como clipes de mídia (como videoclipes, clipes de áudio, clipes contendo vídeo e áudio, imagens etc.) documentos baseados, resenhas de restaurantes, resenhas de filmes, etc.), bem como estruturas de dados para marcar, organizar e indexar as entidades.

O armazenamento de entidade pode ser hospedado por dispositivos de armazenamento, como memória principal, discos baseados em armazenamento magnético ou óptico, fitas ou discos rígidos, NAS, SAN, etc.

O armazenamento de entidade pode ser hospedado por um servidor de arquivos conectado à rede. Em contraste, em outras implementações, o armazenamento de entidade pode ser hospedado por algum outro tipo de armazenamento persistente, como o da máquina servidora ou máquinas diferentes acopladas à máquina servidora pela rede.

As entidades armazenadas no armazenamento de entidades podem incluir conteúdo gerado pelo usuário que é carregado por máquinas clientes e pode incluir conteúdo fornecido por provedores de serviços, como:

  • Organizações de notícias
  • Editores
  • Bibliotecas
  • Em breve

O servidor pode servir páginas da web e conteúdo das lojas da entidade para os clientes.

O gerente de atributo subjetivo:

  • Identifica atributos subjetivos para entidades com base na reação do usuário (como comentários, Curtir!, compartilhamento, favoritos, lista de reprodução etc.)
  • Determina pontuações de relevância para atributos subjetivos sobre entidades
  • Associa atributos subjetivos e pontuações de relevância com entidades
  • Extrai recursos como recursos de imagem, como cor, textura e intensidade; recursos de áudio como amplitude, relações de coeficientes espectrais; recursos textuais como frequências de palavras, comprimento médio das frases, parâmetros de formatação; metadados associados à entidade; etc.) de entidades para gerar vetores de recursos
  • Treina um classificador com base nos vetores de recursos e nas pontuações de relevância dos atributos subjetivos
  • Usa o classificador treinado para prever atributos subjetivos para novas entidades com base em vetores de recursos das novas entidades

Um gerente de atributos subjetivos

O gerenciador de atributo subjetivo pode ser o mesmo que o gerenciador de atributo subjetivo e pode incluir:

  • Identificador de atributo subjetivo
  • Pontuador de relevância
  • Extrator de recursos
  • Classificador
  • Banco de dados
  • .

Os componentes podem ser combinados ou separados em mais detalhes.

O armazenamento de dados pode ser o mesmo que o armazenamento de entidade ou um armazenamento de dados diferente (como um buffer temporário ou um armazenamento de dados permanente) para manter um vocabulário de atributos pessoais, entidades que devem ser processadas, vetores de recursos associados a entidades, atributos pessoais e pontuações de relevância relacionadas a entidades, ou alguma combinação desses dados.

O armazenamento de dados pode ser hospedado por dispositivos de armazenamento, como memória principal, discos baseados em armazenamento magnético ou óptico, fitas ou discos rígidos, etc.

O gerenciador de atributo subjetivo notifica os usuários sobre os tipos de informações armazenadas no armazenamento de dados e armazenamento de entidade e permite que os usuários optem por não ter tais informações coletadas e compartilhadas com o gerenciador de atributo subjetivo.

O Identificador de Atributo Subjetivo

O identificador de atributo pessoal identifica atributos subjetivos para entidades com base na reação do usuário às entidades.

O identificador de atributo pessoal pode identificar atributos subjetivos por meio do processamento de texto dos comentários dos usuários para uma entidade postada por um usuário em um site de rede social.

O identificador de atributo subjetivo pode identificar atributos subjetivos para entidades com base em outros tipos de reações do usuário a entidades, como:

  • 'Como!' ou 'Não gosto!'
  • Compartilhando a entidade
  • Marcando a entidade
  • Adicionando a entidade a uma playlist
  • Assim por diante

O identificador de atributo pessoal pode aplicar limites para determinar quais atributos estão associados a uma entidade (como um atributo subjetivo deve aparecer em pelo menos N comentários etc.).

O avaliador de relevância determina pontuações de relevância para atributos subjetivos sobre entidades.

Por exemplo, quando o identificador de atributo subjetivo identifica os atributos subjetivos “bonito”, “engraçado” e “impressionante” com base em comentários a um clipe de mídia postado em um site de rede social, o avaliador de relevância pode determinar pontuações de relevância para cada um desses três atributos subjetivos. atributos baseados em:

  • A frequência com que esses atributos subjetivos aparecem nos comentários
  • Os usuários específicos que forneceram os atributos subjetivos
  • Assim por diante

Por exemplo, se houver 40 comentários e “cute” aparecer em 20 palavras e “incrível” aparecer em 8 comentários, então “cute” poderá receber uma pontuação de relevância maior que “incrível”.

As pontuações de relevância podem ser atribuídas com base na proporção de comentários em que um atributo subjetivo aparece (como uma pontuação de 0,5 para “fofo” e uma pontuação de 0,2 para “incrível” etc.).

O avaliador de relevância pode manter apenas os k atributos subjetivos mais relevantes e descartar outros atributos pessoais.

Por exemplo, suponha que o identificador de atributo pessoal identifique sete atributos emocionais que aparecem nos comentários do usuário pelo menos três vezes. Nesse caso, o avaliador de relevância pode, por exemplo, reter apenas os cinco atributos subjetivos com as pontuações de relevância mais altas e descartar os outros dois atributos emocionais (como definir suas pontuações de relevância para zero, etc.).

Uma pontuação de relevância é um número natural entre 0,0 e 1,0 inclusive.

O extrator de recursos obtém um vetor de recursos para uma entidade usando técnicas como:

  • Análise de componentes principais
  • Incorporações semidefinidas
  • Isomapas
  • Mínimos quadrados parciais
  • Assim por diante

Os cálculos associados à extração de recursos de uma entidade são realizados pelo próprio extrator de recursos.

Em alguns outros aspectos, esses cálculos são realizados por outra entidade, como uma biblioteca executável de:

  • Rotinas de processamento de imagem hospedadas pela máquina servidora [não representadas nas Figuras]
  • Rotinas de processamento de áudio
  • Rotinas de processamento de texto
  • etc.

Os resultados são fornecidos ao extrator de recursos.

O classificador é uma máquina de aprendizado (como máquinas de vetor de suporte [SVMs], AdaBoost, redes neurais, árvores de decisão, etc.) que aceita como entrada um vetor de recursos associado a uma entidade e gera pontuações de relevância (como um número real entre 0 e 1 inclusive, etc.) para cada atributo subjetivo do vocabulário de atributos pessoais.

O classificador consiste em um único classificador.

O classificador pode incluir vários classificadores (como um classificador para cada atributo subjetivo no vocabulário de atributos pessoais, etc.).

Um conjunto de exemplos positivos e critérios negativos são reunidos para cada atributo subjetivo no vocabulário de atributos pessoais.

O conjunto de exemplos positivos para um atributo subjetivo pode incluir vetores de características para entidades associadas a esse atributo pessoal específico.

O conjunto de exemplos negativos para um atributo subjetivo pode incluir vetores de recursos para entidades que não foram associadas a esse atributo pessoal específico.

Quando o conjunto de exemplos positivos e o conjunto de critérios negativos são desiguais em tamanho, o conjunto mais extenso pode ser amostrado para corresponder ao tamanho do grupo menor.

Após o treinamento, o classificador pode prever atributos subjetivos para outras entidades que não estão no conjunto de treinamento, fornecendo vetores de características para essas entidades como entrada para o classificador.

Um conjunto de atributos subjetivos pode ser obtido a partir da saída do classificador, incluindo todos os atributos emocionais com pontuações de relevância diferentes de zero. Um grupo de pontos subjetivos pode ser obtido aplicando-se o menor limiar às pontuações numéricas (considerando todos os atributos pessoais que tenham uma pontuação de pelo menos, digamos, 0,2 como sendo um membro do conjunto).

Identificando Atributos Subjetivos de Entidades

O método é executado por lógica de processamento que pode incluir hardware (circuitos, lógica dedicada, etc.), software (como é executado em um sistema de computador de uso geral ou em uma máquina dedicada) ou ambos.

O método é executado pela máquina servidora, enquanto algumas outras implementações podem ser executadas por outro dispositivo.

Vários componentes de gerenciadores de atributos subjetivos podem ser executados em máquinas separadas (como o identificador de atributo pessoal e o marcador de relevância podem ser executados em um dispositivo enquanto o extrator de recursos e o classificador são executados em outro dispositivo, etc.).

Para simplificar a explicação, o método é descrito e descrito como uma série de atos.

Mas atos podem ocorrer em diversas ordens e com outros atos não apresentados e descritos neste documento.

Além disso, nem todos os atos ilustrados podem ser obrigados a instalar os métodos pela matéria divulgada.

Além disso, os versados ​​na técnica compreenderão e apreciarão que o método pode ser representado como uma série de estados inter-relacionados por meio de um diagrama de estados ou eventos.

Além disso, deve ser apreciado que os métodos divulgados nesta especificação são capazes de serem armazenados em um artigo de fabricação para facilitar o transporte e a transferência de tais metodologias para dispositivos de computação.

O termo artigo de fabricação, conforme usado neste documento, pretende abranger um programa de computador acessível a partir de qualquer dispositivo legível por computador ou mídia de armazenamento.

Um vocabulário de atributos subjetivos é gerado.

Em alguns aspectos, o vocabulário de atributos subjetivos pode ser definido. Em contraste, em alguns outros fatores, o vocabulário de atributos pessoais pode ser gerado de forma automatizada, coletando termos e frases que são usados ​​nas reações dos usuários às entidades. Em contraste, ainda em outros aspectos, o vocabulário pode ser gerado por uma combinação de técnicas manuais e automatizadas.

O vocabulário é semeado com um pequeno número de atributos subjetivos que se espera aplicar às entidades. O vocabulário se expande ao longo do tempo à medida que mais termos ou frases que aparecem nas reações do usuário são identificados por meio do processamento automatizado das respostas.

O vocabulário de atributos subjetivos pode ser organizado hierarquicamente, possivelmente com base em “meta-atributos” associados aos atributos pessoais (como o atributo pessoal “engraçado” pode ter um meta-atributo “positivo”, enquanto o ponto subjetivo “nojento” pode ter um meta-atributo “negativo” etc.).

Um conjunto S de entidades (como todas as entidades no armazenamento de entidades, um subconjunto de entidades no armazenamento de entidades etc.) é pré-processado.

Sob um aspecto, o pré-processamento das entidades compreende identificar as reações dos usuários às entidades e, em seguida, treinar um classificador com base nas respostas.

Quando uma entidade é uma entidade física real

Deve-se notar que quando uma entidade é uma entidade física real (como uma pessoa, um restaurante, etc.), o pré-processamento da entidade é realizado por meio de um “proxy cibernético” associado à entidade física (como um página de fãs de um ator em um site de rede social, uma resenha de restaurante em um site etc.); mas, os atributos subjetivos são considerados associados à própria entidade (como o ator ou restaurante, não a página de fãs do ator ou a resenha do restaurante).

Um exemplo de um método para executar get descrito em detalhes.

Na entidade E que não está no conjunto S é recebida (como um videoclipe recém-carregado, uma notícia que ainda não recebeu comentários, uma entidade no armazenamento de entidades que não foi incluída no conjunto de treinamento etc.).

Atributos de assunto e pontuações de relevância para a entidade E são obtidos.

Uma implementação de um primeiro método de exemplo é descrita em detalhes abaixo e o desempenho de um segundo método de exemplo é descrito.

Os atributos subjetivos e as pontuações de relevância obtidos são associados à entidade E (como aplicando tags correspondentes à entidade, adicionando um registro em uma tabela de banco de dados relacional, etc.).

A execução continua de volta.

Deve-se notar que o classificador pode ser retreinado (como após cada 100 iterações do loop, a cada N dias, etc.) por um processo de retreinamento que pode ser executado simultaneamente.

Pré-processamento de um conjunto de entidades

O método é executado por lógica de processamento que pode incluir hardware (circuitos, lógica dedicada, etc.), software (como é executado em um sistema de computador de uso geral ou em uma máquina dedicada) ou ambos.

O método é executado, enquanto em algumas outras implementações podem ser executadas por outra máquina.

O conjunto de treinamento é inicializado para o conjunto vazio. Uma entidade E é selecionada e removida do conjunto S de entidades.

Os atributos subjetivos para a entidade E são identificados com base nas reações do usuário à entidade E (como comentários do usuário, Curtir!, favoritos, compartilhamento, adição a uma lista de reprodução etc.).

A identificação de atributos subjetivos inclui realizar o processamento de comentários de usuários, como:

  • Correspondência de palavras em comentários de usuários com atributos subjetivos no vocabulário
  • Combinando correspondência de palavras e outras técnicas de processamento de linguagem natural, como análise sintática e semântica
  • etc.

Entidades que ocorrem perto de locais

As reações do usuário podem ser agregadas para entidades que ocorrem em muitos locais, como:

  • Entidades que aparecem nas listas de reprodução de muitos usuários
  • Entidades que foram compartilhadas e aparecem em uma pluralidade de “feeds de notícias” de usuários em um site de rede social
  • etc.

Os diferentes locais podem ser ponderados em sua contribuição para as pontuações de relevância com base em vários fatores, como:

O usuário específico associado ao local (como um usuário específico pode ser uma autoridade em música clássica e, portanto, comentários sobre uma entidade em seu feed de notícias podem ter mais peso do que comentários em outro feed de notícias etc.), reações não textuais do usuário (como como “Gostei!”, “Não gostei!”, “+1”, etc.).

Além disso, o número de locais onde a entidade aparece também pode ser usado para determinar atributos subjetivos e pontuações de relevância (como pontuações de relevância para um videoclipe podem ser aumentadas quando o videoclipe está em centenas de listas de reprodução de usuários etc.).

O bloco é executado pelo identificador de atributo subjetivo.

As pontuações de relevância para os atributos subjetivos são determinadas pela entidade E.

Uma pontuação de relevância é determinada para um atributo subjetivo específico com base na frequência com que o atributo pessoal aparece nos comentários do usuário, os usuários específicos que forneceram os detalhes subjetivos em suas palavras (como alguns usuários podem ser conhecidos por experiência como mais precisos em seus comentários do que outros usuários, etc.).

Por exemplo, se houver 40 comentários e “cute” aparecer em 20 palavras e “incrível” aparecer em 8 comentários, então “cute” poderá receber uma pontuação de relevância maior que “incrível”.

As pontuações de relevância podem ser atribuídas com base na proporção de comentários em que um atributo subjetivo aparece (como uma pontuação de 0,5 para “fofo” e uma pontuação de 0,2 para “incrível”, etc.).

Sob um aspecto, as pontuações de relevância são normalizadas para cair em intervalos [0, 1].

Em alguns aspectos, os atributos subjetivos identificados podem ser descartados com base em suas pontuações de relevância (como manter os k atributos emocionais com as pontuações de relevância mais altas, descartar qualquer atributo pessoal cuja pontuação de relevância esteja abaixo de um limite etc.).

identificador de atributos subjetivos

Deve-se notar que um atributo subjetivo pode ser descartado definindo sua pontuação de relevância para zero em alguns aspectos.

Atributos subjetivos e pontuações de relevância estão associados às entidades

Os atributos subjetivos e as pontuações de relevância são associados às entidades (como por meio de marcação, entradas em uma tabela em um banco de dados relacional, etc.).

Um vetor de características para a entidade E é obtido.

Em um aspecto, o vetor de recursos para um clipe de vídeo ou imagem estática pode conter valores numéricos sobre cor, textura, intensidade, etc., enquanto o vetor de recursos para um clipe de áudio (ou um clipe de vídeo com som) pode incluir valores numéricos sobre amplitude , coeficientes espectrais, etc., enquanto o vetor de recursos para um documento de texto pode incluir:

  • Valores numéricos sobre frequências de palavras
  • Comprimento médio da frase
  • Parâmetros de formatação
  • Assim por diante

Isso pode ser executado pelo extrator de recursos.

O vetor de características e as pontuações de relevância obtidas são adicionadas ao conjunto de treinamento.

A bock verifica se o conjunto S de entidades está vazio; se S não for vazio, a execução continua, caso contrário, a execução continua.

O classificador é treinado em todos os exemplos do conjunto de treinamento, de modo que o vetor de recursos de um exemplo de treinamento seja fornecido como entrada para o classificador e as pontuações de relevância de atributos subjetivos sejam fornecidas como saída.

Obtenção de atributos subjetivos e pontuações de relevância para uma entidade

Um vetor de recursos para a entidade E é gerado.

Conforme descrito acima, o vetor de recursos para um clipe de vídeo ou imagem estática pode conter valores numéricos sobre cor, textura, intensidade, etc. Em contraste, o vetor de recursos para um clipe de áudio (ou um clipe de vídeo com som) pode incluir valores numéricos sobre amplitude, coeficientes espectrais, etc. Em contraste, o vetor de características para um documento de texto pode incluir valores numéricos sobre frequências de palavras, comprimento médio de sentença, parâmetros de formatação e assim por diante.

O classificador treinado fornece o vetor de recursos para obter atributos subjetivos previstos e pontuações de relevância para a entidade E.

Os atributos subjetivos previstos e as pontuações de relevância são associados à entidade E (como por meio de tags aplicadas à entidade E, por meio de entradas em uma tabela de um banco de dados relacional, etc.).

Um segundo método para obter atributos subjetivos e pontuações de relevância para uma entidade

O método é executado pela lógica de processamento que pode incluir hardware (circuitos, lógica dedicada, etc.), software ou uma combinação de ambos.

O método é executado pela máquina servidora, enquanto alguns outros podem ser executados por outro dispositivo.

Um vetor de recursos para a entidade E é gerado. O classificador treinado fornece o vetor de recursos para obter atributos subjetivos previstos e pontuações de relevância para a entidade E.

Os atributos subjetivos previstos obtidos são sugeridos a um usuário (como o usuário que carregou a entidade. Um conjunto refinado de atributos pessoais é obtido do usuário, como por meio de uma página da Web na qual o usuário seleciona entre os atributos sugeridos e possivelmente adiciona novos atributos, etc.).

Uma pontuação de relevância padrão para entidades

Uma pontuação de relevância padrão é atribuída a quaisquer novos atributos subjetivos adicionados pelo usuário.

A pontuação de relevância padrão pode ser 1,0 em uma escala de 0,0 a 1,0, a pontuação de relevância padrão pode ser baseada no usuário em particular (como uma pontuação de 1,0 quando o usuário é conhecido pelo histórico como muito bom em sugerir atributos, uma pontuação de 0,8 quando o usuário é conhecido por ser um pouco bom em sugerir atributos, etc.).

As ramificações do bloco são baseadas se o usuário removeu algum dos atributos subjetivos sugeridos (como por não selecionar o atributo).

A entidade E é armazenada como um exemplo negativo do(s) atributo(s) removido(s) para retreinamento futuro do classificador. O conjunto refinado de atributos subjetivos e as pontuações de relevância correspondentes são associados à entidade E (como por meio de tags aplicadas à entidade E, por meio de entradas em uma tabela de um banco de dados relacional, etc.).