Cómo utilizar la PNL en el marketing de contenidos

Publicado: 2022-05-02

Chris Penn, cofundador de Trust Insights, y el cofundador y director de productos de MarketMuse, Jeff Coyle, analizan el caso comercial de la IA para el marketing. Después del seminario web, Paul participó en una sesión de preguntas en nuestra comunidad de Slack, The Content Strategy Collective (únete aquí). Aquí están las notas del seminario web seguidas de una transcripción del AMA.

El seminario web

El problema

Con la explosión de contenidos tenemos nuevos intermediarios. No son periodistas ni personas influyentes en las redes sociales. Son algoritmos; modelos de aprendizaje automático que dictan todo lo que se interpone entre usted y su audiencia.

Si no tiene en cuenta esto, su contenido seguirá estando sumido en la oscuridad.

La solución: procesamiento del lenguaje natural

NLP es la programación de computadoras para procesar y analizar grandes cantidades de datos de lenguaje natural. Eso proviene de documentos, chatbots, publicaciones en redes sociales, páginas de su sitio web y cualquier otra cosa que sea esencialmente un montón de palabras. La PNL basada en reglas fue lo primero, pero fue reemplazada por el procesamiento estadístico del lenguaje natural.

Cómo funciona la PNL

Las tres tareas principales del procesamiento del lenguaje natural son el reconocimiento, la comprensión y la generación.

Reconocimiento : las computadoras no pueden procesar texto como los humanos. Solo pueden leer números. Entonces, el primer paso es convertir el idioma a un formato que la computadora pueda entender.

Comprensión : representar texto como números permite que los algoritmos realicen análisis estadísticos para determinar qué temas se mencionan juntos con mayor frecuencia.

Generación : después del análisis y la comprensión matemática, el siguiente paso lógico en PNL es la generación de texto. Las máquinas se pueden usar para hacer surgir las preguntas que un escritor necesita responder dentro de su contenido. En otro nivel, la inteligencia artificial puede impulsar resúmenes de contenido que brinden información adicional sobre la creación de contenido de nivel experto.

Estas herramientas están disponibles comercialmente hoy a través de MarketMuse. Más allá de esto, están los modelos de generación de lenguaje natural con los que puede jugar hoy, pero que no se encuentran en una forma comercialmente utilizable. Aunque MarketMuse NLG Technology llegará muy pronto.

Recursos adicionales mencionados

  • Huggingface.co
  • Pitón
  • R
  • colaboración
  • Estudio IBM Watson

la AMA

¿Tiene algún artículo o recomendaciones de sitios web para mantenerse al día con las tendencias de la industria de la IA?

Estar leyendo la investigación académica publicada por ahí. Todos los sitios como estos hacen un gran trabajo al cubrir lo último y lo mejor.

  • KDNuggets.com
  • Hacia la ciencia de datos
  • Kaggle

Eso y los principales centros de publicación de investigación en Facebook, Google, IBM, Microsoft y Amazon. Verá toneladas de excelente material compartido en esos sitios.

“Utilizo un verificador de densidad de palabras clave para todo mi contenido. ¿Qué tan lejos de ser una estrategia razonable está esto hoy para SEO?

La densidad de palabras clave es esencialmente un conteo de frecuencia de términos. Tiene su lugar para comprender la naturaleza muy tosca del texto, pero carece de cualquier tipo de conocimiento semántico. Si no tiene acceso a las herramientas de NLP, al menos mire cosas como "la gente también buscó" contenido en la herramienta de SEO de su elección.

¿Podría dar algunos ejemplos específicos sobre cómo genera contenido en... páginas web? ¿Publicaciones? tuits?

El desafío es que estas herramientas son exactamente eso: son herramientas. Es como, ¿cómo operacionalizas una espátula? Depende de lo que estés cocinando. Puedes usarlo para remover sopa y también para voltear panqueques. La forma de comenzar con algunos de estos conocimientos depende de su nivel de habilidad técnica. Si se siente cómodo con los cuadernos de Python y Jupyter, por ejemplo, puede importar literalmente la biblioteca de transformadores, alimentar su archivo de texto de capacitación y comenzar la generación de inmediato. Hice eso con los tweets de cierto político y comenzó a escupir tweets que comenzarían la Tercera Guerra Mundial. Si no está técnicamente cómodo, entonces comience a buscar herramientas como MarketMuse. Dejaré que Jeff Coyle ofrezca sugerencias sobre cómo comienza el vendedor promedio allí.

Si mira más allá de las herramientas, y se centra más en las estrategias, ¿cuál podría ser un ejemplo de una estrategia que podría implementar para hacer uso de este conocimiento?

Un par de respuestas rápidas son para cosas como meta descripciones, para clasificar páginas o bloques de contenido en una taxonomía, o para tratar de adivinar preguntas que necesitan respuestas, pero esas son realmente soluciones puntuales. La mayor sabiduría estratégica viene cuando usas esto para mostrarte tus fortalezas actuales, tus brechas y dónde tienes impulso. A partir de ahí, tomar decisiones sobre qué crear, actualizar y expandir se vuelve transformador para una empresa. Ahora imagina hacer lo mismo contra un competidor. Encontrar sus lagunas. hacer espuma, enjuagar, repetir.

La estrategia siempre se basa en el objetivo. ¿Qué objetivo estás tratando de lograr? ¿Estás atrayendo tráfico de búsqueda? ¿Estás haciendo generación de leads? ¿Estás haciendo relaciones públicas? La PNL es un montón de herramientas. Es similar a: la estrategia es el menú. ¿Estás sirviendo el desayuno, el almuerzo o la cena? Las herramientas y recetas que utilice dependerán en gran medida del menú que esté sirviendo. Una olla de sopa será profundamente inútil si estás haciendo spanakopita.

¿Cuál es un buen punto de partida para alguien que quiere comenzar a extraer datos para obtener información?

Comienza con el método científico.

  1. ¿Qué pregunta quieres responder?
  2. ¿Qué datos, procesos y herramientas necesita para responder a esa pregunta?
  3. Formule una hipótesis, una sola condición, una declaración demostrablemente verdadera o falsa que pueda probar.
  4. Prueba.
  5. Analice los datos de su prueba.
  6. Refinar o rechazar la hipótesis.

Para los datos en sí, utilice nuestro marco de datos 6C para juzgar la calidad de los datos.

¿Cuáles son, en su opinión, las principales intenciones de búsqueda de los usuarios que los especialistas en marketing deberían tener en cuenta?

Los pasos a lo largo del recorrido del cliente. Mapee la experiencia del cliente de principio a fin: conocimiento, consideración, compromiso, compra, propiedad, lealtad, evangelización. Luego, determine cuáles serán las intenciones probables en cada etapa. Por ejemplo, en el caso de la propiedad, es muy probable que las intenciones de búsqueda estén orientadas al servicio. "Cómo arreglar el ruido crepitante de los airpods pro" es un ejemplo. El desafío es recopilar datos en cada una de las etapas del viaje y usarlos para entrenar/afinar.

¿No crees que esto puede ser un poco volátil? Si necesitamos algo más estable para automatizar el proceso, entonces debemos generalizar las cosas a un nivel superior.

Jeff Bezos dijo la famosa frase: concéntrate en lo que no cambia. El camino general hacia la propiedad no cambia mucho: alguien descontento con su paquete de chicles experimentará cosas similares a las de alguien descontento con el nuevo portaaviones nuclear que encargó. Los detalles cambian, sin duda, pero comprender qué tipos de datos e intenciones es vital para saber dónde se encuentra alguien, emocionalmente, en un viaje, y cómo lo transmiten en el lenguaje.

¿Cuáles son las posibles trampas en las que la gente caerá al intentar clasificar la intención del usuario?

De lejos, sesgo de confirmación. Las personas proyectarán sus propias suposiciones sobre la experiencia del cliente e interpretarán los datos del cliente a través de sus propios sesgos. También sugeriría, en la medida de lo posible, que utilice los datos de interacción (correos electrónicos abiertos, pasos en la puerta, llamadas al centro de llamadas, etc.) lo mejor que pueda para validarlos. Sé que algunos lugares, especialmente las organizaciones más grandes, son grandes fanáticos del modelado de ecuaciones estructuradas para comprender la intención del usuario. No era tan fanático como ellos, pero es un enfoque potencial adicional.

¿Cuáles son las herramientas o productos que cree que hacen un buen trabajo para determinar la intención del usuario de una consulta?

Guau. Además de MarketMuse? Honestamente, tuve que trabajar con mis propias cosas porque no encontré grandes resultados, especialmente con las principales herramientas de SEO. FastText para vectorización y luego agrupamiento no estructurado.

Según su experiencia, ¿cómo cambió BERT la Búsqueda de Google?

La principal contribución de BERT es el contexto, especialmente con los modificadores. BERT le permite a Google ver el orden de las palabras y hacer que interprete el significado. Antes de eso, estas dos consultas podrían ser funcionalmente equivalentes en un modelo de estilo de bolsa de palabras:

  • donde esta la mejor cafeteria
  • ¿Cuál es el mejor lugar para comprar café?

Esas dos consultas, aunque muy similares, podrían tener resultados drásticamente diferentes. Es posible que una cafetería no sea un lugar donde desee comprar granos. Un Walmart DEFINITIVAMENTE no es un lugar donde quieras tomar café.

¿Crees que la IA o las TIC alguna vez desarrollarán conciencia/emociones/empatía como los humanos? ¿Cómo los programaremos? ¿Cómo podemos humanizar la IA?

La respuesta a eso depende de lo que suceda con la computación cuántica. Quantum permite estados difusos variables y computación paralela masiva que imita lo que sucede en nuestros propios cerebros. Su cerebro es un procesador paralelo masivo basado en químicos muy lento. Es realmente bueno para hacer un montón de cosas a la vez, si no rápidamente. Quantum permitiría que las computadoras hicieran lo mismo, pero mucho, mucho más rápido, y eso abre la puerta a la inteligencia artificial general. Aquí está mi preocupación, y esta es una preocupación con la IA hoy en día, ya en un uso limitado: los entrenamos en función de nosotros. La humanidad no ha hecho un gran trabajo al tratarse bien a sí misma o al planeta en el que vivimos. No queremos que nuestras computadoras imiten eso.

Sospecho que, en la medida en que los sistemas lo permitan, las emociones informáticas serán funcionalmente muy diferentes a las nuestras y se autoorganizarán a partir de sus datos, tal como lo hacen las nuestras a partir de nuestras redes neuronales de base química. Eso a su vez significa que pueden sentirse muy diferente a nosotros. Si las máquinas, basadas principalmente en la lógica y los datos, hacen una evaluación sincera y objetiva de la humanidad, pueden determinar que, francamente, somos más problemáticos de lo que valemos. Y no estarían equivocados, francamente. Somos, como especie, un desastre bárbaro la mayor parte del tiempo.

En su opinión, ¿cómo ve a los especialistas en marketing de contenido integrando/adoptando la generación de lenguaje natural en su flujo de trabajo/procesos diarios?

Los especialistas en marketing ya deberían estar integrando alguna forma de esto, incluso si solo se trata de responder preguntas como las que mostramos en el producto de MarketMuse. Responder preguntas que sabes que le importan a la audiencia es una manera rápida y fácil de crear contenido significativo. Mi amigo Marcus Sheridan escribió un gran libro, "Ellos preguntan, tú respondes" que, irónicamente, no necesitas leer para comprender la estrategia central del cliente: responder las preguntas de las personas. Si aún no tiene preguntas enviadas por personas reales, use NLG para hacerlas.

¿Dónde ve el avance de la IA y la PNL en los próximos 2 años?

Si supiera eso, no estaría aquí, porque estaría en la fortaleza de la cima de la montaña que compré con mis ganancias. Pero con toda seriedad, el pivote principal que hemos visto en los últimos 2 años que no muestra signos de cambio es la progresión de los modelos "haz tus propios modelos" a "descargar los modelos preentrenados y ajustarlos". Creo que nos esperan momentos emocionantes en video y audio a medida que las máquinas mejoran en síntesis. La generación de música, en particular, está MADURA para la automatización; ahora mismo, las máquinas generan música completamente mediocre en el mejor de los casos y molestias en los oídos en el peor. Eso está cambiando rápidamente. Veo más ejemplos como la combinación de transformadores y codificadores automáticos como lo hizo BART como próximos pasos importantes en la progresión del modelo y resultados de vanguardia.

¿Hacia dónde cree que se dirige la investigación de Google con respecto a la recuperación de información?

El desafío que sigue enfrentando Google, y lo ves en muchos de sus trabajos de investigación, es la escala. Están especialmente desafiados con cosas como YouTube; el hecho de que todavía dependan en gran medida de los bigramas no es un golpe a su sofisticación, es un reconocimiento de que cualquier cosa más que eso tiene un costo computacional insano. Cualquier avance importante de ellos no será tanto a nivel de modelo como a nivel de escala para hacer frente a la avalancha de contenido nuevo y enriquecido que se vierte en Internet todos los días.

¿Cuáles son algunas de las aplicaciones más interesantes de la IA con las que te has encontrado?

Autónomo todo es un área que observo de cerca. También lo son las falsificaciones profundas. Son ejemplos de lo peligroso que es el camino por delante, si no tenemos cuidado. Específicamente en PNL, la generación avanza rápidamente y es el área a observar.

¿Dónde ha visto que los SEO usan PNL de maneras que no funcionan o no funcionarán?

he perdido la cuenta Muchas veces, son personas que usan una herramienta de una manera que no fue pensada y obtienen resultados deficientes. Como mencionamos en el seminario web, hay tarjetas de puntuación para las diferentes pruebas de vanguardia para modelos, y las personas que usan una herramienta en un área en la que no es fuerte normalmente no disfrutan de los resultados. Dicho esto… la mayoría de los profesionales de SEO no utilizan ningún tipo de PNL aparte de lo que les proporcionan los proveedores, y muchos proveedores todavía están atrapados en 2015. Son todas las listas de palabras clave, todo el tiempo.

¿Dónde ves videos (YouTube) y búsqueda de imágenes en Google? ¿Crees que las tecnologías desplegadas por Google para todo tipo de búsquedas son muy similares o diferentes entre sí?

Todas las tecnologías de Google están construidas sobre su infraestructura y usan su tecnología. Mucho se basa en TensorFlow y por una buena razón: es súper robusto y escalable. Donde las cosas varían es en cómo Google usa las diferentes herramientas. TensorFlow para el reconocimiento de imágenes tiene inherentemente entradas y capas muy diferentes que TensorFlow para la comparación por pares y el procesamiento del lenguaje. Pero si sabe cómo usar TensorFlow y los diversos modelos que existen, puede lograr algunas cosas geniales por su cuenta.

¿De qué manera podemos adaptarnos/mantenernos al día con los avances en IA y PNL?

Sigue leyendo, investigando y probando. No hay sustituto para ensuciarse las manos, al menos un poco. Regístrese para obtener una cuenta gratuita de Google Colab y pruebe cosas. Enséñate un poco de Python. Copie y pegue ejemplos de código de Stack Overflow. No es necesario conocer cada funcionamiento interno de un motor de combustión interna para conducir un automóvil, pero cuando algo sale mal, un poco de conocimiento es muy útil. Lo mismo ocurre con la IA y la PNL: incluso el simple hecho de poder llamar BS a un proveedor es una habilidad valiosa. Es una de las razones por las que disfruto trabajar con la gente de MarketMuse. Realmente saben lo que están haciendo y su trabajo de IA no es BS.

¿Qué le dirías a las personas que están preocupadas de que la IA les quite el trabajo? Por ejemplo, los escritores que ven tecnología como NLG y les preocupa quedarse sin trabajo si la IA puede ser "lo suficientemente buena" para que un editor simplemente limpie un poco el texto.

“La IA reemplazará las tareas, no los trabajos” – Instituto BrookingsY es absolutamente cierto. Pero se perderán empleos netos, porque esto es lo que sucederá. Suponga que su trabajo se compone de 50 tareas. AI hace 30 de ellos. Genial, ahora tienes 20 tareas. Si eres la única persona que hace eso, entonces estás en el nirvana porque tienes 30 unidades de tiempo más para hacer un trabajo más interesante y divertido. Eso es lo que prometen los optimistas de la IA. Verificación de la realidad: si hay 5 personas haciendo esas 50 unidades, y la IA hace 30 de ellas, entonces la IA ahora está haciendo 150/250 unidades de trabajo. Eso significa que quedan 100 unidades de trabajo para que las personas las hagan, y siendo las corporaciones lo que son, eliminarán inmediatamente 3 puestos porque las 100 unidades de trabajo pueden ser realizadas por 2 personas. ¿Debería preocuparle que la IA tome trabajos? Depende del trabajo. Si el trabajo que haces es increíblemente repetitivo, preocúpate absolutamente. En mi antigua agencia, había un tipo pobre cuyo trabajo consistía en copiar y pegar los resultados de búsqueda en una hoja de cálculo para los clientes (trabajé en una empresa de relaciones públicas, no el lugar tecnológicamente más avanzado) 8 horas al día. Ese trabajo está en peligro inmediato y, francamente, debería haberlo estado durante años. Repetición = automatización = IA = pérdida de tareas. Cuanto menos repetitivo sea su trabajo, más seguro estará.

Cada cambio también creó más y más desigualdad de ingresos. Ahora estamos en un punto peligroso donde las máquinas, que no gastan, no son consumidores, están haciendo cada vez más el trabajo de las personas que gastan, que consumen, y vemos esto en el dominio masivo de la riqueza en tecnología. Ese es un problema social que vamos a tener que abordar en algún momento.

Y el desafío con eso es que el progreso es poder. Como escribió Robert Ingersoll (y más tarde se atribuyó erróneamente a Abraham Lincoln): “Casi todos los hombres pueden soportar la adversidad, pero si quieres probar el carácter de un hombre, dale poder”. Vemos cómo la gente de hoy maneja el poder.

¿Cómo puedo vincular los datos de Google Analytics con NLP Research?

GA indica dirección, luego NLP indica creación. ¿Qué es popular? Acabo de hacer esto para un cliente hace un rato. Tienen miles de páginas web y sesiones de chat. Usamos GA para analizar qué categorías crecían más rápido en su sitio y luego usamos NLP para procesar esos registros de chat para mostrarles las tendencias y sobre qué necesitaban crear contenido.

Google Analytics es excelente para decirnos QUÉ sucedió. La PNL puede comenzar a descifrar un poco el POR QUÉ, y luego lo completamos con una investigación de mercado.

Te he visto usar Talkwalker como fuente de datos en muchos de tus estudios. ¿Qué otras fuentes y casos de uso debo considerar para el análisis?

Tantos, tantos. Data.gov. Talkwalker. MercadoMuse. Otter.ai por transcribir tu audio. Núcleos Kaggle. Búsqueda de datos de Google, que por cierto es GOLD y si no lo usa, absolutamente debería hacerlo. Google Noticias y GDELT. Hay tantas fuentes geniales por ahí.

¿Cómo es para usted una colaboración ideal entre el equipo de marketing y el de análisis de datos?

No es broma; Uno de los errores más grandes que Katie Robbert y yo vemos todo el tiempo en los clientes son los silos organizacionales. La mano izquierda no tiene idea de lo que está haciendo la mano derecha, y es un desastre en todas partes. Reunir a las personas, compartir ideas, compartir listas de tareas pendientes, tener standups comunes, enseñarse unos a otros: ser funcionalmente "un equipo, un sueño" es la colaboración ideal, hasta el punto en que ya no necesita usar la palabra colaboración. . Las personas simplemente trabajan juntas y aportan todas sus habilidades a la mesa.

¿Puede revisar el informe MVP que ve con frecuencia en sus presentaciones y cómo funciona?

El informe MVP representa las páginas más valiosas. La forma en que funciona es extrayendo datos de ruta de Google Analytics, secuenciando y luego poniéndolos a través de un modelo de cadena de Markov para determinar qué páginas tienen más probabilidades de ayudar a las conversiones.

Gráfico de barras de las páginas más valiosas en christopherspenn.com

Y si quieres la explicación más larga.

¿Puede dar más información sobre el sesgo de datos? ¿Cuáles son algunas consideraciones al construir modelos NLP o NLG?

Oh sí. Hay mucho que decir aquí. Primero, necesitamos establecer qué es el sesgo, porque hay dos tipos fundamentales.

En general, se acepta que el sesgo humano se define como "Prejuicio a favor o en contra de algo en comparación con otro, generalmente de una manera que se considera injusta".

Luego está el sesgo matemático, que generalmente se acepta que se define como "una estadística está sesgada si se calcula de tal manera que es sistemáticamente diferente del parámetro de población que se estima".

Son diferentes pero relacionados. El sesgo matemático no es necesariamente malo; por ejemplo, usted quiere absolutamente estar sesgado a favor de sus clientes más leales si tiene algún sentido comercial. El sesgo humano es implícitamente malo en el sentido de injusticia, especialmente contra cualquier cosa que se considere una clase protegida: edad, género, orientación sexual, identidad de género, raza/etnicidad, condición de veterano, discapacidad, etc. Estas son clases que NO DEBES discriminar en contra.

El sesgo humano engendra sesgo de datos, generalmente en 6 lugares: personas, estrategia, datos, algoritmos, modelos y acciones. Contratamos personas sesgadas: solo mire la suite ejecutiva o la junta directiva de una empresa para determinar cuál es su sesgo. Vi una agencia de relaciones públicas el otro día promocionando su compromiso con la diversidad y un clic en su equipo ejecutivo y son una sola etnia, los 15.

Podría extenderme MUCHO sobre esto, pero te sugiero que tomes un curso que desarrollé sobre este tema, en el Marketing AI Institute. En cuanto a los modelos NLG y NLP, tenemos que hacer algunas cosas.

Primero, tenemos que validar nuestros datos. ¿Hay un sesgo en ello y, de ser así, es discriminatorio contra una clase protegida? En segundo lugar, si es discriminatorio, ¿es posible mitigarlo o tenemos que desechar los datos?

Una táctica común es convertir los metadatos en desviaciones. Si tiene, por ejemplo, un conjunto de datos que es 60 % masculino y 40 % femenino, recodifique el 10 % de los hombres a mujeres para equilibrarlo para el entrenamiento del modelo. Eso es imperfecto y tiene algunos problemas, pero es mejor que dejar que el sesgo fluya.

Idealmente, construimos interpretabilidad en nuestros modelos que nos permite ejecutar verificaciones durante el proceso, y luego también validamos los resultados (explicabilidad) post hoc. Ambos son necesarios si desea poder pasar una auditoría que certifique que no está creando sesgos en sus modelos. Ay de la empresa que solo tiene explicaciones post hoc.

Y, por último, es absolutamente necesaria la supervisión humana de un equipo diverso e inclusivo para verificar los resultados. Idealmente, utiliza un tercero, pero una parte interna de confianza está bien. ¿El modelo y sus resultados presentan un resultado sesgado de lo que obtendría de la propia población?

Por ejemplo, si estaba creando contenido para jóvenes de 16 a 22 años y no vio ni una sola vez términos como deadass, dank, low-key, etc. en el texto generado, no pudo capturar ningún dato en el lado de entrada. eso entrenaría al modelo para usar su lenguaje con precisión.

El mayor desafío principal aquí es lidiar con todo eso a través de datos no estructurados. Esa es la razón por la cual el linaje es TAN importante. Sin linaje, no puede probar que muestreó la población correctamente. El linaje es su documentación de cuál es la fuente de datos, de dónde proviene, cómo se recopiló, si se le aplican requisitos reglamentarios o divulgaciones.

lo que debes hacer ahora

Cuando esté listo... aquí hay 3 formas en que podemos ayudarlo a publicar mejor contenido, más rápido:

  1. Reserve tiempo con MarketMuse Programe una demostración en vivo con uno de nuestros estrategas para ver cómo MarketMuse puede ayudar a su equipo a alcanzar sus objetivos de contenido.
  2. Si desea aprender cómo crear mejor contenido más rápido, visite nuestro blog. Está lleno de recursos para ayudar a escalar el contenido.
  3. Si conoce a otro profesional del marketing al que le gustaría leer esta página, compártala por correo electrónico, LinkedIn, Twitter o Facebook.