Si bien se habla de IA desde hace mucho tiempo, a finales de 2022 se produjeron avances que aceleraron el uso de esta tecnología en todos los ámbitos. La aparición de Chat GPT es solo la punta del iceberg de lo que se puede hacer y lo que viene. Santiago Henderson propone revisar las opiniones de los entrevistados en el último Anuario de esta revista y procesarlo con Lenguaje Natural. Los resultados simplemente muestran el potencial de la herramienta y la aplicación a cualquier actividad. Las empresas que no entiendan la trascendencia e impacto de estos cambios, pueden quedar marginadas de sus respectivos mercados en poco tiempo.
Por Santiago Henderson
Economista
El Procesamiento de Lenguaje Natural (NLP, por sus siglas en inglés) es una rama de la Inteligencia Artificial (AI) que se enfoca en la interacción entre las computadoras y el lenguaje humano. Su objetivo es permitir que las máquinas comprendan, interpreten y generen lenguaje natural, como lo hace un ser humano.
Con NLP se pueden crear aplicaciones que permiten a las computadoras procesar texto, audio y voz, y extraer información significativa de ellos. Algunas aplicaciones de NLP incluyen chatbots, traducción automática, análisis de sentimientos y reconocimiento de voz.
A medida que la tecnología avanza, se espera que el procesamiento de lenguaje natural tenga un impacto significativo en la forma en que interactuamos con las computadoras y en cómo las empresas pueden aprovechar la información contenida en grandes cantidades de datos de lenguaje natural.
Mapeo de las palabras que más se mencionaron en el Anuario
La nube de palabras muestra las palabras más comunes en el texto, con el tamaño de la palabra proporcional a su frecuencia de aparición. Puede ser una herramienta útil para identificar los temas principales o las palabras clave en un texto, en una discusión, en una red social o en discursos de una campaña política.
La metodología para crear una nube de palabras conlleva el preprocesamiento del texto para limpiarlo y transformarlo a un formato óptimo para el análisis. ¿Cómo se realiza?
- Se eliminan signos de puntuación, dígitos y caracteres especiales.
- Se convierte todas las palabras a minúsculas para evitar duplicados de palabras con diferente capitalización.
- Se eliminan palabras comunes (stopwords) que no aportan información significativa al análisis, como artículos, pronombres y preposiciones.
- Se realiza la lematización o el stemming de las palabras, para reducirlas a su raíz o forma base, de manera que diferentes formatos de una misma palabra se traten como la misma unidad.
- Se realiza la tokenización del texto, que consiste en separarlo en unidades más pequeñas, como palabras o frases.
Una vez que el texto ha sido preprocesado, se puede generar una nube de palabras utilizando funciones de lenguaje de programación.
Análisis de sentimiento
El análisis de sentimiento es un procesamiento de texto que se realizó sobre las entrevistas. Es una herramienta que se utiliza para analizar el sentimiento de un texto, es decir, determinar si tiene un tono o polaridad positiva, negativa o neutral.
Esta herramienta utiliza un modelo de análisis de sentimiento basado en reglas heurísticas y en un análisis de polaridad de palabras para determinar el sentimiento del texto. El modelo asigna a cada palabra del escrito una polaridad positiva, negativa o neutral, y utiliza una fórmula para calcular la polaridad general del texto a partir de la suma de las polaridades detectadas.
La polaridad negativa, neutral y positiva refieren a la clasificación del texto según la expresión emocional que se transmite. La polaridad negativa se refiere a la presencia de palabras que expresan emociones negativas, como tristeza, ira, miedo, etc. La polaridad positiva se refiere a la presencia de palabras que expresan emociones positivas como felicidad, alegría, amor, optimismo. Y por último, la polaridad neutral se entiende como la ausencia de vocablos que expresen emociones fuertes, es decir, un texto que no transmite una clara polaridad positiva o negativa.
Estas polaridades se miden comúnmente en una escala de -1 a 1, donde -1 representa una polaridad negativa completa, 0 representa una polaridad neutral y 1 representa una polaridad positiva completa. El valor compuesto o sentimiento general (compound), combina las polaridades positiva, negativa y neutral en un solo número que representa la polaridad general del texto. Un valor de compound cercano a -1 indica una polaridad negativa, un valor cercano a 0 indica una polaridad neutra y un valor cercano a 1 indica una polaridad positiva.
En este sentido, se realizó un análisis de sentimiento a las entrevistas realizadas en el Anuario 2022 de x-más, utilizando NLP. Más allá del análisis individual de cada uno de los 60 empresarios entrerrianos entrevistados, los resultados globales obtenidos fueron los siguientes:
El cuadro anterior indica que en general, el sentimiento extraído de las entrevistas es negativo, lo cual puede estar relacionado con las preocupaciones y desafíos que enfrentan las empresas en la actualidad. Sin embargo, es importante tener en cuenta que la polaridad neutra predomina en la mayoría de las entrevistas, lo que sugiere que los empresarios, en general, se expresaron de manera neutral o simplemente describieron situaciones sin emitir una valoración emocional.
En definitiva, el análisis de sentimiento utilizando NLP, es una herramienta útil para comprender el lenguaje humano, lo cual permite obtener información valiosa para mejorar el análisis y tomar mejores decisiones en base a datos. También sirve para entender el estado de la situación y los sentimientos de un sector. Es un dato muy valioso para comparar año a año, como también para detectar que grupos de empresas están atravesando momentos delicados.