JMP facilita el análisis de texto libre, y hace fácil usar código de fuente abierta mediante su integración con Python. Fácil, así como a mí me gusta.
Siendo que también me gusta la comida Mexicana y el programa de YouTube De mi Rancho a Tu Cocina, decidí combinar mi amor por JMP y por la comida Mexicana en este blog. Para personas que no conocen a Doña Angela y su programa “De Mi Rancho a Tu Cocina”, verla cocinar sus sabrosos platos es relajante y reconfortante, como si hubieras viajado en el tiempo a la casa de tu abuelita.
Intentaré mostrar, de forma sencilla, como podrían usar las habilidades analíticas de JMP junto con la integración de Python para analizar datos de texto libre. Este ejemplo se trata de usar la versión de Python que viene instalada con JMP 18 para raspar (o extraer) el texto de los videos de YouTube, y usar el explorador de texto en JMP para analizar los datos. Claro que, en el contexto de resolver problemas con datos, un proceso similar se podría usar para una investigación de consumidores como parte de un estudio de mercadeo, o una investigación competitiva.
Lo más fácil primero: JMP ya viene con una versión de Python instalada, y con solo un clic de un botón se puede abrir una ventanilla para ingresar el código de Python:
Como alguien que no le gusta escribir código, me imaginaba que esto seria algo complejo. Sin embargo, encontré varios sitios con código de Python para raspar el texto de los videos en YouTube, y solo tuve que hacer cambios mínimos. Con el código mostrado abajo que “tomé prestado”, solo tuve que cambiar el ID del video y el idioma.
El script de Python se ejecuta igual que un script de JMP, haciendo clic en el botón verde en la barra de herramientas. Esto hace que Python busque la transcripción de texto de los videos en español. En JMP, los resultados se pueden ver en el registro de comandos, en Ver > Historial.
Aunque hay otras formas mas elegantes (y eficientes) de guardar los resultados, el texto también se puede copiar desde la ventanilla Registro y pegar en un archivo de texto, por ejemplo. Una vez que guardé el texto extraído de varios videos en archivos de texto, usé la opción de JMP que permite importar varios archivos a la vez en Archivo > Importar varios archivos para importarlos a JMP. Después de algo de manipulación, acomodé los datos de forma que el episodio se indica en la primera columna, y el texto correspondiente se encuentra en le segunda columna.
Ahora sí, para la parte más divertida, especifiqué las opciones en Análisis > Explorador de texto, incluso el idioma de presentación. Hace varios años, tome un curso usando Python para el análisis de texto y me es verdaderamente increíble lo fácil que es realizar esas tareas tan tediosas con tanta sencillez en JMP.
Con solo unos pocos clics, es posible convertir las palabras de los videos en YouTube en visualizaciones convincentes, que nos ayudan a extraer significado de las palabras usadas. Por su puesto, hay otras opciones de análisis en el triangulo rojo, como el Análisis de clases latentes, el Análisis discriminante, y mucho más.
Con estos resultados básicos, puedo ver las palabras más usadas en los videos. Las palabras en la nube de palabras se dimensionan de acuerdo con el conteo. Parece que el chile y la cebolla son algunos de los ingredientes secretos de Doña Angela. En la lista de frases, también puedo ver el otro ingrediente secreto; las palabras tan dulces de la Doña Angela, que hacen que muchos de nosotros regresemos a su canal de YouTube una y otra vez.
Si gustas ver más sobre la preparación y análisis de datos de texto, te invitamos a ver este video detallado que incluye un ejemplo que puedes seguir.
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.