Con estas líneas de código es posible encontrar texto en imágenes para poder analizarlo después para obtener datos interesantes acerca del sentimiento y las entidades del documento.
Dado que es un proyecto pensado para un hackathon, se utilizan librerías externas para su fácil implementación, estás librerías son de Google Cloud: Vision API y Natural Language API. En las páginas de dichos productos se podrá encontrar más código y documentación a fondo de las herramientas.
Para hacer uso de estos scripts son necesarios unos pasos previos.
-
Verificar que tengo instalado python en mi computador. Esto lo hacemos abriendo una ventana de terminal y escribiendo
python
, si muestra un error hay que instalarlo: https://www.python.org/downloads/ 😅. -
Una vez que tenemos Python en nuestro computador, tenemos que verificar que tengamos también instalado PIP el cuál es el proveedor de librerías de Python, esto lo hacemos con el comando
pip
si nos dice que no está instalado o no encuetra el comando es necesario instalarlo con https://pip.pypa.io/en/stable/installing/. -
Instalamos un entorno virtual, el cuál funciona como una burbuja en la que nuestras librerías están aisladas y me funcionan para la aplicación que estoy construyendo, sin tener problemas de versiones o algo similar, lo puedo instalar usando algo como
pip install virtualenv
, aquí más información. -
Ahora es necesario crear nuestro entorno virtual e instalar los paquetes necesarios para mi aplicación; tranquile, ya casi acabamos. Esto lo hacemos con los siguientes comandos:
- Creación de entorno virtual:
virtualenv venv -p python3
esto generará una carpeta llamadavenv
con Python 3 instalado. - Activación del entorno virtual:
source venv/bin/activate
esto ejecuta un script que activa mi entorno y a partir de aquí, todo lo que instale estará dentro de él, nótese que usovenv
el nombre de mi entorno. - Instalación de los paquetes necesarios:
pip install -r requirements.txt
este comando usará pip para leer todo lo que esté en el documentorequirements.txt
y los instalará dentro del entorno
- Creación de entorno virtual:
-
Creación de una cuenta de Google Cloud.
- Google Cloud nos permite crear una cuenta gratuita en su plataforma en: https://cloud.google.com/free/ y además otorgan $300 USD para el uso de sus tecnologías
-
Autenticar mi cuenta de Google:
- Una vez que cree mi cuenta es necesario realizar la autenticación desde mi computador para poder hacer uso de las herramientas, esto lo hago con una service account. En este manual se explica bastante bien los pasos para crear una, descargar la llave y configurarla, son 3 pasos sencillos https://cloud.google.com/docs/authentication/getting-started.
-
Al cumplir los 6 pasos anteriores necesito solo un úlitmo paso: correr el comando
python ocr-nlp.py
esto ejectutará el script de ejemplo que se utilizó, no es necesario para la instalación o el uso de las herramientas, es solo para validar que todo funcionó.
No dudes en escribirme o buscarme si tienes dudas o si notas algún error en todo esto. Happy Hacking! 🐝