OCR-NLP 🐝

Con estas líneas de código es posible encontrar texto en imágenes para poder analizarlo después para obtener datos interesantes acerca del sentimiento y las entidades del documento.

Dado que es un proyecto pensado para un hackathon, se utilizan librerías externas para su fácil implementación, estás librerías son de Google Cloud: Vision API y Natural Language API. En las páginas de dichos productos se podrá encontrar más código y documentación a fondo de las herramientas.

Instalación y uso

Para hacer uso de estos scripts son necesarios unos pasos previos.

Verificar que tengo instalado python en mi computador. Esto lo hacemos abriendo una ventana de terminal y escribiendo python, si muestra un error hay que instalarlo: https://www.python.org/downloads/ 😅.
Una vez que tenemos Python en nuestro computador, tenemos que verificar que tengamos también instalado PIP el cuál es el proveedor de librerías de Python, esto lo hacemos con el comando pip si nos dice que no está instalado o no encuetra el comando es necesario instalarlo con https://pip.pypa.io/en/stable/installing/.
Instalamos un entorno virtual, el cuál funciona como una burbuja en la que nuestras librerías están aisladas y me funcionan para la aplicación que estoy construyendo, sin tener problemas de versiones o algo similar, lo puedo instalar usando algo como pip install virtualenv, aquí más información.
Ahora es necesario crear nuestro entorno virtual e instalar los paquetes necesarios para mi aplicación; tranquile, ya casi acabamos. Esto lo hacemos con los siguientes comandos:
- Creación de entorno virtual: virtualenv venv -p python3 esto generará una carpeta llamada venv con Python 3 instalado.
- Activación del entorno virtual: source venv/bin/activate esto ejecuta un script que activa mi entorno y a partir de aquí, todo lo que instale estará dentro de él, nótese que uso venv el nombre de mi entorno.
- Instalación de los paquetes necesarios: pip install -r requirements.txt este comando usará pip para leer todo lo que esté en el documento requirements.txt y los instalará dentro del entorno
Creación de una cuenta de Google Cloud.
- Google Cloud nos permite crear una cuenta gratuita en su plataforma en: https://cloud.google.com/free/ y además otorgan $300 USD para el uso de sus tecnologías
Autenticar mi cuenta de Google:
- Una vez que cree mi cuenta es necesario realizar la autenticación desde mi computador para poder hacer uso de las herramientas, esto lo hago con una service account. En este manual se explica bastante bien los pasos para crear una, descargar la llave y configurarla, son 3 pasos sencillos https://cloud.google.com/docs/authentication/getting-started.
Al cumplir los 6 pasos anteriores necesito solo un úlitmo paso: correr el comando python ocr-nlp.py esto ejectutará el script de ejemplo que se utilizó, no es necesario para la instalación o el uso de las herramientas, es solo para validar que todo funcionó.

Colaboradores

Rafa Miranda - @rafaelyotu

No dudes en escribirme o buscarme si tienes dudas o si notas algún error en todo esto. Happy Hacking! 🐝

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
img		img
.gitignore		.gitignore
README.md		README.md
ocr-documents.py		ocr-documents.py
ocr-local.py		ocr-local.py
ocr-nlp.py		ocr-nlp.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OCR-NLP 🐝

Instalación y uso

Colaboradores

About

Releases

Packages

Languages

rafaelmv/ocr-nlp

Folders and files

Latest commit

History

Repository files navigation

OCR-NLP 🐝

Instalación y uso

Colaboradores

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages