Project that captures information about all Dark Souls 3 (DS3) weapons and performs textual analysis on.
Project of the discipline Projeto Integrador IV
of the 4º semester of the course of Technology in Big Data for Business
at FATEC Ipiranga
. Supervised by Marco Mazzei
.
O projeto tem como objetivo capturar informações da wiki de Dark Souls 3 referente as armas encontradas no jogo e realizar uma análise sobre o texto encontrado.
Dentro do projeto foi aplicado a técnica de Topic Modelling
A modelagem de tópicos é o processo de extrair os principais temas de um determinado corpus de dados de texto.
Wikipedia: No aprendizado de máquina e no processamento de linguagem natural, um modelo de tópico é um tipo de modelo estatístico para descobrir os "tópicos" abstratos que ocorrem em uma coleção de documentos.
For the use of the project, some prerequisites will be necessary.
- Python
- You can download here: Python
- Here is a step-by-step installation tutorial. (Tutorial)
- Tutorial with Miniconda. (Tutorial)
- Poetry
- You can install here: Poetry
- Apache Spark
- Follow the step by step: Spark
-
Clone this repo.
git clone https://github.com/Arekushi/ds3-scraping-text-analysis.git
-
Install packages with
Poetry
poetry install
-
Download the
FAT JAR
fromSpark NLP
and put it wherever you want- You can find here: https://github.com/JohnSnowLabs/spark-nlp/releases
-
Go to
./src/config/settings.toml
and editspark_nlp_jar_path
value to your path.spark_nlp_jar_path = 'C:\\spark\\jars\\spark-nlp-assembly-4.2.4.jar'
-
Execute:
python ./main.py
-
Done, the whole process has been completed 🎉
- You can see the results inside the
./src/data
folder
- You can see the results inside the
Will be added soon...
Will be added soon...
Here in this link you can see all the material I used to build the project. 😉
Alexandre Ferreira de Lima |
---|