Skip to content

Універсальная бібліятэка па працы з тэкстам на беларускай мове для Python

License

Notifications You must be signed in to change notification settings

alex-rusakevich/ramonak

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

57 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Ramonak

CI PyPI - Version PyPI - Python Version

Універсальная бібліятэка па працы з тэкстам на беларускай мове для Python.

Як усталяваць?

Напішыце ў вашым тэрмінале:

pip install ramonak

Або ў Google Colab:

!pip install ramonak

Як карыстацца?

!pip install ramonak -U

import ramonak
from ramonak.tokenizer import word_tokenize
from ramonak.stemmer import FlexionStatStemmer
from ramonak.stopwords import clean_stop_words
from ramonak.punct import remove_punct


text = "Яны iшлi ўдвух выкатанаю нячутна-пругкiмi веласiпедамi сцежкаю ля шэрых нямогла нахiленых да вулiцы платоў...".lower()
tokens = remove_punct(word_tokenize(text))
tokens = clean_stop_words(tokens)

stemmer = FlexionStatStemmer()
print(
      stemmer.stem_words(tokens)
    )

Больш падрабязную дакументацыю вы можаце знайсці на сайце https://alex-rusakevich.github.io/ramonak/.

Дарожная карта

  • Такенізацыя па словам
  • Такенізацыя сказаў
  • Спісак стоп-слоў
  • Просты стэмер, заснаваны на статыстыцы флексій
  • Менеджар пакетаў з дадзенымі
  • Стэмер Портэра
  • Леммацізатар
  • Марфалагічны аналізатар

About

Універсальная бібліятэка па працы з тэкстам на беларускай мове для Python

Topics

Resources

License

Stars

Watchers

Forks

Languages