-
Notifications
You must be signed in to change notification settings - Fork 96
Как вручную установить модель преобразования текста в речь
Если автоматическая установка моделей по каким-либо причинам вам не подходит, вы всегда можете скачать и установить их вручную.
-
Переход в нужную директорию:
Перейдите в директорию~/.wunjo
на Unix-подобных системах или%USERPROFILE%/.wunjo
на Windows. Доступ к этой директории можно также получить из приложения, нажав на значок папки в левой части экрана. -
Работа с директорией
rtvc
:
В этой директории хранятся голосовые модели для клонирования голоса и NTLK. Она также содержит файл с ссылками для скачивания определённых моделей. -
Скачивание NTLK punkt:
В директорииnltk_data
, должна быть создана папкаtokenizers
. Вtokenizers
необходимо скачатьhttps://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.zip
и распаковать:
P.S. Обратите внимание, что директория до файлов NTLK punkt: .wunjo/rtvc/nltk_data/tokenizers/punkt/
-
Переход в нужную директорию:
Перейдите в директорию~/.wunjo
на Unix-подобных системах или%USERPROFILE%/.wunjo
на Windows. Доступ к этой директории можно также получить из приложения, нажав на значок папки в левой части экрана. -
Работа с директорией
rtvc
:
В этой директории хранятся голосовые модели для клонирования голоса и NTLK. Она также содержит файл с ссылками для скачивания определённых моделей. -
Скачивание моделей RTVC: Откройте файл
rtvc.json
, внутри вы найдете ссылки на скачивание rtvc моделей. Например:
"en": {
"encoder": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/rtvc/encoder/english_encoder.pt",
"synthesizer": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/rtvc/synthesizer/synthesizer.pt",
"vocoder": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/rtvc/vocoder/english_vocoder.pt"
}
Означает, что вам необходимо создать директорию .wunjo/rtvc/en
и скачать файлы english_encoder.pt, synthesizer.pt и english_vocoder.pt. Далее переименовать english_encoder.pt в encoder.pt, synthesizer.pt должен называться synthesizer.pt, english_vocoder.pt должен называться vocoder.pt. Аналогично для других языков.
-
Переход в нужную директорию:
Перейдите в директорию~/.wunjo
на Unix-подобных системах или%USERPROFILE%/.wunjo
на Windows. Доступ к этой директории можно также получить из приложения, нажав на значок папки в левой части экрана. -
Работа с директорией
voice
:
В этой директории хранятся голосовые модели. Она также содержит файл с ссылками для скачивания определённых моделей. -
Содержание директории:
В каждой поддиректории находятся две модели: Encoder и Vocoder. -
Изучение файла
voice.json
:
Откройте файлvoice.json
и обратите внимание на структуру. В качестве примера рассмотрим голос "Russian man".
Пример конфигурации:
{
"Russian man": {
"avatar_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/avatar/Man.png",
"checkpoint_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/tacotron2/checkpoint_man",
"waveglow_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/waveglows/waveglow.pt",
"voice_control_cfg": {
"psola": {
"max_hz": 2100,
"min_hz": 30,
"analysis_win_ms": 40,
"max_change": 2.955,
"min_change": 0.795
},
"phase": {
"nfft": 256,
"hop": 64
}
},
"user_dict": null,
"text_handler": {
"config": "ru",
"out_max_length": 200
},
"modules": {
"engine": "tacotron2",
"vocoder": "waveglow"
},
"engine": {
"tacotron2": {
"model_path": "voice/man/checkpoint_man",
"hparams_path": null,
"options": {
"steps_per_symbol": 10,
"gate_threshold": 0.5
}
}
},
"vocoder": {
"waveglow": {
"model_path": "voice/man/waveglow_man.pt",
"options": {
"sigma": 0.666,
"strength": 0.1
}
}
}
}
}
-
Ссылки для скачивания моделей:
В конфигурационном файле вы найдёте ссылки для скачивания моделей.- Encoder:
"checkpoint_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/tacotron2/checkpoint_man"
- Vocoder:
"waveglow_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/waveglows/waveglow.pt"
- Encoder:
-
Скачивание и расположение файлов:
Скачайте модели и разместите их в соответствующих директориях. Учтите, что файлы должны быть в исходном формате, не распакованными. Если Windows автоматически преобразует файлы в папки, верните их в исходное состояние (например, архивировав и переименовав расширение).- Для модели
checkpoint_man
, видно по пути, что необходимо создайть поддиректориюman
и поместите туда файл с названиемcheckpoint_man
.
- Для модели
"model_path": "voice/man/checkpoint_man"
- Для модели
waveglow.pt
, видно по пути, что нужно создать поддиректориюman
, но перед размещением переименовать файл вwaveglow_man.pt
.
"model_path": "voice/man/waveglow_man.pt"
Аналогично вы можете работать и с другими голосами. Теперь вы знаете, как вручную установить голосовые модели.
- Home
- English
- How to install the application
- How to change the default directory for the .wunjo folder
- How to add another application language
- Speech documentation
- How manually install model for text to speech
- How to synthesize text to speech
- How to clone a voice
- How to translate speech to text
- Deepfake documentation
- How to manually set models for deepfake animation of the face and lips
- How to animate a face from an image
- How to animate lip movement under audio
- How to face swap target video face on source face from photo
- How to use retouch to improve quality deepfake or remove object
- How to get segmentation mask
- How to use deepfake emotion
- How to use video editor tools
- Diffusion documentation
- How use video to video by text prompt
- How to use the GPU in the application
- File is too big
- Support the Project
- Acknowledgements
- Author
- Русский
- Как установить приложение
- Как изменить директорию по умолчанию для папки .wunjo
- Как добавить другой язык приложения
- Документация по речи
- Как вручную установить модель преобразования текста в речь
- Как синтезировать речь из текста
- Как клонировать голос
- Как перевести речь в текст
- Документация по дипфейкам
- Как вручную установить модели для дипфейка анимации лица и губ
- Как анимировать лицо из изображения
- Как анимировать движение губ под аудио
- Как поменять лицо целевого видео на исходное лицо с фотографии
- Как использовать ретушь для улучшения качества дипфейка или удаления объектов с видео
- Как получить маску объектов
- Как изменить эмоции человека на видео
- Как использовать инструменты видеоредактора
- Документация по diffusion
- Как изменить видео текстовым запросом
- Как использовать GPU в приложении
- Файл слишком большой
- Поддержите проект
- Благодарности
- Автор