Skip to main content

Ctrl+K

Montreal Forced Aligner

Getting started
User guide
API reference
Changelog
Pretrained MFA models

GitHub
PyPI
PyPI

Getting started
User guide
API reference
Changelog
Pretrained MFA models

GitHub
PyPI
PyPI

Ctrl+K

Section Navigation

Core functionality
Workflows
Managing MFA servers
Helper

MFA API
Tokenizers
Corpus tokenizer

Corpus tokenizer#

`CorpusTokenizer`([tokenizer_model_path])	Top-level worker for generating pronunciations from a corpus and a Pynini tokenizer model
`TokenizerValidator`([utterances_to_tokenize])

Simple tokenizer#

SimpleTokenizer(word_break_markers, ...[, ...])

previous

TokenizerTrainer

next

CorpusTokenizer

On this page

Corpus tokenizer
Simple tokenizer

© Copyright 2018-2024, Montreal Corpus Tools.

Created using Sphinx 7.3.7.

Built with the PyData Sphinx Theme 0.15.2.