TokenizerValidator#

class montreal_forced_aligner.tokenization.tokenizer.TokenizerValidator(utterances_to_tokenize=None, **kwargs)[source]#

compute_validation_errors(gold_values, hypothesis_values)[source]#

Computes validation errors

Parameters:

gold_values (dict[str, set[str]]) – Gold pronunciations
hypothesis_values (dict[str, list[str]]) – Hypothesis pronunciations

tokenize_utterances()[source]#

Tokenize utterances