Corpus: ukr_wikipedia_2016_100K

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
ту інституту 238
Ту інституту 238
Го другого 187
го другого 187
ту Інституту 86
Ту Інституту 86
до додому 83
До додому 83
та результатами 77
Та результатами 77
Subword Length 2 - Most frequent subwords
Subword Count
ти 43
Ти 43
ли 39
та 36
Та 36
по 17
По 17
от 16
От 16
ом 15
Amount of words containing repeated subwords of length 2 - per mille
Per mille
3.8762
Subword Length 3 - most frequent words
Subword Word Frequency
від відвідувачів 36
Від відвідувачів 36
від відвідав 32
Від відвідав 32
від відвідування 27
Від відвідування 27
від відвідувати 19
від відвідують 19
Від відвідувати 19
Від відвідують 19
Subword Length 3 - Most frequent subwords
Subword Count
від 31
Від 31
бар 5
Бар 5
тон 2
Тон 2
Ана 1
Кан 1
ст. 1
Ст. 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.5665
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
Бі Бі-Бі-Сі 3
Ан Сан-Андреаса 3
Ан Сан-Антоніо 3
Ле Віолле-ле-Дюк 2
ле Віолле-ле-Дюк 2
от от-от 2
От от-от 2
an Jean-Antoine 1
Da In-A-Gadda-Da-Leela 1
da In-A-Gadda-Da-Leela 1
Subword Length 2 - Most frequent subwords
Subword Count
Ан 2
an 1
An 1
Бі 1
Ле 1
ле 1
от 1
От 1
Da 1
da 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.0737
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
ось ось-ось 4
Ось ось-ось 4
пом єпископом-помічником 3
Subword Length 3 - Most frequent subwords
Subword Count
ось 1
Ось 1
пом 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0257
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0000
2090558 msec needed at 2018-01-26 10:42