Korpus: bul_wikipedia_2018_300K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
то мястото 896
То мястото 896
то лятото 783
То лятото 783
та работата 684
Та работата 684
ва основава 629
ен военен 525
Ен военен 525
па папа 273
Subword Length 2 - Most frequent subwords
Subword Count
та 268
Та 268
Ен 122
ен 122
то 77
То 77
ит 58
ва 55
Ат 52
ли 33
Amount of words containing repeated subwords of length 2 - per mille
Per mille
11.6311
Subword Length 3 - most frequent words
Subword Word Frequency
бар Барбара 81
Бар Барбара 81
вар Варвара 30
Вар Варвара 30
бар Барбароса 27
Бар Барбароса 27
вар варварите 21
Вар варварите 21
Бон бонбони 19
син Синсинати 16
Subword Length 3 - Most frequent subwords
Subword Count
вар 9
Вар 9
бар 6
Бар 6
Тен 5
тен 5
Бер 5
Бон 2
Нат 2
Джо 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.4783
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
по по-популярни 12
По по-популярни 12
юг юг-югозапад 12
Юг юг-югозапад 12
по по-популярна 10
По по-популярна 10
по по-подходящ 9
по по-популярен 9
По по-подходящ 9
По по-популярен 9
Subword Length 2 - Most frequent subwords
Subword Count
по 12
По 12
ку 2
Ку 2
юг 1
Юг 1
Ай 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1690
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0000
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
един един-единствен 18
Един един-единствен 18
Subword Length 4 - Most frequent subwords
Subword Count
един 1
Един 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0182
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
Баден Баден-Баден 9
север север-северозапад 6
Север север-северозапад 6
север север-североизток 5
Север север-североизток 5
едвам едвам-едвам 3
Subword Length 5 - Most frequent subwords
Subword Count
север 2
Север 2
Баден 1
едвам 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.1321
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
въздух въздух-въздух 5
Subword Length 6 - Most frequent subwords
Subword Count
въздух 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0729
1293316 msec needed at 2024-01-30 02:29