Korpus: bul_wikipedia_2007_100K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
То мястото 195
то мястото 195
То лятото 194
то лятото 194
Яв появява 170
Яв обявява 161
ва основава 124
Ен военен 120
та работата 117
Та работата 117
Subword Length 2 - Most frequent subwords
Subword Count
та 247
Та 247
Ен 104
То 73
то 73
ит 58
Ат 51
ат 51
ва 44
Яв 37
Amount of words containing repeated subwords of length 2 - per mille
Per mille
11.9182
Subword Length 3 - most frequent words
Subword Word Frequency
Бар Барбара 19
бар Барбара 19
вар Варвара 12
Вар Варвара 12
син Синсинати 8
Син Синсинати 8
Нит електромагнитните 7
кит китките 6
Кит китките 6
Бер берберски 5
Subword Length 3 - Most frequent subwords
Subword Count
Бер 8
вар 7
Вар 7
Бар 3
бар 3
Нит 3
bar 2
Bar 2
Кро 2
Mar 2
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.5010
Subword Length 4 - most frequent words
Subword Word Frequency
скит скитските 2
Коло Колоколо 1
елит Повелителите 1
елит Разделителите 1
Елит Повелителите 1
Елит Разделителите 1
Subword Length 4 - Most frequent subwords
Subword Count
елит 2
Елит 2
скит 1
Коло 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0824
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
по по-популярен 5
По по-популярен 5
по по-подробно 2
по по-подходящи 2
по по-полезна 2
по по-популярни 2
по по-популярно 2
По по-подробно 2
По по-подходящи 2
По по-полезна 2
Subword Length 2 - Most frequent subwords
Subword Count
по 9
По 9
юг 1
Юг 1
Fe 1
fe 1
Ра 1
Ро 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1376
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0000
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
един един-единствен 4
Един един-единствен 4
Джун Джун-джун 1
Реко Реко-реко 1
Subword Length 4 - Most frequent subwords
Subword Count
един 1
Един 1
Джун 1
Реко 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0618
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
север север-североизток 2
Север север-североизток 2
Subword Length 5 - Most frequent subwords
Subword Count
север 1
Север 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0416
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0000
2558687 msec needed at 2017-11-30 08:19