Korpus: bul_newscrawl_2017_100K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
та работата 378
Та работата 378
та третата 350
Та третата 350
то мястото 271
То мястото 271
ет детето 187
Ет детето 187
то лятото 134
То лятото 134
Subword Length 2 - Most frequent subwords
Subword Count
та 284
Та 284
Ен 83
ен 83
то 80
То 80
Ит 52
ли 50
Ли 50
Ат 44
Amount of words containing repeated subwords of length 2 - per mille
Per mille
11.8852
Subword Length 3 - most frequent words
Subword Word Frequency
на% наистина 401
на% националния 123
на% национален 110
на% начина 110
на% националната 101
на% Националния 100
на% национална 86
на% Националната 84
на% национално 70
на% националните 67
Subword Length 3 - Most frequent subwords
Subword Count
на% 572
Вар 8
пре 3
Пре 3
Кат 2
Пер 2
бар 2
Бар 2
Бон 2
Бер 2
Amount of words containing repeated subwords of length 3 - per mille
Per mille
7.6372
Subword Length 4 - most frequent words
Subword Word Frequency
хаха Хахахаха 2
Хаха Хахахаха 2
Хаха АХАХАХАХАХ 1
хаха Муахахахаха 1
Хаха Муахахахаха 1
уран УранУран 1
Уран УранУран 1
град АсеновградГрадски 1
Град АсеновградГрадски 1
Аааа Ааааааааааааааааа- 1
Subword Length 4 - Most frequent subwords
Subword Count
хаха 3
Хаха 3
Аааа 1
град 1
Град 1
уран 1
Уран 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.1114
Subword Length 5 - most frequent words
Subword Word Frequency
Ааааа Ааааааааааааааааа- 1
Путин ПутинПутин 1
путин ПутинПутин 1
Subword Length 5 - Most frequent subwords
Subword Count
Ааааа 1
Путин 1
путин 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0687
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
по по-подробно 4
По по-подробно 4
По по-полезни 3
Ку Ку-ку 3
по по-подходящ 3
по по-полезни 3
По по-подходящ 3
Ку Ку-Ку 2
по По-подробна 2
по По-после 2
Subword Length 2 - Most frequent subwords
Subword Count
по 11
По 11
но 2
Но 2
Ку 2
ва 2
То 1
Ла 1
ла 1
ле 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.2522
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
на% най-напред 20
на% най-накрая 16
на% Най-напред 8
на% Най-накрая 6
на% насам-натам 4
на% най-наглите 3
на% нагоре-надолу 2
Бон Бон-Бон 1
Бон Бон-бон 1
био Био-Био 1
Subword Length 3 - Most frequent subwords
Subword Count
на% 11
Бон 2
био 1
Био 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.1767
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
един един-единствен 13
Един един-единствен 13
лека полека-лека 4
Лека полека-лека 4
земя земя-земя 2
Земя земя-земя 2
рано рано-рано 2
Рано рано-рано 2
къде къде-къде 2
Къде къде-къде 2
Subword Length 4 - Most frequent subwords
Subword Count
лека 2
Лека 2
рано 1
Рано 1
един 1
Един 1
земя 1
Земя 1
къде 1
Къде 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.1114
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
много много-много 10
Много много-много 10
север север-североизток 2
Север север-североизток 2
Subword Length 5 - Most frequent subwords
Subword Count
много 1
Много 1
север 1
Север 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0687
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0000
1226232 msec needed at 2018-02-04 20:44