Corpus: rus-lt_web_2016

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
го другого 482
те университете 417
Те университете 417
Ин Друскининкай 316
Ин Калининградской 286
Ма мама 285
ма мама 285
Ќа какая 251
ка какая 251
in отъездаŠeimininko 175
Subword Length 2 - Most frequent subwords
Subword Count
Ин 53
ли 45
Ли 45
Та 41
та 41
по 31
По 31
ок 25
Ок 25
те 16
Amount of words containing repeated subwords of length 2 - per mille
Per mille
4.9091
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественно 134
ест Естественно 87
ест естественный 55
ест естественным 44
ест естественных 40
ест естественной 38
ест естественного 28
ест естественное 28
ест естественные 24
ест естественную 19
Subword Length 3 - Most frequent subwords
Subword Count
ест 17
can 2
пос 2
бар 1
Бар 1
раз 1
Раз 1
пра 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.2885
Subword Length 4 - most frequent words
Subword Word Frequency
мака «Макамака» 5
Subword Length 4 - Most frequent subwords
Subword Count
мака 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0168
Subword Length 5 - most frequent words
Subword Word Frequency
Balta Baltabalta 4
Subword Length 5 - Most frequent subwords
Subword Count
Balta 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0295
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 864
То что-то 864
то кто-то 483
То кто-то 483
то Кто-то 111
То Кто-то 111
то Что-то 60
То Что-то 60
би Би-би-си 21
по по-польски 11
Subword Length 2 - Most frequent subwords
Subword Count
то 5
То 5
ро 3
по 2
По 2
Да 2
да 2
би 1
Ма 1
ма 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.1560
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вот вот-вот 30
Вот вот-вот 30
еле еле-еле 5
Еле еле-еле 5
Subword Length 3 - Most frequent subwords
Subword Count
вот 1
Вот 1
еле 1
Еле 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0240
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 45
Чуть чуть-чуть 45
друг друг-друга 6
Друг друг-друга 6
Subword Length 4 - Most frequent subwords
Subword Count
чуть 1
Чуть 1
друг 1
Друг 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0336
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
очень очень-очень 6
Очень очень-очень 6
много много-много 5
Много много-много 5
Subword Length 5 - Most frequent subwords
Subword Count
очень 1
Очень 1
много 1
Много 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0590
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
только только-только 10
Только только-только 10
далеко Далеко-далеко 9
Далеко Далеко-далеко 9
Subword Length 6 - Most frequent subwords
Subword Count
только 1
Только 1
далеко 1
Далеко 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.1277
1972189 msec needed at 2018-06-08 18:53