Korpus: rus-ge_web_2017_100K

Weitere Korpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
Го другого 134
ка какая 87
Ќа какая 87
Ди Зугдиди 74
Ла сделала 69
Ма мама 56
мА мама 56
Ги Гиги 55
Ко Кокойты 55
ко Кокойты 55
Subword Length 2 - Most frequent subwords
Subword Count
Та 32
ли 32
Ли 32
та 32
Го 26
Ро 22
ок 21
чё 17
че 17
Че 17
Amount of words containing repeated subwords of length 2 - per mille
Per mille
4.3969
Subword Length 3 - most frequent words
Subword Word Frequency
ест естественно 96
ест Естественно 73
ест естественным 24
ест естественной 14
ест естественный 11
ест «Естественно 9
так Тактакишвили 8
Так Тактакишвили 8
ест естественное 8
ест естественные 8
Subword Length 3 - Most frequent subwords
Subword Count
ест 20
бар 3
Бар 3
пос 2
Ани 1
так 1
ани 1
Так 1
они 1
раз 1
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.4024
Subword Length 4 - most frequent words
Subword Word Frequency
все- Все-все-все 1
Subword Length 4 - Most frequent subwords
Subword Count
все- 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0182
Subword Length 5 - most frequent words
Subword Word Frequency
аудит АудитАудиторское 10
Аудит АудитАудиторское 10
Subword Length 5 - Most frequent subwords
Subword Count
аудит 1
Аудит 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0326
Subword Length 6 - most frequent words
Subword Word Frequency
письмо письмоПисьмо 24
Письмо письмоПисьмо 24
Subword Length 6 - Most frequent subwords
Subword Count
письмо 1
Письмо 1
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0714
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
то что-то 357
То что-то 357
то кто-то 182
То кто-то 182
то Кто-то 37
То Кто-то 37
то Что-то 25
То Что-то 25
би Би-би-си 18
то то-то 4
Subword Length 2 - Most frequent subwords
Subword Count
то 9
То 9
би 3
Да 2
да 2
Re 1
Ла 1
Ой 1
ка 1
ой 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.2414
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
вот вот-вот 7
Вот вот-вот 7
еле еле-еле 2
Еле еле-еле 2
нет нет-нет 2
Нет нет-нет 2
так «Так-так 1
Так «Так-так 1
все Все-все-все 1
Все Все-все-все 1
Subword Length 3 - Most frequent subwords
Subword Count
вот 3
Вот 3
Всё 1
еле 1
Еле 1
нет 1
Нет 1
так 1
Так 1
все 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0880
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
чуть чуть-чуть 18
Чуть чуть-чуть 18
друг друг-другу 4
Друг друг-другу 4
друг друг-друга 3
Друг друг-друга 3
Бора Бора-Бора 1
Арма Арма-Армази 1
Subword Length 4 - Most frequent subwords
Subword Count
друг 2
Друг 2
чуть 1
Чуть 1
Арма 1
Бора 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0912
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
много много-много 6
Много много-много 6
очень очень-очень 2
Очень очень-очень 2
самых самых-самых 2
Баден Баден-Бадена 1
Subword Length 5 - Most frequent subwords
Subword Count
много 1
Много 1
очень 1
Очень 1
самых 1
Баден 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.1304
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
только только-только 4
Только только-только 4
Subword Length 6 - Most frequent subwords
Subword Count
только 1
Только 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0714
1911386 msec needed at 2018-06-07 17:09