Corpus: bak_wikipedia_2014

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
ла ҡалала 320
Ла ҡалала 320
Ал ҡалала 320
ал ҡалала 320
ла балалар 212
Ла балалар 212
Ал балалар 212
ал балалар 212
Ам тамамлай 164
ны районының 153
Subword Length 2 - Most frequent subwords
Subword Count
ан 188
ла 183
Ла 183
ал 117
Ал 117
То 90
лы 84
лә 76
Лә 76
Ам 64
Amount of words containing repeated subwords of length 2 - per mille
Per mille
15.1872
Subword Length 3 - most frequent words
Subword Word Frequency
%ын урынына 138
%ын урынында 53
%ын урынын 36
%ты ултыртып 22
тан тантанаһы 20
Тан тантанаһы 20
%ты ултыртыу 18
ант Антанта 18
Ант Антанта 18
%ты ултыртылған 13
Subword Length 3 - Most frequent subwords
Subword Count
%ын 147
%ты 53
тан 16
Тан 16
Зәм 6
зәм 6
Тар 3
бал 3
ант 3
Бал 3
Amount of words containing repeated subwords of length 3 - per mille
Per mille
3.2657
Subword Length 4 - most frequent words
Subword Word Frequency
алла Саллааллаһу 1
Алла Саллааллаһу 1
Subword Length 4 - Most frequent subwords
Subword Count
алла 1
Алла 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0189
Subword Length 5 - most frequent words
Subword Word Frequency
солоҡ Солоҡсолоҡ 3
солоҡ солоҡсолоҡ 3
Солоҡ Солоҡсолоҡ 3
Солоҡ солоҡсолоҡ 3
thumb thumbthumb 1
тында институтындатында 1
Subword Length 5 - Most frequent subwords
Subword Count
солоҡ 2
Солоҡ 2
thumb 1
тында 1
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.1406
Subword Length 6 - most frequent words
Subword Word Frequency
Гитлер ГитлерГитлерҙан 1
Subword Length 6 - Most frequent subwords
Subword Count
Гитлер 1
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0794
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
үҙ үҙ-үҙен 7
Үҙ үҙ-үҙен 7
үҙ үҙ-үҙҙәрен 4
Үҙ үҙ-үҙҙәрен 4
үҙ үҙ-үҙенә 3
Үҙ үҙ-үҙенә 3
ал Урал-Алтай 3
Ал Урал-Алтай 3
Ва «ва-ва-ва» 2
үҙ Үҙ-үҙҙәрендәге 2
Subword Length 2 - Most frequent subwords
Subword Count
үҙ 5
Үҙ 5
та 2
Ун 1
ке 1
То 1
Ли 1
аҡ 1
тк 1
Аҡ 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.2399
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
бер бер-береһенә 41
Бер бер-береһенә 41
бер бер-бер 23
Бер бер-бер 23
бер бер-береһе 22
Бер бер-береһе 22
буй буй-буй 21
Буй буй-буй 21
бер бер-береһен 18
Бер бер-береһен 18
Subword Length 3 - Most frequent subwords
Subword Count
бер 20
Бер 20
%ын 6
Зәм 6
зәм 6
баш 5
Баш 5
%ты 2
Тет 1
Бах 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.7399
Subword Length 4 - most frequent words with hyphen
Subword Word Frequency
элек элек-электән 8
Элек элек-электән 8
өҙөк өҙөк-өҙөк 4
оҙон оҙон-оҙон 3
Оҙон оҙон-оҙон 3
элек Элек-электән 2
Элек Элек-электән 2
ҡаға ҡаға-ҡаға 2
өйөр өйөр-өйөр 2
Өйөр өйөр-өйөр 2
Subword Length 4 - Most frequent subwords
Subword Count
ейән 4
элек 2
алыҫ 2
Элек 2
Алыҫ 2
бара 2
Бына 1
киле 1
илай 1
көлә 1
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.4529
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
борон борон-борондан 13
Борон борон-борондан 13
төрлө төрлө-төрлө 5
Төрлө төрлө-төрлө 5
борон Борон-борондан 4
Борон Борон-борондан 4
ваҡыт ваҡыт-ваҡыт 3
урыны урыны-урыны 3
ҡабат ҡабат-ҡабат 3
Ваҡыт ваҡыт-ваҡыт 3
Subword Length 5 - Most frequent subwords
Subword Count
борон 4
Борон 4
ваҡыт 2
Ваҡыт 2
быуын 2
Быуын 2
Йомаҡ 1
Тиҫтә 1
Көтөү 1
йомаҡ 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.8785
Subword Length 6 - most frequent words with hyphen
Subword Word Frequency
ваҡыты Ваҡыты-ваҡыты 2
ваҡыты ваҡыты-ваҡыты 2
төркөм төркөм-төркөм 2
Төркөм төркөм-төркөм 2
шундай «Шундай-шундай 1
Шундай «Шундай-шундай 1
айырым айырым-айырым 1
Айырым айырым-айырым 1
көйләй көйләй-көйләй 1
бүлкәт бүлкәт-бүлкәт 1
Subword Length 6 - Most frequent subwords
Subword Count
ваҡыты 2
көйләй 1
көрәшә 1
төркөм 1
Төркөм 1
шундай 1
Шундай 1
айырым 1
Айырым 1
батыра 1
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.7937
2313842 msec needed at 2017-11-27 15:38