Corpus: ron_wikipedia_2018_300K

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
At atât 2392
at atât 2392
lu secolului 1736
Lu secolului 1736
Ta tatăl 1052
ta tatăl 1052
At jumătate 944
at jumătate 944
ut putut 881
Se fusese 812
Subword Length 2 - Most frequent subwords
Subword Count
ta 295
Ta 295
le 211
Le 211
lu 196
Lu 196
at 188
At 188
ți 122
ti 122
Amount of words containing repeated subwords of length 2 - per mille
Per mille
18.7845
Subword Length 3 - most frequent words
Subword Word Frequency
uni Uniunii 612
Uni Uniunii 612
rea crearea 425
Rea crearea 425
est povestește 101
Est povestește 101
bar Barbara 62
Bar Barbara 62
Ass Assassin's 54
car încărcare 42
Subword Length 3 - Most frequent subwords
Subword Count
uni 10
Uni 10
bar 10
Bar 10
car 9
Car 9
pur 7
Pur 7
est 4
Est 4
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.9274
Subword Length 4 - most frequent words
Subword Word Frequency
Make Makemake 3
Subword Length 4 - Most frequent subwords
Subword Count
Make 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0196
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0000
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0000
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
și și-și 24
si și-și 24
Și și-și 24
şi și-și 24
Si și-și 24
ṣi și-și 24
șî și-și 24
șI și-și 24
îi II-III 7
Îi II-III 7
Subword Length 2 - Most frequent subwords
Subword Count
și 1
Ii 1
si 1
er 1
Și 1
ro 1
şi 1
Xi 1
Si 1
xi 1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.0632
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
est vest-est 7
aer aer-aer 7
Est vest-est 7
Aer aer-aer 7
alb alb-albastru 5
Alb alb-albastru 5
Bon Bon-Bon 5
bon Bon-Bon 5
vii VII-VIII 4
Vii VII-VIII 4
Subword Length 3 - Most frequent subwords
Subword Count
aer 1
day 1
Aer 1
est 1
Est 1
Bon 1
bon 1
alb 1
Alb 1
vii 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0773
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0000
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
încet încet-încet 7
Încet încet-încet 7
încet Încet-încet 4
Încet Încet-încet 4
Baden Baden-Baden 3
Subword Length 5 - Most frequent subwords
Subword Count
încet 2
Încet 2
Baden 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.1248
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0000
1015928 msec needed at 2024-04-20 13:25