Corpus: fin_news_2007_300K

Other corpora

2.2.11 Repetitions

Typical repetitions within words

Subword Length 2 - most frequent words
Subword Word Frequency
Ko koko 3243
ko koko 3243
en kymmenen 1177
En kymmenen 1177
Ko kokonaan 612
ko kokonaan 612
Ko Koko 372
ko Koko 372
in Putinin 291
In Putinin 291
Subword Length 2 - Most frequent subwords
Subword Count
ko 272
Ko 272
Is 262
is 262
in 107
In 107
et 78
Et 78
En 56
en 56
Amount of words containing repeated subwords of length 2 - per mille
Per mille
11.6241
Subword Length 3 - most frequent words
Subword Word Frequency
llä illalla 703
llä Illalla 48
maa huomaamaan 20
Maa huomaamaan 20
llä sillalla 20
mää huomaamaan 20
Bar Barbara 19
ssä vessassa 16
kaa pätkääkään 16
tää taataan 15
Subword Length 3 - Most frequent subwords
Subword Count
llä 8
All 5
all 5
ssä 4
kaa 3
hän 2
Hän 2
Han 2
isä 2
Isä 2
Amount of words containing repeated subwords of length 3 - per mille
Per mille
0.4020
Subword Length 4 - most frequent words
Subword Word Frequency
Elle työskennelleelle 10
pari topparipari 7
Pari topparipari 7
Assa pakkassäässä 4
ässä pakkassäässä 4
Subword Length 4 - Most frequent subwords
Subword Count
Elle 1
pari 1
Pari 1
Assa 1
ässä 1
Amount of words containing repeated subwords of length 4 - per mille
Per mille
0.0415
Subword Length 5 - most frequent words
Subword Word Frequency
mistä valmistamista 6
Mistä valmistamista 6
mistä omistamista 5
Mistä omistamista 5
mistä omistamistaan 3
Mistä omistamistaan 3
Subword Length 5 - Most frequent subwords
Subword Count
mistä 3
Mistä 3
Amount of words containing repeated subwords of length 5 - per mille
Per mille
0.0611
Subword Length 6 - most frequent words
Subword Word Frequency
lapsen lapsenlapsensa 4
Lapsen lapsenlapsensa 4
lasten lastenlasten 3
Lasten lastenlasten 3
Subword Length 6 - Most frequent subwords
Subword Count
lapsen 1
Lapsen 1
lasten 1
Lasten 1
Amount of words containing repeated subwords of length 6 - per mille
Per mille
0.0712
Subword Length 2 - most frequent words with hyphen
Subword Word Frequency
Le People-lehdelle 12
Le People-lehden 10
Le People-lehti 6
Sisä-Savon 5
Sisä-Savon 5
sa Sisä-Savon 5
Eurooppa-päivän 4
Ki Loki-Kirjat 3
ko Kesko-konserniin 3
ko OKO-konsernin 3
Subword Length 2 - Most frequent subwords
Subword Count
Le 3
Ko 2
ko 2
Ki 1
1
1
sa 1
1
Amount of words with hyphen containing repeated subwords of length 2 - per mille
Per mille
0.0816
Subword Length 3 - most frequent words with hyphen
Subword Word Frequency
Ali Kemikaali-Alina 3
ali Kemikaali-Alina 3
Subword Length 3 - Most frequent subwords
Subword Count
Ali 1
ali 1
Amount of words with hyphen containing repeated subwords of length 3 - per mille
Per mille
0.0112
Amount of words with hyphen containing repeated subwords of length 4 - per mille
Per mille
0.0000
Subword Length 5 - most frequent words with hyphen
Subword Word Frequency
kunta maakunta-kuntayhtymän 5
Kunta maakunta-kuntayhtymän 5
Subword Length 5 - Most frequent subwords
Subword Count
kunta 1
Kunta 1
Amount of words with hyphen containing repeated subwords of length 5 - per mille
Per mille
0.0204
Amount of words with hyphen containing repeated subwords of length 6 - per mille
Per mille
0.0000
1041629 msec needed at 2018-03-01 08:43