Kypäröiden … äh … kypärien. Radiohaastateltavan itsekorjaus kiinnitti huomiota. Vastaavia tapauksia riittää. Kumpi olisi omena-sanan luontevampi monikon genetiivi, omenien vai omenoiden? Vai omenoitten tai peräti omenain? Itse käytän ainakin kahta ensimmäistä ‒ niin kuin varmaan myös muotoja kypäröiden ja kypärien. En vain tiedä tarkalleen missä yhteydessä valitsen niistä jomman kumman.
Kieli sallii vaihtelun. Vaihtelusta kiinnostunut pääsee lähituntumaan jo selaamalla nettiä. Kypärien johtaa googlessa 43.500 hitillä kypäröiden 13.700 osumaa vastaan. Omenat taas menevät päinvastoin: omenien 50.800 tapausta jää vähemmistöön omenoiden 141.000 esiintymään verrattuna. Netti ei vain aina ole kovin luotettava tiedonlähde: omenien näyttää olevan myös varsin aktiivinen YouTube-tykkääjä.
Kielen opiskelijan ja tutkijan avuksi tulevat digitaaliset tekstikokoelmat eli korpukset. Osa niistä on kooltaan pieniä, osa suuria, mutta yhteistä niille on, että ne ovat strukturoituja, pienet yleensä tarkemmin, isommat suuren työmäärän tähden väljemmin. Miljoonan sanan korpus edusti ylärajaa vielä neljäkymmentä vuotta sitten, kun nykyään sadan miljoonan kokoluokkakaan ei enää hätkähdytä.
Englannin tutkijana on huomannut, että korpuksetkin vanhenevat: kymmeniä vuosia sitten koottu aineistokokonaisuus ei enää edusta nykykieltä. 1990-luvun puolivälissä julkaistu 100 miljoonan sanan British National Corpus toki tuntee esimerkiksi sanan internet (94 esiintymää). Näin siitä kirjoitetaan:
Members of the Computing Sub-Group have been in discussion with a number of specialists, to establish the desirability and practicality of connecting to the Internet […] Several members of the Group are convinced that connection is essential to facilitate the development of our scientific and information systems over the next ten years. It may be regarded as an infrastructure element for the movement of information, in the same way as roads and railways control and permit the movement of people and goods. (Royal Botanic Garden Edinburgh: miscellaneous documents)
Oikein ennustettu. Uudemmassa ja neljä kertaa suuremmassa nykyamerikanenglannin korpuksessa (Corpus of Contemporary American English) internetin esiintymiä on jo peräti 37.535. Tämä korpus kattaa vuodet 1990‒2012 ja kasvaa jatkuvasti. Sen avulla voi seurata sanojen ja rakenteiden viimeaikaista kehitystä. Alla pylväsdiagrammi internet-sanan esiintymistä viimeisen parin vuosikymmenen aikana.
Kuten kuva kertoo, internet-sanan huipputaajuudet ajoittuvat 2000-luvun alkuun. Sen jälkeen suunta on ollut tasaisen laskeva. Kun netin käyttö ei suinkaan osoita taantumisen merkkejä, mietittäväksi jää, mitä muita ilmauksia ihmiset nykyään käyttävät. Vai onko netti jo siinä määrin arkipäiväistynyt, että siitä riittää vähemmän puhetta?