”Olen ei häntä”

Kesällä Hoffenheimista lainasopimuksella Osasunaan siirtynyt jalkapalloilija Jukka Raitala (@JukkaRaitala20) lähetti 1. lokakuuta Twitterin kautta arvoituksellisen viestin:

@JukkaRaitala20
” #Raitala Ovat Olosuhteet, Mutta Emme Voi Vaatia Niin Nuori Ja Tulevat Liigan Eri. Rehu Että Veto On Hyvä” Mendi.

Jos hämmennykseltään uskaltautuu selailemaan @JukkaRaitala20:n muita viestejä, huomaa pian, että viesti on käännetty suoraan espanjasta käyttämällä automaattista käännösohjelmaa, ilmeisesti Google Translatea. @JukkaRaitala20 on näet samalla kellonlyömällä lähettänyt edellä lainatusta viestistä myös espanjan– ja englanninkieliset versiot:

Lisäksi osoittautuu, että @JukkaRaitala20 ei olekaan Raitala itse vaan innokas kannattaja, joka raportoi suosikkinsa tekemisistä Twitterissä kolmella kielellä:

@JukkaRaitala20
Ensinnäkin toistan: Minä noudatan kaikkia uutisia olen ei häntä Jukka mutta tämä on Twitter tukea teitä.

@JukkaRaitala20
First of all I repeat: I keep all the news Jukka, but I’m not him. This is a support to him twitter.

@JukkaRaitala20
Antes De Nada Repito: Sigo Toda La Actualidad de Jukka Pero No Soy Él. Esto Es Un Twitter Para Apoyarle.

Tapaus osoittaa ainakin sen, että konekääntäminen on edelleen vaikeaa, etenkin silloin kuin lähtö- ja kohdekieli poikkeavat toisistaan rakenteellisesti. Ainakin suomenkielisten esimerkkien valossa näyttää siltä, että käännökset muodostetaan muuttamalla lähdekielen sanoja kohdekielisiksi yksi kerrallaan ilman, että niiden merkityksiä tai kieliopillisia suhteita analysoidaan kovin pitkälle.

Tämä selittää muun muassa sen, mitä ensimmäisen viestin enigmaattinen ”Rehu Että Veto On Hyvä” -lause tarkoittaa. Espanjankielisessä lähtötekstissä esiintyy sana pienso, joka voi olla joko rehua merkitsevä substantiivi tai verbimuoto, jonka suomenkielinen vastine kuuluu olen sitä mieltä. Näistä jälkimmäinen on tässä yhteydessä luonnollisesti oikea vaihtoehto.

Kun otetaan huomioon, että tässä esimerkissä sana esiintyy että-lauseen edellä, oikean merkityksen tunnistaminen on varsin yksinkertaista myös koneellisesti. Kuitenkin käytetty käännösohjelma on jostain syystä päätynyt väärään merkitykseen ja tämän seurauksena tarjoaa virheellistä käännöstä. Sen sijaan englanninkieliseen versioon on jostain käsittämättömästä syystä päätynyt käännös ”I thing that”, mutta ainakin tässä tapauksessa lähtötekstin sana on ilmeisesti tulkittu oikein.

Käännösvirheistä huolimatta @JukkaRaitala20:n viesteistä välittyy mukavan positiivinen sävy – myös suomeksi:

6 kommenttia

Kategoria(t): Turo Hiltunen

6 responses to “”Olen ei häntä”

  1. Tanja Säily

    Ah, konekäännöksen iloja.🙂 Tällä hetkellä Google Translate tuottaa ko. espanjankielisestä tviitistä seuraavan käännöksen:

    ”# Raitala ovat olosuhteet, mutta emme voi vaatia niin nuori ja tulevat liigan Distinta.Pienso että veto on hyvä” Mendi

    Eli koska pisteen jälkeen puuttuu välilyönti, se ei osaa kääntää sanoja distinta ja pienso. Jos välilyönnin lisää, tulos on tämä:

    ”# Raitala ovat olosuhteet, mutta emme voi vaatia niin nuori ja tulevat eri liigaan. Luulen, että veto on hyvä” Mendi

    Eli ainakin nyt Google osaa kyllä tuon ”luulen, että” -rakenteen. Olisiko espanjalaisystävämme huomannut, että distinta ja pienso ovat jääneet kääntämättä, muttei tajunnut että se johtuu välilyönnin puutteesta, ja yrittänyt kääntää sanat erikseen? Jos Googlelle antaa pelkän pienso-sanan, se kertoo käännöksen olevan rehu, ja distintasta tulee eri.

    Jos hän korjailee käännöksiä näin manuaalisesti, voidaan kai olettaa, että englanninkielisen version ”thing” olisi kopiointivirhe. Eli hän olisi kirjoittanut Google Translaten tuloksen tviittiin itse copy&pasten sijaan, ja olisi typottanut think-sanan. Voin kuvitella, että espanjalaisaksentilla äännettynä ”I think that” kuulostaisi enemmän ”I thing that”iltä, joten virhe olisi ymmärrettävä.

    • Turo Hiltunen

      Hyvin selvitetty! Todennäköisesti käännöslauseet ovat syntyneet juuri näin.

      Tästä huomaa senkin, että vaikka konekäännös olisikin virheellinen, se on sitä ennustettavalla tavalla. Ihmisen tekemiä käännösratkaisuja on puolestaan paljon vaikeampi ennakoida.

      Piste tuntuu muutenkin olevan usein ongelmallinen kieliteknologisissa sovelluksissa, koska on vaikeaa erottaa, milloin se merkitsee lauserajaa ja milloin lyhennettä. Joka tapauksessa on vaikea keksiä oikeita sanoja, jossa esiintyisi piste ilman sitä seuraavaa välilyöntiä. Näin ollen ehkä myös Googe Translaten kaltainen ohjelma voisi ennen kääntämistä lisätä lähtötekstiin välilyönnin pisteen perään, jos se puuttuu. Näin ainakin vältyttäisiin virheiltä, jotka syntyisivät Tanjan rekonstruoimien vaiheiden seurauksena.

      Ei käännös toki vieläkään täydellinen olisi…

  2. Samu Kytölä

    Kiitokset Turolle ja Tanjalle näistä hauskoista huomioista. Tämä Raitala-fanitwitter oli jäänyt vielä minultakin huomaamatta… Olen toki seuraillut jonkin verran Forssellin, Väyrysen ja Sparvin Twittereitä, sekä kulttipelaajamme Shefki Kuqin ”vale-Twitteriä” (itse Shefki ei siis twiittaa, mutta hänen nimellään kulkeva Twitter levittelee vääriä huhuja hänestä),

    Jonkin verran tutkimallani Futisforum2-keskustelupalstalla ”Miklu” Forssell on saanut osuvan liikanimen ”Twiklu”. ”Väykkä” Väyrysestä on tullut ”Twäykkä” – ja viimeisenä Tim Sparvista ”Twim”.

    Tässä vielä linkit heidän monikielisiin tweettailuihinsa:

    http://twitter.com/#!/MikaVayrynen10
    http://twitter.com/#!/MikaelForssell
    http://twitter.com/#!/TimSparv

    (Huomatkaa, kuinka Forssellin ja Väyrysen siirrot Leeds Unitediin ovat vaikuttaneet heidän päivitystahtiinsa. Isoveli valvoo vol. 2011…?)

  3. Samu Kytölä

    …ja tässä kiistelty Shefki-Twitter:
    http://twitter.com/#!/ShefkiKuqi

    Ja poimintana vaikkapa Helsingin Sanomat:
    ”Shefki Kuqi: Väitteet uran lopettamisesta ”täyttä sontaa””
    http://bit.ly/p9lXfE

  4. Turo Hiltunen

    Raitalan fanitwitter vaikuttaa hyväntahtoiselta, enkä usko että se tulee aiheuttamaan pelaajalle samanlaisia ongelmia kuin Shefkin tapauksessa.

    Twitter on muutenkin ollut paljon esillä myös kansainvälisessä jalkapallouutisissa, esimerkkeinä Wayne Rooneyn suorasanaiset viestit tai #tevezexcuses, josta John Lanchester kirjoitti kolumnissaan:

    http://www.lrb.co.uk/v33/n20/john-lanchester/short-cuts

  5. Paluuviite: Englannin kielen kannoilla « Enkkua

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s