søndag den 23. september 2012

Overvejelser over Google translate og andet maskineri. 1. overvejelse:

Overvejelser over Google translate og andet maskineri. 1. overvejelse, nærmest kapiteloverskrifter i første omgang:

Oversættelsesmaskiner. Hvilke parametre er så entydige at de kan styre en oversættelse?

Titlen Toppilot faldt jeg over til brug for min 7.digtsamling, fordi det havde klangen og fylde og mangel på definition over sig etc.

Ordet (der så blev min bogs titel) var et vildskud fra en pc-oversættelsesprogram, hvor det hele gik galt- forstod jeg på forklaringen.

Oversættelsen gik galt, fordi maskinoversættelser i kraft af de matematiske parametre nødvendigvis må arbejde stringent, lineært og først og fremmest efter regler for rækkefølge (syntax), eller et andet lineært parameter, der hedder tæt kontext i forhold til nærmeste naboord til venstre og til højre.

Syntax er i princippet uden taxonomi eller valorisering, udover det der ligger i rækkefølge, at noget må komme før noget andet.

Et navneord og fx et tillægsord har samme værdi, men må placeres forskelligt i sætningsrækken. Et tillægsord kan indplaceres som prædikat (efter et verbum der kræver prædikat som: være, hedde, anses for, kaldes for), appositionelt (bagefterstillet sit navneord som et navnetillæg) eller attributivt. Ved prædikat vil der mellem substantiv og prædikat være et verbum som det nævnte. Hunden er sød. ”Er” afstedkommer et prædikat. Det kan en maskine måske nok finde ud af.

 

Og den normale sætningsrækkefølge er  Subst, verballed, prædikat. Og for at tage en hel sætning, så er rækkefølgen oftest som Solen skinnede smukt på store og små, altså. S V adv adv (præpforb).

Og problemet Inversion opstår på fx dansk og tysk. Og matricen kan måske også klare INVERSION, fordi rækkefølgen her også kan styres som følger-. Vi smider ”pludselig” ind foran den lige nævnte sætning. ”Pludselig skinnede solen.” Og vi får rækkefølgen  Adv  V S. Der er vendt om på rækkefølgen, og program-matricen ved,  at hvis en sætning begynder med adverbialled, så skal rækkefølgen –da ”pludselig” er et adv  herefter have omvendt rækkefølge. Adv V S(subjekt).

Det kræver så bare at den oplistede række af adverbialer er entydige adverbialer. Men hele (bi)sætninger kan optræde som en slags adverbial i forfeltet, fx   ”Da han kom ind ad døren ,så han en tyv.”  Hovedsætningen efter kommaet får inversion. Altså skal x og o komme i modsat rækkefølge. Og hvis der i samme hovedsætning placeres et ”ikke”, så sætningen nu lyder: ”Da han kom ind ad døren, så han IKKE en tyv.” Ja så skal maskinen vide, hvornår et centraladverial som ”ikke” skal placeres som her, mellem ”han og ikke”. Men ”ikke” er en smutter andre gange: han var ikke så glad. (lige efter verbet i en hovedsætning) Fordi han ikke var så glad.(lige før verbet i en bisætning). Men hvis hovedsætningen var indledt af en bisætning i forfeltet, så bliver ”ikke” placeret både efter verbet og efter subjektet.    

 

Og omkring
et specifikt problem som deponente verber (passive i form, men med aktiv betydning) fx"jeg synes"...ville matricen i en sætning med deponens fastholde form eller betydningsindhold.

Og omkring:

Naboord    ”Hunden hed Albert”  så ved maskinen, at hvis der efter ”hed” kommer et stort bogstav og et ord med lav frekvens, så er prognosen et navn (proprium), og så skal ”hed” ikke oversættes med warm, men med is called, hvis vi snakker oversættelse til engelsk.

MEN ord er også determinativer dvs at der er systemer af over-og underordning udover de konsekvenser vi har kigget på. Altså en anden form for  (instrumentalisering). Objekternes instrumental-karakter.

Let nok ved transitiver: ”Hun ejede en bondegård.” Efter ”ejede” skal der komme et substantielt led. Men ikke altid efter ”havde”. Altså  ”Hunden tævede postbudet” (som giver mening på dansk, ikke pga normalsyntaks, men fordi man indimellem kan begynde med et objekt). Hunden er objekt og postbudet subjekt. Vi har S(obj) V S(subj), men S1 er et obj.  Det skal maskinen fx finde ud af ved oversættelse til fx tysk. Hunden skal ikke være Der Hund, for så er den den aktive, der banker postbudet. Hunden skal her være ”Den Hund” altså akkusativ  (og objekt). Hvis maskinens eneste styrende parameter er Subjekt Verbum Objekt, så går det galt. Hvordan skal den vide ud fra dansk tekst hvem der styrer skidtet.

 

Så er der yderligere ordenes dobbeltbetydning. Fra før havde vi ”hed”, som måske mange gange kan klares ud fra naboord, men bestemt ikke altid.   

”Skattemyndighederne ligner i øjeblikket alle narkohandlerne i Sønderborg.”  ”Ligner” har to betydninger: to look like eller i betydning taxation. Hvis maskinen går en smule fejl , så vil det vel lande i noget med The tax authorities look like drog dealers. Og der er ikke så godt.

Præpositioner er deres eget kapitel: hvordan oversætte i, på, fra, til over, under ved siden af ….?

   

Konnotation  at ordene kan have en medbetydning må også ku give visse problemer.

Vi har eksemplet  Direktøren var en dame med mod og hjertet på rette sted->  dame har konnotationer udover køn (sexus) og alder og stand, nemlig   et let drys af tvistet ironi. 

 

Han var fuldstændig rundt på gulvet. Idiomer udgør et særligt problem.

 

Dialekt, sociolekt, indforståetheder det samme…..

 

Eller Forkert tryk i mundtlig tale Som falder uden for dette problemsæt.

Hypotetiske forhold (konditionel) fx i hvis –sætninger

Konjunktiviske med subjektiv markering ”Er sei krank.”  

 

Komplementaritet. Ordet dreng er afhængig af en skyggetekst, der ikke står der, men som underforstås kontekstligt, nemlig om der er tale om ”dreng”  i modsætning til 1)voksen, til 2) pige, og 3) mand, 

 

Er organisering et sprog med eget alfabet? Er organisering et gudgivent system?. Kan der kun ses på det som en lukket veldefineret enklave i sproget? Overordnet et instrumentaliseret sprog med mål og midler veldefineret i forhold til hinanden. Hvilket hensigter og motiver er impliceret i organisationsformen (maximering, dvs tidsøkonomi)-. Hvad sker der hvis det modtages af de implicerede som kommando oppe fra. Hvilken form taber mest energi (pyramide, tragten, det flade landskab. Celleopdeling). Hvilken form giver mulighed for at rette på styring? Hvilket kybernetisk system taber ansvar)?

 

Ingen kommentarer:

Send en kommentar