Insights on Marketing & Technology

Den sprogteknologiske flaskehals anno 2013

Vi interagerer i øjeblikket med hinanden, med virksomheder og med teknologi i et hidtil uset omfang. Men inden for teknologien er den meningsfulde samtale mellem menneske og computer stadig langt væk, selv om sprogteknologiske succeshistorier som Apples ”Siri“-app og Googles ”Google Now” leder folk til at tro, at vi er kommet meget længere, end vi i virkeligheden er. Få et overblik over udviklingen inden for talegenkendelse og kunstig intelligens her.

  • By: Erik David Johnson
  • Published: 18-06-2013

Selv om vi de seneste år har set flere nye tiltag, som skal gøre interaktionen mellem menneske og computer mere flydende og naturlig ved at benytte sig af talegenkendelse og anden sprogteknologi, så er der stadig langt til, at vi kan have en meningsfuld samtale med et stykke software. Det er der en grund til, for selv om vi er nået langt, har vi endnu ikke knækket koden, når det kommer til at få en computer til at tale de menneskelige, naturlige sprog. Det er nemlig anerkendt som værende et ”AI-komplet problem“ (Artificial Intelligence). Med andre ord – at simulere en sprogforståelse indebærer at simulere egentlig forståelse – hvilket igen svarer til den hellige gral inden for kunstig intelligens: At få computeren til at tænke som et menneske.

Talegenkendelse og syntetisk tale
Men hvad kan vi så allerede nu, og hvad vil fremtiden bringe? Succeshistorier som Apples ”Siri“-app og Googles ”Google Now“ leder folk til at tro, at vi er kommet meget længere, end vi i virkeligheden er. Det er vigtigt at forstå, at disse programmer kun klarer sig så godt, fordi de fungerer inden for ekstremt begrænsede domæner. Hvis man skal forstå, hvor kampen anno 2013 står i forhold til at bringe sprogteknologien derhen, hvor vi kan have dybere, mere meningsfulde samtaler med vores digitale modstykker, så må vi sørge for at skelne mellem nogle forskellige sprogteknologiske hovedelementer, som indgår i den type interaktion.
    Det er nemlig alt for let at komme til at fokusere på form frem for indhold, forstået på den måde at talegenkendelse og produktionen af kunstig, syntetisk tale ofte er det, der definerer oplevelsen ved verbal menneske-computer interaktion (Figur 1). Disse to områder er nu nået så langt, at det næppe er her, man finder en reel, sprogteknologisk flaskehals. Anderledes ser det ud, når det kommer til at processere egentligt sprogligt indhold – altså en simuleret sprogforståelse gennem tolkning af sætningers betydning.

En statistisk tilgang til sproget
Manglen på fremskridt inden for en sådan simuleret sprogforståelse kan til dels tilskrives det, at processeringen af naturlige, menneskelige sprog som felt længe har været domineret af en statistisk tilgang til sproget. Årsagen er, at man på et tidligt tidspunkt har kunnet opnå begrænsede, men fornuftige resultater ved denne tilgang. Tendensen har så været at bygge videre på disse hovedsageligt statistisk funderede løsninger i stedet for løbende at gentænke den overordnede tilgang til feltet.
    Et godt eksempel er maskinoversættelse, hvor man benytter en computer til automatisk oversættelse af tekst fra ét sprog til et andet. Ret tidligt havde man moderat succes ved at gennemsøge store databaser af fragmenterede eksempeloversættelser og igennem statistiske metoder at beregne sandsynligheden for forskellige kombinationer af ord og fraser. Selvom den er forfinet ganske meget i dag, så er det stadig samme statistisk funderede tilgang som anvendes rundt omkring, og den er et godt eksempel på, at vi stadig har lang vej igen. De fleste har prøvet maskinoversættelsesprogrammer såsom Google Translate og oplevet, hvordan oversættelserne oftest rammer lidt – eller meget – ved siden af.

Flere niveauer af sproganalyse
Karakteristisk for statistisk funderede løsninger er, at de næsten udelukkende arbejder på de nederste niveauer af sproganalyse, såsom morfologi, grammatik og syntaks, som alle beskæftiger sig med kombinationer af tegn eller ord (Figur 2). En vigtig pointe må være, at hvis vi teknologisk skal simulere en menneskelig sprogforståelse så godt som muligt, så må vi bevæge os op på de højere niveauer af sproganalyse. Problemet er, at dette er ekstremt kompliceret, og det kræver som regel, at vi bevæger os ind i overlappet mellem kunstig intelligens og sprogteknologi gennem anvendelsen af komplekse matematiske modeller.


    Meget tyder dog på, at dette er ...

  • Share on Facebook
  • Share on Twitter
  • Share on LinkedIn
  • share with friends
  • Share on Google+

Be the first to like this.

SORRY! YOU ARE NOT LOGGED IN

Get access to:
  • Articles and talks
  • Free seminars and briefings
  • Free publications and papers
It is 100% Free

LOG IN



CREATE PROFILE
(100 % FREE)


FORGOT YOUR PASSWORD?

More