Röststyrning

Röststyrda datorer har varit en utopisk dröm hos många datorfantaster ända sedan den verbala datorn, HAL 9000, i filmen 2001 - Ett rymdäventyr gjorde entré. Röststyrning och röstsyntes har i olika former funnits nästan lika länge som det har funnits datorer.

Tekniken har dock inte lyckats speciellt bra av flera skäl. Ett av de största skälen är att hårdvaran hittills varit för klen för att kunna tolka tal på ett effektivt sätt. De enda användbara områdena inom konsumentprodukter där röststyrning hittat sig in är bland mobiltelefoner som erbjuder röstaktivering för att ringa upp en bekant.

Har du någon gång provat den inbyggda röststryrningen i OS X har du säkert märkt att det är allt annat än enkelt att få den att fungera effektivt. I praktiken är det fortfarande enklare och snabbare att använda mus och tangentbord.

Ett problem med röststyrning är att alla användare har olika uttal och dialekter vilket innebär ett stort problem vad gäller precisionen av rösttolkningen. Skulle datorn trots det förstå precis alla ord du säger så är det ingen garanti för att den förstår vad du menar. En mening kan betyda helt olika saker beroende på flera olika faktorer som meningsuppbyggnad och tonfall.

I de applikationer där  röststyrning används i dag handlar det endast om väldigt korta kommandon i form av enstaka ord. För att tekniken ska kunna användas fullt ut måste den artificiella intelligensen, i kombination med kraftfulla datorer, klara av att sätta meningar i sitt sammanhang utan misstag. I dagsläget är vi fortfarande ganska långt ifrån det målet.

MacWorlds analys
Den dag då vi kan ha helt flytande diskussioner i stil med HAL 9000 ligger med största säkerhet fortfarande ganska långt fram i tiden. Röststyrning har än så länge endast använts inom väldigt smala områden och det kommer säkerligen att förbli så de närmaste åren.