Förra veckan skulle Microsofts vd Satya Nadella visa hur förträfflig det är med Cortana, företagets artificiella assistent. På scenen, framför en stor publik, försöker han styra ett affärsverktyg med rösten.

– Show me my most at-risk opportunities, försöker han på scenen.

– Show me to buy milk at this opportunity, föreslår Cortana.

Publiken skrattar, klippet delas på Youtube och vi konstaterar, än en gång, att det där med virtuella assistenter är ett fantasiscenario.

Fel.

Problemet är att Satya Nadella står på en scen framför massor av människor, oväsen och mobilsignaler. Problemet är att han visar upp en demoversion av Cortana.

Cortana
Cortana. Foto: Bhupinder Nayyar (CC)

För faktum är att röststyrda assistenter blir allt smartare. De är inte samma träskallar som de var när Apple lanserade sin artificiella intelligens Siri för snart fyra år sedan. De har lärt sig lyssna, svara och tänka.

Läs mer: Apple och Microsoft verkar ha slutit fred - och det är goda nyheter

Kanske används de i dagsläget mest för att fråga om det regnar ute, men under huven är ai-assistenterna sprängfyllda av avancerad teknik.

IDG News har gått igenom de viktigaste komponenterna i tekniken bakom röstassistenterna. Och varje del fungerar och utvecklas oberoende av de andra:

  • Röstigenkänning – i realtid kan de känna igen vad du säger och tolka din dialekt samtidigt som de kan filtrera bort onödigt bakgrundsljud.
  • Filkomprimering och dataöverföring – de kan i hög hastighet komprimera ditt kommando, skicka det till ett datacenter för att tolka det och sedan blixtsnabbt ge respons.
  • Artificiell intelligens – det finns möjlighet hos servrarna och mjukvaran att ”förstå” användarens kommandon och bestämma vilken information som de ska ge till svar.
  • Datakällor – de har tillgång till kunskapsbaser, beräkningsmotorer och annan data för att ta fram svaret.
  • Användarkontext – de har tillgång till personlig information hämtad från e-post, kalendrar, kontakter, platsuppgifter, historik och vad du än har på skärmen för närvarande.
  • Konversationsmotor – de har möjligheten ge svar med variation, på ett vardagligt sätt, med humor och med kontext.
  • Makt – de kan göra saker å användarens vägnar som att boka bord, kontakta dina vänner, köpa saker, starta appar eller köra kommandon.
  • Proaktivitet – de vet vad de ska göra utan att ha blivit tillsagda.

Vad som är än viktigare är att alla de här teknikerna blir bättre i rask takt. Varje ny utgåva av Siri, Cortana eller Google Now är ordentligt mycket ”smartare” än föregångaren.

Och det är nu de kommer på bred front – och alla respektabla teknikföretag ska ha sin egen.

Läs mer: Håll i hatten – Microsoft har utvecklat en egen Linux-distribution

Microsoft experimenterar med Cortana i alltifrån bilar till Xbox One. Siri ska styra din Apple TV. Google Now sköter din telefon. Facebooks nyutannonserade röstassistent M håller koll på ditt liv och dina relationer via Messenger. Amazons Alexa ska låta dig säga åt ditt smarta hem att slå på diskmaskinen.

Uppstickare är också med på tåget. Appen Soundhound har i flera år gjort sig känd för att känna igen låten du nynnar på. Nu har företaget bakom använt den kunskapen till röstassistenten Hound som svarar på de mest komplicerade frågorna innan du hunnit hämta andan.

Eller vad sägs om Mattels nya docka? Hello Barbie är svindyr, uppkopplad mot internet och pratar med ditt barn – skrämmande eller fantastiskt, du bestämmer.

Sida 1 / 2

Innehållsförteckning