Våra senaste
toppartiklar

- Internetworld:

Här hängs Coop ut som licensfuskare


- Computer Sweden:

Öppet format standard i Storbritannien


- Computer Sweden:

Stort säkerhetshål upptäckt hos Wordpress


- Computer Sweden:

Svenska skattepengar för hundratals miljoner till Apple


- PC för Alla:

Framtidens sökmotorer - så smarta är de

Snille. Stephen Wolframs sökmotor gör semantiska sökningar. Den ger dig svar i stället för en massa länkar.
Snille. Stephen Wolframs sökmotor gör semantiska sökningar. Den ger dig svar i stället för en massa länkar.
När du använder en sökmotor gör du det utan att tänka särskilt mycket på saken. Du skriver in ett ord eller en mening och sökmotorn ger dig en lista med länkar som den tror passar.

Tänk dig i stället att du kan kommunicera med datorn genom att ställa konkreta frågor och datorn ger dig lika exakta och korrekta svar på dina frågor. Hur långt är det mellan Stockholm och Budapest? Svar: 1 317 kilometer. Var befinner sig den internationella rymdstationen ISS just nu? Svar: ovanför Sri Lanka.

Men håll i hatten. Detta är ingen utspejsad framtidsvision från datasnillena på Google – utan en teknik som finns redan i dag.

Tekniken är en ny typ av sökmotor som kallas Wolfram Alpha och den anses av många vara det första riktiga steget mot det som kallas för den tredje generationens webb eller webb 3.0. Men innan vi rusar iväg till framtiden, stannar vi kvar i 2009 för att bena ut vad en sökmotor egentligen är.

Miljontals träffar
Sökmotorerna är en av de viktigaste grundpelarna för ett fungerande internet. I slutet av oktober 2008 uppskattades det att internet bestod av inte mindre än 182 miljoner sajter och hur många webbsidor som finns är det ingen som vet med exakthet.

Problemet är uppenbart: Internet består av en ofattbar mängd information – men hur når vi fram till den? I dag sker majoriteten av alla sökningar via Google och att ”googla” har blivit ett begrepp. Ändå är sökmotorerna rätt klumpiga och inexakta verktyg. Låt oss pröva de ovanstående exemplen med Google. En sökning på den thailändske kungens ålder gav oss 67 miljoner träffar, medan rymdstationen ISS gav oss 15 miljoner träffar.

Som en vansinnig bibliotekarie
Till Googles försvar kan man säga att den är duktig på att lyckas få in vad du söker inom de fem till tio första länkarna. Men annars kan den närmast beskrivas som en lätt psykotisk bibliotekarie som rusar runt som en vettvilling och letar upp varenda dokument som innehåller ditt sökord, rusar tillbaka till dig med hela kalaset och slänger på ett par reklambroschyrer ovanpå hela paketet.

Fram tills nyligen fanns det i huvudsak två typer av sökmotorer: så kallade crawlers och manuella databibliotek. Google använder crawler-tekniken. En crawler sätter samman sina länkregister genom att automatiskt söka igenom webben efter information. Så fort ny information hittas uppdateras databasen och informationen blir tillgänglig i dina sökningar. Det är också skälet till att det kan dröja dagar eller veckor innan en ny sajt kommer med i en sökmotor. Innan crawlern har fångat in webbsidan finns den inte i dess register och kan således inte heller sökas.

När du söker letar sökmotorn upp alla webbsidor som kan vara av intresse – vilket oftast blir ett par miljoner. Tack och lov är moderna sökmotorer som Google, Yahoo och MSN rätt smarta och lyckas oftast fånga in de mest intressanta sidorna bland de 10 till 20 första träffarna.

Den andra typen av sökmotor bygger på en manuell databas. Den hämtar inte in nya webbsidor från nätet automatiskt utan byggs upp genom att någon skriver in sidorna manuellt – oftast med en kortare recension om hur användbar sajten är. Under nittiotalet gjorde Yahoo sig ett namn på att ge dig få länkar med hög kvalitet, snarare än kvantitet. Men i dag är den här typen av sökmotorer omodern.

Wolfram Alpha ger exakta svar
Under ett par år har utvecklingen för sök-motorer tappat fart. Visst har de blivit snabbare, men crawler-tekniken är i princip densamma som den var för tio år sedan.


Wolfram Alpha.

Den nya sökmotorn Wolfram Alpha ger oss en försmak om vad framtiden kommer att erbjuda. Även om det inte blir just Wolfram Alpha som blir framtidens sökmotor är en sak säker – sättet vi söker information på kommer definitivt att ändra sig.

Wolfram Alpha är en tredje typ av sök-motor. I stället för att likt vår (lätt psykotiske) bibliotekarie som stolt visar upp alla miljoner dokument, vill den nya typen av sökmotor ge dig ett exakt svar på din fråga.

Namnet Wolfram Alpha kommer från dess skapare, en brittisk matematikprofessor vid namn Stephen Wolfram. Hans söktjänst gör så kallade semantiska sökningar.

Det betyder att du kan ställa frågor i klartext och sedan få resultatet presenterat som klara svar i stället för länkar till olika webbsidor. Tankenmed Wolfram Alpha är att det ska kännas som om du pratar med en expert.

Medan Google vaskar fram sina resultat från en databas som bygger på innehållet från det öppna internet, bygger informationen från Wolfram Alpha på verkliga människor som valt ut och granskat källor på förhand, och i många fall kommer informationen från källor som inte är öppna för allmänheten. I alla fall inte gratis.

Enkelt sammanfattat är Wolfram Alpha ett smart program som först försöker förstå meningen bakom din fråga och sedan försöker hitta relevanta information i sin databas. Det låter häftigt, och det är det också. Men hur stor databas som Wolfram Alpha än har kan den inte mäta sig med den informationsmängd som finns på det öppna internet.

I praktiken krävs det än så länge en del jobb för att få Wolfram Alpha att göra som du vill. Ibland förstår den inte frågan och då kan en ny formulering hjälpa, men i många fall har den inte informationen som du är ute efter. För en sökmotor är det ett problem som närmast kan beskrivas som en garant för dess undergång. Men ju mer Wolfram Alpha används, desto mer information stoppas in i dess databas, som följaktligen blir mer innehållsrik. Vissa internetanalytiker har spått att Wolfram Alpha i framtiden kommer att bli minst lika viktig eller rent av viktigare än Google. Men det avfärdar Stephen Wolfram som ser Wolfram Alpha som ett komplement till den klassiska sökmotorn, snarare än en ersättning.

Naturlig utveckling
Att sökmotorer som Wolfram Alpha kommer att bli ett komplement till sökmotorer som Google, håller Magnus Sahlgren, forskare inom datalingvistik på Sics (Swedish Institute for Computer Science) med om.

– Googles styrka ligger i dess omfattade databas och i dess extremt snabba svarstider. Innehållstunga söksystem som är baserade på kunskap, som Wolfram Alpha, svarar mot en annan typ av informationsbehov och användare. Man kan säga att det handlar om en typ av expertsystem som snarare konkurrerar med Wikipedia, säger han.

I sådana system är svarets kvalitet och användarens tillit till detta viktigare än hur snabbt man får svar eller hur stor del av internet man har i sin databas. Magnus Sahlgren tror att vi definitivt kommer att se fler exempel på den typen av söksystem.

– Det finns stora forskningsprojekt som går i den riktningen. Det är en naturlig utveckling eftersom tillgängligheten på strukturerade data ökar. Ett exempel är den semantiska webben (se faktaruta, sidan 54) och stora datasamlingar såsom medicinska data, patentsamlingar och så vidare. Strukturerade data möjliggör mer avancerade operationer än nyckelordsmatchning och är en del i vad som kallas för webb 3.0.

Morgondagens söksystem kommer att själva kunna resonera kring informationen och dra egna slutledningar utifrån den – alltså det som Wolfram Alpha syftar till men ännu inte klarar av, enligt Magnus Sahlgren.

Det stora problemet med Wolfram Alpha är i dag att den inte hanterar frågor i naturligt språk. Magnus Sahlgren ger oss exempel.

– Frågar du exempelvis ”what is the capital of Bolivia?” får man svar från Wolfram Alpha, men också i Google. Gör du frågan aningen mer komplicerad, som ”which is the main city in Bolivia” förstår inte Wolfram Alpha vad man vill – men Google ger dig fortfarande rätt svar.

  – Jag tror att vi får vänta ett bra tag innan vi börjar se söksystem som på riktigt kan hantera vanligt formulerade frågor, säger han.

Bing – ett steg på vägen

Det är inte bara britterna som driver på utvecklingen. Microsoft har länge gnisslat tänder över Googles dominans på sökmotormarknaden och har gjort ett allvarligt försök i att blåsa nytt liv i sin gamla söktjänst Live under namnet Bing.

Liksom Wolfram Alpha vill Bing ge dig konkreta svar på dina frågor, men den är lite mer som ett mellanting av Wolfram Alpha och Google. Bing ger dig visserligen alla träffar den hittar men försöker strukturera informationen så att du får den relevanta informationen snabbare.

En tanke med Bing är att du exempelvis ska kunna söka efter ”flyg från Stockholm till Budapest” och så ska Bing kunna vaska fram erbjudanden och bra priser på en sådan resa. Det går inte i den svenska versionen av Bing, ännu. Microsoft jobbar även med att integrera sökning av bilder och video, tillsammans med den traditionella textsökningen.


Bing.

Att Microsoft menar allvar med sin nya satsning på sökmotorer blev extra tydligt i början av augusti då Microsoft och Yahoo inledde ett samarbete mellan deras söktjänster. Enligt Microsoft innebär det här samarbetet att mer resurser investeras i nya tekniker för att slutligen resultera i en bättre sökupplevelse.

IBM håller också på att utveckla ett nytt datorsystem som sägs kunna svara på frågor med samma exakthet och hastighet som från en människa.

I nästan två års tid har forskare på IBM arbetat med ett system som med hjälp av artificiell intelligens kan svara på frågor. Systemet går under namnet Watson. För att se vad Watson verkligen går för har IBM nu bestämt sig för att låta datorn vara med och tävla i frågesporten Jeopardy. Enligt IBM kommer Watson att kunna tävla utan att vara uppkopplad mot internet eller få information eller hjälp någon annanstans ifrån.

Google ger inte upp
Även Google arbetar på en ny typ av söktjänst som vaskar fram information och svar på ett annorlunda sätt. Tjänsten går under namnet Google Squared och bygger på semantik, men i motsats till Wolfram Alpha hämtar Google Squared all information från det öppna nätet och i stället för att ge dig ett enda exakt svar, får du i stället tillgång till ett lass information som tillsammans – förhoppningsvis – innehåller det du söker efter.


Tom Stocky är chef för Googles söktjänster och förklarar att den stora utmaningen för en söktjänst ligger i att kunna svara på många olika typer av frågor, och ger ett exempel. Någon som söker efter ”vad är klockan?” letar efter en helt annan typ av svar än någon som söker efter de ”senaste resultaten i fotboll”, vilket är en helt annan fråga än ”jämför alla olika hybridbilar i pris och funktioner”.

– Den sista frågan är extra intressant, eftersom man måste samla in information från massor av olika webbplatser, och det är exakt vad Google Squared gör, säger Tom Stocky.

Precis som med Googles vanliga sökmotor fungerar Google Squared genom att du skriver in det du söker efter.

Men i stället för att få hundratusentals länkar får du en handfull svar med vad sökmotorn anser vara mest relevant. Det intressanta är att Google Squared automatiskt letar upp relevant sidoinformation om det du sökt på och presenterar denna i rutor.


Google Squared.

Söker du på det engelska ordet ”moons” får du en imponerande lista över månar i vårt solsystem, komplett med tillhörande data, som exempelvis månens massa, hur lång dess omloppsbana är, vem som upptäckte den och så vidare.

Men Google jobbar inte bara med nya projekt. I det tysta har Google lagt upp nya inställningar för mer avancerade sökningar, däribland möjligheten att göra så kallade relaterade sökningar i Googles vanliga sökmotor. Den här tjänsten är ett synnerligen kraftfullt verktyg om du letar efter fler alternativ till en bra webbsida du hittat.

Framtidens sökmotorer kommer alltså att ge dig mer exakt information på färre sökningar. Nästa steg blir, enligt Magnus Sahlgren på Sics, mer personliga sökningar. Då har söksystemen inte bara lärt sig förstå vad du säger, utan vad just du är intresserad av.

Wolfram Alpha, Google Squared, Microsoft Bing och IBM:s Watson tar alla nya grepp på informationssökning. Men steget efter dessa tjänster blir ännu djupare sökningar, där sökmotorn inte bara hämtar ett dokument eller svarar på en fråga, utan bevakar ett ämne mer långsiktigt – bara för dig.



Här kan du testa framtidens söktjänster – i dag!


Wolfram Alpha
. Sökmotorliknande tjänst som jobbar med så kallade semantiska sökningar. Ställ en fråga och få ett svar. Är ännu under utveckling.
www.wolframalpha.com

Google Squared. Kombinerar traditionell sökteknik med smartare struktur. Tekniken bakom Google Squared är även den fortfarande i teststadiet men du kan prova redan nu.
www.google.com/squared



Googles bildidentifiering. Ny analysmetod som låter datorn analysera och identifiera vad ett fotografi innehåller. Läs om forskningen på: googleblog.blogspot.com/2009/06/new-landmark-in-computer-vision.html

Bing. Finns redan nu – och på svenska. Microsofts söktjänst är inte lika spektakulär som framtidsteknikerna ovan, men ändå ett spännande steg mot framtidens sökmotor.
www.bing.se

Fakta

När man pratar om framtidens internet kommer ofta begreppen ”den semantiska webben” eller webb 3.0 på tal. Så vad innebär det, egentligen?

Lite förenklat kan man säga så här: Webb 1.0 är den grundläggande webben, där användare kan länka till andra användares sidor. Det är internet som det såg ut på mitten av 1990-talet.

Webb 2.0 kallas för den skrivbara webben. Genom ny teknik kan användare forma innehållet på internet via bloggar eller uppslagsverk som Wikipedia, samt hålla alla sina vänner uppdaterade om vad som händer via Twitter och Facebook.

Webb 3.0 handlar om att införa teknik som gör innehållet på nätet mer strukturerat. Strukturerad information gör innehållet på nätet mer begripligt för datorer.

Tanken är att om datorerna kan förstå sammanhang mellan olika informations-källor (exempelvis olika webbsidor), blir det enklare för oss att få fram den information vi vill ha. Webb 3.0 kallas därför för den semantiska webben. Semantik är ett begrepp som avser ”betydelsen” i ett språk. Då ordet syntax används för att beskriva hur man sätter samman ord till meningar, används semantik för att beskriva inne-börden av dessa ord.

De flesta av oss kan sätta in orden ”paul mccartney” och ”yesterday” i rätt sammanhang. Vi kan förklara att Yesterday är en av världens mest kända kärlekssånger, skriven av popgruppen Beatles som bildades på 1960-talet och att Paul McCartney var en av gruppens medlemmar. Men för en dator är detta sammanhang betydligt svårare att luska ut – och det är det som den semantiska webben ska råda bot på.

På samma sätt som webb 2.0 gjorde internet mer interaktivt, kan man säga att webb 3.0 är ett krafttag för att göra internet mer intelligent.

Till skillnad mot webb 2.0, vars tekniker tydligt kunde märkas av i form av bättre interaktivitet, kommer du inte att märka av webb 3.0 på samma sätt. Du kommer i stället att uppfatta det i form av bättre sökresultat som ger dig mer exakta svar på dina frågor och mindre av det som du inte är intresserad av.



Artikelkommentatorerna ansvarar själva för sina inlägg.

Regler för inlägg i artikelforumet

Kommentatorn ansvarar själv för sina inlägg.
Vi har nolltolerans mot inlägg som innehåller diskriminerande uttalanden, personliga påhopp eller språk som kan uppfattas som stötande. Även poänglösa datorkrigsinlägg och inlägg som är off topic tas bort. Brott mot reglerna kan leda till permanent avstängning.

IDG förbehåller sig dessutom rätten att i varje enskilt fall bedöma huruvida ett inlägg ska tas bort, även om det inte faller under någon av reglerna ovan.

Upprepat postande av olämpliga inlägg kan medföra avstängning från artikelforumen.

Frågor? Mejla idg.se@idg.se

Läs mer om vår policy i diskussionsforum

Rekryterar just nu

Utvalda whitepaper

HR + Mobilitet = sant
Säljavslut med molnet
Från klick till snack till affär

Nyhetsbrev

Anmäl dig till vårt dagliga nyhetsbrev!

Morgonens viktigaste it-nyheter och Dagens Dilbert

Please don't insert text in the box below! Please don't insert text in the box below! Villkor

Nyheter

- Internetworld:

Nu får tredje världen gratis internet


- Computer Sweden:

USA kräver att få svenska data


- Internetworld:

Här hängs Coop ut som licensfuskare


- Internetworld:

Så många länkar har Google plockat bort

- PC för Alla:

Så ska IE bli lika bra som Safari för IOS


- Computer Sweden:

Amerikanska staten misstänkt för attack mot Tor


Dolda kostnader utmaning i molnet

Nyheter Att lägga ut administration av applikationer på molnleverantörer utövar en stark lockelse för många företag. Men vissa arbetsuppgifter går inte att lägga ut för den som vill komma billigt undan.


- Internetworld:

Han är rikare än Googles grundare

- PC för Alla:

"Android står nu för 85
procent av marknaden"


- Internetworld:

Alibaba vill investera i Snapchat


- Internetworld:

Wikipedia börjar ta emot bitcoin


- Computer Sweden:

Datasjöar är nästa stora grej


- Internetworld:

Luft under vingarna för Twitter


- Computer Sweden:

Franskt ramaskri mot HP

- MacWorld:

Instagram släpper Snapchatkonkurrent


Nya modeller av Macbook Pro släppta

EXTRA Erbjuder något snabbare processorer och mer arbetsminne som standard.


- Computer Sweden:

Office 365 är en miljardaffär


- Computer Sweden:

Öppet format standard i Storbritannien


- Internetworld:

E-handlare blåste hundratals svenskar


- Computer Sweden:

Samarbete ska förenkla Hadoop

Nyhetsbrev
Kontakta oss
Postadressen är:
IDG.se, Karlbergsvägen 77, 106 78 Stockholm

Telefon (växel): 08-453 60 00

Ansvarig utgivare: Carl Grape



Om IDG.se
Copyright © International Data Group
Sök efter artiklar och produkter: