Sedan oktober 2003 är det möjligt att registrera svenska domännamn med tecknen å, ä, ö, ü och é. Dessa tecken kompletterar de redan tillåtna ASCII-tecknen a-z, 0-9 och – (bindestreck). Den inledande förtursperioden har passerat och nu gäller principen först till kvarn.

Har du till exempel företaget Gourméräkor kan du bara hoppas på att det är ledigt. Om så är fallet kan du fundera på vilken stavning du vill registrera, förutsatt att samtliga är lediga. Du bör välja mellan gourméräkor.se och gourmeräkor.se. Smartast är nog att helgardera och välja båda. Av speciella skäl, som vi kommer till senare, bör även gourmerakor.se registreras. Se där – tre domännamn för samma företag. Vem sade att ny teknik skulle förenkla tillvaron?

En nackdel med internationaliserade domännamn (IDN) är just att det ger betydligt fler alternativ för stavning. Norge, för att ta ett exempel, införde i februari 2004 23 nya tecken för att täcka in samtliga officiella norska skriftspråk. En norsk kommun som till exempel Øvre Årdal tjänar på att även registrera ett domännamn med internationellt gångbara tecken. Turister från till exempel Japan och USA hittar därmed lättare till den pittoreska lilla kommunen. IDN bör oftast ses som komplement till klassiska domännamn.

Asien först med internationella namn
Arbetet med IDN startade redan 1998 då ett antal asiatiska länder gick samman i arbetsgrupper om ämnet. Universitetet i Singapore hade tidigare utvecklat möjliga tekniker för att kunna använda fler tecken i namnuppslagning över Internet. Antingen fick standarden för DNS ändras eller så måste icke godtagbara DNS-tecken på något sätt konverteras för att kunna användas inom nuvarande DNS. Lösningen som valdes kallas Internationalizing Domain Names in Applications (IDNA) och går ut på att konvertera icke ASCII-tecken. Konverteringen sker i varje applikation (webbläsare, e-postprogram) som stödjer IDN. Klienten skickar alltså fortfarande rena ASCII-tecken till DNS.

Enda skillnaden mot tidigare är att konverterade domännamn innehåller ett prefix kallat ASCII Compatible Encoding (ACE) med tecknen ”xn--”. En konvertering av www.åre.se blir till www.xn--re-xia.se vilket är vad som skickas till DNS. Notera att icke ASCII-tecknet å är borta, xn-- indikerar att adressen mellan www och se är ett konverterat namn. Tillägget –xia anger på vilken plats det utbytta tecknet fanns samt vilket tecken det var. Konverteringen är fullständigt reversibel vilket är ett måste för att applikationen alltid ska kunna visa korrekt IDN. Mata gärna din webbläsare med adressen www.xn--re-xia.se så får du se vad som händer.

Algoritmer sköter konverteringen
Två algoritmer kallade ToASCII och ToUnicode hanterar konverteringen mellan ASCII och icke ASCII-tecken. Först delas domännamnet upp i sina adressdelar, www, åre och se. Efter uppdelningen konverteras varje del för sig. Innan ett IDN-namn skickas till DNS körs ToASCII. Tecken som redan ingår i ASCII-tabellen lämnas oförändrade. Här gäller samma regler som tidigare för DNS godkända ASCII-tecken. Om ToASCII upptäcker tecken som inte ingår i ASCII tabellen körs först en algoritm kallad Nameprep vilken snyggar till adressdelen. Versaler ersätts till exempel med motsvarande gemena tecken.

Resultatet från Nameprep konverteras sedan till att endast innehålla ASCII-tecken. Här används en självproklamerande Bootstring-kodning kallad Punycode. Bootstring är lite förenklat en generell algoritm som kan konvertera en sträng av kodgrupper till en helt ny unik sträng bestående av kodgrupper från en större specifik uppsättning. Punycode är en Bootstring med speciella parametervärden lämpliga för IDNA. En viktig egenskap hos Punycode är att den ger unika konverteringar, varje sträng som matas in ger bara ett enda unikt resultat. En annan viktig kvalitet är att varje konvertering ska vara fullt reversibel.

Punycode (och Bootstring) är som algoritm betraktad rätt komplex. Punycode ersätter inte rakt av ett icke ASCII-tecken med ett ASCII-dito. Med hjälp av index och räknare tas istället ett suffix fram till adressdelen. Suffixet ersätter icke ASCII-tecknet och innehåller information om vilket det ursprungliga tecket var och på vilken plats det fanns.

Unicode identifierar tecknen
En förutsättning för att riktigt kunna konvertera tecken oavsett land, språk, plattform eller applikation är en internationellt enhetlig identifiering av varje tecken. IDNA använder Unicode för teckenidentifiering. Unicodestandarden är antagen av ledande IT-företag världen över och tilldelar varje tecken ett unikt nummer. Varje bokstav från alla skrivna språk motsvaras av ett Unicode-heltal kallat code point. Unicode code point i hexadecimal form för bokstaven w är 0077, motsvarande code point för bokstaven å är 00E5.

Om vi återvänder till vårt exempel www.åre.se så kan detta ersättas med en Unicode code point-sträng enligt: 0077 0077 0077 002E 00E5 0072 0065 002E 0073 0065. Kodar vi denna sträng med Punycode får vi istället: 0077 0077 0077 002E 0078 006E 002D 002D 0072 0065 002D 0078 0069 0061 002E 0073 0065. Ersätter vi nu varje code point med motsvarande tecken enligt Unicode får vi www.xn--re-xia.se.

Det finns många exempel på adresser som ToASCII inte klarar att koda. Om exempelvis den slutliga adressen överstiger 63 tecken har man nått gränsen för DNS. Ett sådant namn kan inte användas som IDN.
ToUnicode är en bakvänd variant av ToASCII som avlägsnar ACE-prefixet, avkodar Punycode-algoritmen och presenterar resultatet för användaren av applikationen. Det är inte möjligt att reversera Nameprep. Applikationer presenterar alltid domänadresser med gemena tecken.

Microsoftprogram behöver en plugin
En andra nackdel med IDN är att många applikationer i dagsläget inte kan hantera dessa i sitt grundutförande. Men arbetet med att utveckla programmen pågår och när nya versioner släpps får vi förmoda att de har stöd för IDN. Redan klara applikationer är Netscape 7.1 och uppåt samt Mozilla 1.4 och uppåt. Microsoftprodukter saknar inbyggt IDN-stöd men Verisign har utvecklat några plugin för Internet Explorer, Outlook och Outlook Express. De flesta windowsversioner stöds av Verisigns plugin liksom de flesta nyare programversioner, dock inte Outlook 2003. Du kan själv testa om du har en IDN-klar webbläsare genom att skriva in till exempel www.hälsa.se, resultatet talar för sig självt.

Vi testade Verisigns plugin på en dator med engelskt Windows XP och IE 6.0. Installationen gick på några sekunder och därefter var allt klart för svenska tecken i domännamn. Test av de tjugo mest populära svenska IDN-adresserna (populära med avseende på antal namnansökningar) gav varierande resultat. Många har inte hunnit få upp sina sajter ännu men de som var uppe fungerade fint med svenska tecken. Adresserna vi testade var sök, båt, varumärken, öl, kläder, göteborg, malmö, mäklare, fastighetsbyrå, domän, åre, köp, åhlens, domännamn, sälj, båtar, hälsa, företag, åhléns och böcker.se. En lite irriterande detalj med Verisigns plugin var att den förändrade utseendet på musmarkören i IE:s adressfält. Irriterande som sagt men ingen katastrof. Efter avinstallation via kontrollpanelen, samt omstart, var allt som vanligt igen. Vill integrera IDN-stöd i din webbläsare finns plugin hos bland andra Verisign och Gnu.

Stort intresse
Idag finns över 220 000 registrerade domännamn hos Nic-se, som står för driften av det nationella registret .se. En bra bit över 10 000 av dessa är IDN med svenska tecken. Intresset för IDN betecknas som fortsatt stort. Du ansöker om domännamn med svenska tecken på samma sätt som om klassiska domännamn. Ombuden som tar emot anmälningar finns listade på Nic-se:s hemsida. Den årliga kostnaden för ett domännamn under .se ligger på ett par hundra kronor, till detta kommer oftast en registreringsavgift som kan variera. Även domänen .nu klarar svenska tecken, det kan dock vara ett krav att du också har en klassisk .nu-adress.

Kolla även om det fungerar med svenska tecken i e-postadressen innan du beställer en .nu-adress. Domäner under .com och .net kan även de innehålla svenska tecken men hör med ditt ombud. I vintras var det stor uppståndelse när det amerikanska ombudet Network Solutions helt plötsligt beslutade att inte längre ge support för de svenska tecknen. Många svenska kunder tvingades därmed hastigt byta ombud.

Funderar du kanske på ett privat domännamn baserat på familjens efternamn? Skynda då att göra en sökning för att kolla om namnet är ledigt. Antagligen är så inte fallet, men sura inte för det – surfa in på folkbokföringen istället och byt familjens namn.

Av Gunnar Håkansson

Artikeln återfinns i Nätverk & Kommunikation nummer 5 - 2004.
Här kan du prenumerera på tidningen.

Fakta

  •  1998 börjar Asia Pacific Networking Group arbetet med internationaliserade domännamn (IDN). IDNS Working Group gör försök med en internationell mångspråkig DNS. Redan tidigare hade National University of Singapore tagit fram en teknik för mångspråkiga domännamn. Idomain Working Group skapar ett IDNS-testnätverk för asiatiska länder.

  •  1999 förevisas prototyper av IDN vid internationella konferenser. IETF startar diskussioner rörande IDN.

  •  2000 bildas IETF IDN Working Group.
  •  2001 tillsätts ICANN IDN-kommitté.
  •  2003 presenteras tekniska lösningar i RFC 3490, 3491 och 3492. ICANN publicerar riktlinjer för IDN. Klart för svenska tecken från och med oktober.
  •  www.nic-se.se – Network Information Centre Sweden AB, startplats för allt som handlar om svenska domäner. Ombudslista, länkar till programvaror och information. Statistik.

  •  ietf.org/rfc/rfc3490.txt?number=3490 – IETF RFC 3490, Internationaliserade domännamn i applikationer, IDNA.

  •  ietf.org/rfc/rfc3491.txt?number=3491 – IETF RFC 3491, Nameprep-algoritmen för IDN.
  •  ietf.org/rfc/rfc3492.txt?number=3492 – IETF RFC 3492, Punycode-algoritmen för IDN.