Trykk “Enter” for å komme videre

Næste generation af søgemaskiner

Jens Ulrik Lange er partner i Overskrift.dk, der udbyder søgning i og monitorering af danske blogs. Han er uddannet datamatiker, og har gennem de sidste 12 år fungeret som IT projektleder og programmør – størstedelen indenfor web-projekter. Fritiden går med familien, der består af 2 mennesker (snart 3) og en hund, samt trommeslagning i et band der på 10. år forsøger at finde sin form.Vi bad Jens Ulrik Lange give sit bud på den næste generation af søgemaskiner:

Egentlig kunne titlen have været “Søgemaskine 2.0”, men principielt mener vi at det er misforstået og i værste fald begrænsende, at sætte et statisk versionsnummer på en lang række teknologier og metoder, som er i rivende udvikling. Ikke desto mindre må vi, på Overskrift.dk, nok erkende at vi rider på bølgen, der af nogen benævnes Web 2.0; Vores mission er at præsentere hvad Doc Searls kalder ”The Live Web” – et internet, der selv kan fortælle hvordan det ser ud lige nu. Spørgsmålene kan være: ”Hvad skrives der lige nu om mig, min virksomhed, min direktør, min konkurrent etc.”. Disse spørgsmål blev en gang besvaret ved at foretage en søgning på Google, hvorefter resultaterne blev vist i den rækkefølge Googles systemarkitekter valgte – en relevans/popularitets rating bliver benyttet.

Hvis man har haft et ønske om at følge med i hvad der blev skrevet over tid, kunne man tilmelde sig Google Alerts og dermed modtage en mail når Google næste gang fandt noget relevant. Konceptet med søgemaskiner der finder ny information ved at crawle (hente websider en gang imellem for at se om den er opdateret) er ineffektivt. Der bliver brugt en stor mængde overflødig trafik på at hente siderne, selvom de måske ikke er blevet opdateret, og der kan som følge heraf være store tidshuller fra indlæggene publiceres til de kan findes på søgemaskinerne. Primært drevet af weblogs, er en lille bunke teknologier med til at kunne ændre på dette og føre os tættere på ”The Live Web”.

En af disse teknologier benævnes ”Ping”. Når jeg opdaterer min weblog, sender min weblog en kort besked, et såkaldt ping, til søgemaskinen. Beskeden fortæller søgemaskinen at min weblog er opdateret – og søgemaskinen går øjeblikkeligt ud og henter opdateringerne, som bliver søgbare med det samme. Derudover sparer søgemaskinen sig selv for at hente den samme statiske side et par gange om ugen. Med milliarder af websider der skal indekseres, er der rigtig meget maskinkraft at spare. Tilføjes muligheden for at abonnere på søgeord, kan du altså i praksis have et regulært billede af hvad der skrives om dine interesser – uden forsinkelser. Dette er ikke fremtidsmusik, men realiteten lige nu via amerikanske Technorati, der dækker blogs fra hele verden og danske Overskrift.dk der udelukkende har dansk fokus.

Hvad kommer fremtidens søgemaskiner så til at byde på? Et bud er ”relationer”. Vi linker til andre – dels for at kreditere dem for inspiration til vores tankerække, dels for at underbygge vores eget budskab. Hidtil har søgemaskinerne ikke forholdt sig til links – på Google har det altid været muligt at finde ud af hvem der linker til en side – f.eks. ved at søge på link:fremtidensrelationer.dk. Flere indikatorer kan pege på at dette område vil se en kraftig udvikling. Nielsen Buzzmetrics Blogpulse indeholder en såkaldt Conversation Tracker. Det er dels muligt at se hvordan en historie kronologisk er omtalt af forskellige blogs, men det er altså også muligt at kortlægge hvilke weblogs der refererer til andre weblogs. Det er dels interessant fordi det kan hjælpe med at finde hovedkilden til en historie. Men samtidig fortæller det os også hvem der linker til hvem. Vi ved med forholdsvis stor sikkerhed vide at blogger Y læser blogger X’s blog. En anden lidt mere teknisk indikator kan findes i fremkomsten af de såkaldte Microformats. Filosofien bag Microformats er at sætte menneskelæselig information ind i en kontekst der er læselig for maskiner. Lavpraktisk betyder det, at jeg udover at linke til et website, i linket kan angive at dette er et link til en ven, en arbejdsgiver, et familiemedlem, en interessefælle eller noget femte. Vælger jeg at gøre dette, kan næste generation af webbrowsere aflæse denne information og på simpel vis f.eks. tilbyde mig at abonnere på alle nyhedsfeeds fra en weblogs interessefæller.

Søgemaskiner vil kunne kortlægge større interesse- eller andre typer fællesskaber, og fortælle mig hvilke personer eller organisationer jeg kan overveje at kontakte for at udvide mit faglige netværk. Microformats omfatter mange forskellige områder og formater – f.eks. maskinlæsbare CV’er, anmeldelser og meget andet, men i korte træk drejer det sig om at sætte information ind i en teknisk kontekst, så den relevante software kan læse og bruge det. Tilstedeværelsen på nettet kommer efterhånden til at dreje om at fortælle hvem du/din virksomhed/din kunde er, samt hvilke interesser og hvilket netværk i dyrker og hvor i gør det. Det gør det ved at du sætter det i en relation – du fortæller søgemaskinen hvem du er, hvor du er, hvad du laver. På den baggrund vil søgemaskine A kunne hjælpe dine interessefæller med at finde dit website, søgemaskine B vil kunne hjælpe din nabo med at finde din weblog, mens søgemaskine C vil kunne hjælpe andre med samme smag i restauranter om at finde den restaurant du senest har givet gode anmeldelser. Søgemaskinen kommer altså ikke kun til at kunne besvare spørgsmålet om hvordan tingene ser ud lige nu, men i højere og højere grad også hvorfor.

At sætte tingene i kontekst ved at tilføje metainformation kommer ikke kun for til at udvikle sig for ordinære website indlæg. Lægger du i dag dine billeder ud på billeddelingstjenester som f.eks. Flickr, vil dit kamera gemme et tidsstempel, billedets opløsning, information om kameraproducenten og den specifikke kameramodel. Du kan selv vælge om du vil fortælle Flickr hvor billedet er taget, ved at angive længde og breddegrader. Via Google Maps eller Google Earth er det altså muligt at finde en masse billeder taget et specifikt sted. På TED konferencen demonstrerede Microsoft for nyligt sin Photosynth-teknologi – en teknologi der kan pakke 3D-modeller af objekter ind i fotografier, så det er muligt at ”gå” rundt om og indeni objekterne. Ved at udvide mængden af metainformation fra blot et sæt koordinater, til desuden at fortælle hvilken retning kameraet pegede vil ”indpakningen” kunne gøres fuldautomatisk. Det vil blive muligt at opbygge 3D modeller af stort set alle steder i verden, blot nogle amatørfotografer har være forbi og knipset et par billeder – og at deres kamera vel at mærke fortæller detaljeret om position og retning.

Flere mobiltelefoner (med kamera) har efterhånden en GPS-antenne indbygget, ligesom kameraproducenterne lægger GPS-modtagere ind i deres kameraer, så vi er ikke så langt fra at teknikken er på plads. Historien viser at det selvfølgelig ikke er ensbetydende med at alle kommer til at adoptere teknologien, blot fordi den findes. Forudsætningen for at dette bliver en succes er dog ikke så anderledes fra andre teknologier: Det skal blive skrupsimpelt at bruge, og så skal vi også gerne undgå for mange ”format-krige” mellem rivaliserende producenter.