22 december 2006

Vad var det jag sa?


Via Framtidstanken läser jag om Pluggd, ett företag som utvecklat en sökfunktion för ljudfiler. Wired har en artikel under rubriken "A Google for Podcasts", de skriver:
"Pluggd has found a way to index podcasts, talk shows and other spoken-word content. The company's service then allows users to search the audio files for specific words. [...] Rather than just reading a transcript of a conversation, you can search for a term and hear it spoken in context by the original speaker in seconds."
För ungefär ett år sedan gjorde jag en konceptskiss för evoicebrain (bilden ovan), ett sökbart fickminne. Tanken var, ja ungefär just detta. Kul att det finns de som gör det på riktigt också, i kommersiell tillämpning. Attans att jag själv inte sprang ner på stan och raggade en affärsängel med såddkapital.

Teknik för ordigenkänning är ingenting jättenytt, CIA har förfinat sina redskap i takt med utvecklingen av det globala avlyssningssystemet Echelon. Men de är strikt bevarade militära hemligheter. Det här får en civil tillämpning, med stora potentiella implikationer: tänk att ha med ett extraminne på varje möte eller varje föreläsning. Aldrig mer behöver det råda oklarheter om vad som egentligen sades, det blir lika lätt att finna ut hur orden egentligen föll som det blir att googla på internet. En lätt skrämmande tanke, att aldrig komma ifrån ett förluppet ord. Men också en attraktiv idé, i synnerhet för oss som har en tendens att blanda ihop fantasiminnen med verkligheten.

Att nå snudd på oändlig lagringskapacitet är en allt mer lösbar utmaning (som den här artikeln spekulerar i: varje sekund av ett liv i en svart låda 2026), i takt med att den lagrade informationsmängden ökar kommer istället frågan om sortering och sökning i informationen bli alltmer avgörande. För vad är poängen med att ha världens största bibliotek om man inte hittar i det?

Sökmotorer av nya slag och med ny komplexitet tillhör också det som tagit de största sprången i web2.0-vågen. Ibland liknar drömmen om den perfekta sökmotorn den religiösa förhoppningen om en maskin/entitet som kan ge svaret på allt:
"The ultimate search engine would understand everything in the world. It would understand everything that you asked it and give you back the exact right thing instantly, you could ask 'what should I ask Larry?' and it would tell you."
En del tycks tro att Google redan idag kan användas på det sättet.

Av framtidens bibliotekarier kan vi förvänta oss smarta datorer med en idag obegriplig processorkapacitet och smarta sökalgoritmer, som hittar precis det man söker i en, med dagens mått mätt, snudd på oändlig informationsmängd. Medan vi väntar på kvantdatorernas genombrott kommer informationsväxlarna fortsätta att utveckla en egen specifik arkitektur. Det här är en av informationsålderns fabriker, Googles datacenter i Dalles, Oregon:

Här matchas varje dygn miljarder sökförfrågningar från hela världen mot indexerade sidor. Hit skickades (möjligen, Google har 450 000 servrar spridda över världen) din sökning efter glöggrecept som genererade den här intressanta länken. De fyra uppstickande tornen i var och en av de två stora byggnaderna är motsvarigheten till fabrikens skorstenar: de är kyltorn som kyler de tiotusentals processorerna.

Andra bloggar om: , , , ,

2 kommentarer:

K sa...

Det är alltid skönt att ha vad-var-det-jag-sa-läge.

Men jag måste protestera mot att du skriver att det är "strikt militära hemligheter" hur taligenkänning fungerar. Det är det inte. Taligenkänning är ett väl utvecklat forskningsområde som på senare år till och med har producerat applikationer som vi använder i vardagen. Ett exempel är ju SJ:s famösa biljettsystem per telefon.

Jag skulle kunna utveckla det här, eftersom jag forskar om informationsåtkomstsystem, men inom textdomänen, och jag tycker att du tar upp ett viktigt område, men nu ska det i stället bakas och kokas och grillas.

Hur som helst, tack för en väldigt bra blogg.

Erik Berg sa...

Hej!

Ja det har varit fullt upp med julmat i dagarna fem.

Taligenkänning är som du säger även civilt utvecklat, många talsvar är imponerande och det känns som om de blir bättre och bättre. Men att söka efter ord och sammanhang i en hel radiosändning eller ännu värre: som Echelon, i hela kakafonin av internationella telefonsamtal, det är ett steg längre än de civila tillämpningar jag sett.

Men, kunskapen finns och det ligger väl inte mer än några år in i framtiden tills dess det finns ett sökfält för att söka efter ord i sändningarna på SR:s hemsida.

Låter som mycket intressant forskning du jobbar med. Bra blogg också!