24. januar 2011

O konceptih, ne le besedah

[Prispevek je bil predhodno objavljen v Knjižničarskih novicah]

Tokrat se v svojem povabilu k branju z veseljem vračam k založbi Chandos, ki s svojo serijo Chandos Information Professional Series zagotovo predstavlja enega od vrhuncev sodobne strokovne bibliotekarsko-informacijske literature. Pred seboj imam leta 2008 izdano delo avtoric Brandy E. King in Kathy Reinold, ki bi v ohlapnem prevodu nosilo naslov Najti pojem, ne le besedo (King, Brandy E. and Reinold, Kathy: Finding the concept, not just the word: a librarian's guide to ontologies and semantics, Oxford, England: Chandos Publishing, 2008). V spodnjih vrsticah na kratko predstavljam osnovne poteze dela in teme.

Knjiga je rezultat nekajletnega avtoričinega dela pri Centre of Media and Child Health in v osnovi prikazuje možnosti in implikacije, ki jih ima lahko prihodnost iskanja informacij v računalniških poizvedovalnih sistemih. Pri tem ne gre zgolj za prihodnost kot generičen pojem, temveč povsem za konkretno, t.i. vlogo semantike v poizvedovanjih. Gre torej za proces, ki bi mu uspelo absolvirati od navezanosti na zgolj preučevanje sintakse in različnih kombinacij vtipkanih znakov, ki tvorijo poizvedbo. Ali drugače – gre za to, ali in kako lahko računalniški poizvedovalni sistem naše poizvedbe dojame drugače kot serijo oz. zaporedje znakov, torej kot nekaj, kar ima pomen in kontekst.

Na vsak način gre tukaj za vsebine, ki močno spreminjajo teorijo in prakso iskalnega procesa in vse skupaj je še toliko bolj zanimivo za profesionalno angažirane informatorje in referenčne knjižničarje, ki z informacijskim opismenjevanjem in drugovrstno podporo učnemu procesu z uporabniki delijo informacijski vsakdan. Vse to je avtorica v knjigi lepo obrazložila.

Kakšna je torej osnova? Knjižničarji so znotraj svojih zadolžitev v odnosu do razrešitve uporabnikove informacijske potrebe poleg vsega ostalega za svoj uspeh predvsem dolžni postaviti to potrebo v odnos do širših kategorij vsebinske in formalne narave. To ne pomeni nič drugega kot dati kontekst formulacijam (te) informacijske potrebe. In to je osnova semantike, o kakršni je tu govor. Knjižničar je pogosto v vlogi prevajalca, ki preoblikuje informacijsko potrebo uporabnika v iskalno strategijo, ki bo vrnila rezultate. Kaj če bi to lahko storil iskalni mehanizem sam? Oziroma, kaj če bi iskalniki razumeli koncepte/kontekste v vprašanju, ki bi ga uporabnik vnesel v svoji naravni govorici, namesto da zgolj pregledujejo/primerjajo iskalne termine s svojim indeksom. Uporaba ontologij in semantičnih tehnologij to omogoča.

Delo je razdeljeno na tri glavne razdelke, v katerih se na 200 straneh razteza splošni pregled ontološkega in semantičnega spleta, zgodovina ontologij in njihove podobnosti/razlike do drugih struktur – slovarji, tezavri in taksonomije; prikaz razvoja ontologije od spodaj navzgor, kupčkanje pojmov in strukturiranje slednjih v kategorije ter dodajanje povezav. Prikazan je tudi podroben princip delovanja semantičnih tehnologij in postopek kako iskalnik vnos iskalne zahteve v naravni govorici pretvori v strojno razumljiv jezik. To teorijo podpirajo štiri študije primerov, kako semantična tehnologija rešuje probleme v različnih industrijah. Na koncu sledijo vprašanja o izzivih za prihodnost in bodoči vlogi knjižničarjev. Tako imamo – tudi z bogatim naborom literature, urejenim stvarnim kazalom, naborom priloženih povezav in izjemno berljivo razlago osnovnih konceptov – pred sabo zopet izvrstno čtivo, ki prihaja v pravem trenutku in ga z veseljem priporočam v branje.

Branje bo dobrodošlo za vse, ki se ukvarjate z različnimi vidiki izgradnje podatkovnih baz in iskanjem informacij. Še posebno za tiste, ki vas zanima prihodnost. Kar največjemu številu bi priporočil branje prvega dela, kjer avtorica govori o razumevanju ontologij. Strojno dojemanje simbolov in znakov je seveda drugačno kot človekovo. Že Ferdinand Saussure (Saussure, Ferdinand: Predavanja iz splošnega jezikoslovja, Ljubljana: ISH Fakulteta za podiplomski humanistični študij, 1997) je v prejšnjem stoletju natančno razdelal teorijsko ogrodje znakov v najbolj temeljni strukturi. In v njegovem osmišljanju vidimo, da je v samo osnovno strukturo znaka postavil njegovo relacijo do svoje okolice. Gre za tako imenovano negativno strukturo znaka, po kateri je znak natanko tisto, kar ni njegova okolica. In bistvena je povezava, ki je vpisana v samo strukturo nekega znaka. Tega torej samega na sebi ni. Bistvena je relacija. In preučevanje relacij, ne le znakov na sebi, je tisto, pri čemer gre za semantiko. In v osrčju semantike so ontologije. Prav ontologije omogočajo tako hierarhične in sinonimne strukture razmerij med pojmi kot tudi neštevna povezovanja med njimi. In zaokroženost teh relacij se strne v pojem.

Pri tem je pomembno, da vemo, da gre za bistveno nadgradnjo vseh do sedaj uporabljenih iskalnih orodij, kot so slovarji, tezavri, taksonomije… Ti ne ponujajo hkrati opredelitev, razmerij in klasifikacij v istem trenutku. To je naloga ontologij. Le-te namreč omogočajo povezovanje konceptov na različnih nivojih. V tem smislu gre torej za premik na vsebinski ravni, ki napravlja močne spremembe v življenju iskalcev informacij.

Stanje v spletu je še vedno precej kaotično. In kot v svoji knjigi Iskanje poudarja John Battelle (Battelle, John: Iskanje: kako so Google in njegovi tekmeci na novo napisali pravila posla in preoblikovali našo kulturo, Ljubljana : Pasadena, 2010), se prava spletna vojna v odvija v tekmi za učinkovito serviranje relevantnih podatkov. In pri tem v nobeni fazi ne gre brez konkretnih izzivov, ki jih ob koncu predstavlja tudi avtorica naše knjige. Popolnoma na mestu je tudi vprašanje, kakšna bo v resnici vloga knjižničarja, če bodo ontologije in semantična iskanja omogočale uporabo naravne govorice v poizvedovalnih sistemih? Knjižničarji kot posredniki med znanjem in uporabnikovo potrebo v tem kontekstu v resnici izostanejo. Ali pač ne. Pri izgradnji in vzdrževanju teh ontologij bo potrebna izjemna natančnost, poznavanje podatkov in uporabnikovih iskalno-vedenjskih navad. Zapletlo se bo v prvi vrsti pri standardizaciji oznak v ontologijah. A vseeno, v smislu zgoraj zapisanega avtorica dokaj brez zadržkov agitira k aktivni vključenosti knjižničarjev v prihajajočo prisotnost spletne semantike.

In čeprav vse kaže na (ponovno prihajajoč?) razkorak med uporabniki, ki so s pomočjo folksonomij in vključenostjo v izgradnjo spletnega znanja že močno vajeni te svoje vpletenosti in med izdelovalci ontologij, ki (kot kaže) bodo morali delovati zaprto, natančno in strokovno, gre tu vseeno za novo poglavje v informacijski družbi. Ne glede na to, kdaj dejansko pride. A (tudi) zaradi objave te knjige nimamo več izgovora, da so nas spremembe ujele nepripravljene.

V preizkus in izobraževanje avtorica predlaga naslednja spletna orodja:

Cognition: http://www.cognition.com/
EasyAsk: http://easyask.com/
Lexalytics: http://www.lexalytics.com/
Linguamatics: http://www.linguamatics.com/
TextPresso: http://www.textpresso.org/

20. januar 2011

Veselje in sreča ob uporabi spletnih katalogov knjižnic po Evropi

Danes sem imel neznansko srečo, da sem lahko po nekaj časa zopet uporabljal pestre spletne kataloge večinoma nacionalnih knjižnic v Evropskem prostoru. Če lahko tudi Rusijo štejemo sem. Šlo je za to, da se dobil relativno preprosto vprašanje, ki se je nanašalo na iskanje prevodov in izdaj nekega klasičnega ameriškega avtorja iz prejšnjega stoletja. Omejitve so bile le avtorjevo ime in da je prevod iz 2007 ali mlajši. Zelo enostavno pač. Glede na to, da smo že nekaj časa izven dobe kataložnih listkov in da se avtomatično zapise nacionalnih bibliografij ali popise zalog nacionalnih (tudi večine drugih glavnih knjižnic) izdeluje računalniško in so tako dostopni na t.i.OPACih. Že res, ampak, veselje ob tem spoznanju takoj zbledi, ko ugotoviš, da se je potrebno pri določenih državah pošteno namučiti, ker so njihovi uporabniški vmesniki jezikovno prilagojeni zgolj in samo njihovem nacionalnem jeziku.

Vem, lahko bi si v marsičem pomagal z združevalnimi iskalniki, kakšen je TEL, vendarle pa sem ugotovil, da slednji občasno ne deluje ravno brez težav in zato se v resnici raje - tudi zaradi občutka točnosti - obrnem na spletne možnosti ki jih imajo nacionalke na voljo.

Pomagam si lahko z različnimi spletnimi mesti, ki jih lahko kot portale uporabljam za dostop do spletnih strani nacionalnih knjižnic. Eno takšnih je www.nationallibraries.org. Na sporedu sem imel Češko, Slovaško, Poljsko, Madžarsko, Rusijo in Hrvaško. Z lahkoto sem podatke našel za Češko, Poljsko, Hrvaško (čeprav je pri njih prisoten problem neenotnosti knjižnic, npr. lahko si ogledate, koliko različnih skupnih/vzajemnih katalogov premorejo - na strani Inštituta Ruđer Bošković); malce več težav sem imel s Slovaško in Madžarsko, a absolutna zmagovalka je še vedno Rusija.

In on neuspešnih poizkusih v njihovem opacu nisem pridobil želje po znanju ruskega jezika. Bolj sem presenečen nad nedostopnostjo, ki si jo s svojim katalogom ustvarjajo. A sem v končni fazi uspel. In dobil potrditev, da se ne gre zanašati na OCLCjev WorldCat, čeprav je večkrat zelo zelo uporaben. Število prevodov, ki sem jih našel zavedenih na WorldCatu v okviru zgoraj omenjenih pogojev, je bilo 1. Natanko en sam prevod je naveden. V ruskem katalogu, kjer sem sicer za podatek porabil skoraj pol ure, sem jih našel 11 (enajst).

Za hec sem preizkusil tudi Google Book Search, ki pa žal (še) ni dovolj natančen za sistematične poizvedbe.

05. januar 2011

O iskanju

Pred kratkim sem zaljučil z branjem slovenskega prevoda knjige Iskanje. Avtor je John Battelle. Gre za moje pojme izvrstno napisano, mogoče malce slabše prevedeno, ampak izredno berljivo delo o spletnem iskanju, zgodovini spletnega iskanja, Googlu in vseh ostalih gigantov internetne industrije ter prihodnosti, v katero se zadeve nagibajo.

Iskanje je dostopno v marsikateri spletni in fizični knjigarni:
Knjigo sem nekega lepega dne po naključju (kot večino finih stvari) odkril v Konzorciju na oddelku za marketing, kamor grem kot iskalec zanimivosti. Kupil sem jo, kljub temu, da delam v knjižnici in bi si jo lahko izposodil. Pa mi ni problem dati nekaj denarja za dobro knjigo, mi nikoli ni bil. Kakorkoli že, knjigo nujno priporočam vsem, ki bi radi nekaj malega uvida v zgoraj navedene fenomene in bitke za prevlado, inovacije in zaslužek na spletu. Sam se jo prebral z užitkom, kot entuzijast in kot profesionalni informator obenem. Iz nje sem se naučil ogromno in nekaj tega bi z veseljem delil tudi z drugimi. Nasploh sem bil fasciniran nad povezavo (do sedaj bržkone ene bolj zoprnih bibliotekarskih poglavij) bibliometrije in PageRanka, kar mi do sedaj nikakor ni padlo na pamet. Se pa učim :)

Avtor je znan avtor iz področja spletnih tehnologij in iskanja. Objavlja tudi zanimiv Searchblog in je eden od ustanoviteljev Wired magazine. Biografske zaznamke si preberite na Wikipedii.

vir slike: www.emka.si
Related Posts Plugin for WordPress, Blogger...