Каталогавы пошук SLUBsemantics «Мы хочам перамагчы Гугл»

Lesesaal der Sächsischen Landesbibliothek – Staats- und Universitätsbibliothek Dresden (SLUB)
Lesesaal der Sächsischen Landesbibliothek – Staats- und Universitätsbibliothek Dresden (SLUB) | Foto (Ausschnitt): © SLUB

У Бібліятэцы федэральнай зямлі Саксонія – Дзяржаўнай бібліятэцы Універсітэта ў Дрэздэне (SLUB) распрацавалі семантычную тэхналогію – новы від зручнага пошуку ў каталогу. Намеснік генеральнага дырэктара бібліятэкі д-р Ахім Бонтэ распавядае пра перавагі SLUBsemantics.

Спадар Бонтэ, што такое семантычнае сеціва?

д-р Ахім Бонтэ д-р Ахім Бонтэ | © SLUB Апрацоўка электронных дадзеных грунтуецца на бінарнай сістэме. Напрыклад, паслядоўнасць сімвалаў G, o, e, t, h, e можна запісаць з дапамогай нулёў і адзінак. Семантычнае сеціва, так бы мовіць, навучае электронную апрацоўку дадзеных гаварыць.  Гэта азначае, што дадзеныя не толькі апрацоўваюцца адно на камп’ютарах, але звязваюцца з кантэнтам. Ствараецца семантычная сетка па пэўным паняцці, да яе дадаюцца іншыя паняцці. Усё гэта адбываецца з дапамогай пэўнай апісальнай мовы – Resource Description Framework (RDF).  Усё гэта вядзе да таго, што камп’ютар ведае, якое значэнне мы звязваем з наборам сімвалаў Goethe, а менавіта: літаратар 18 ст., які напісаў «Фауста».

Шматмоўны і адназначны пошук

Разам з нядаўна заснаванай фірмай «Авангард лэбз» ваша бібліятэка распрацавала семантычны пошук у каталогу. Чым адрозніваецца SLUBsemantics ад традыцыйнага каталога?

Наш пошук шматмоўны. Калі Вы, напрыклад, будзеце шукаць Automatikgetriebe, то знойдзеце вынікі на англійскай і польскай мовах. Акрамя таго, SLUBsemantics перакладае з гутарковай мовы на прафесійную і наадварот. Калі Вы шукаеце Gammelfleisch, то знойдзеце ўсё па тэме «харчовая бяспека». Калі вы будзеце шукаць Adipositas, то атрымаеце вынікі па тэмам «павышаная вага» і «схільнасць да атлусцення». Такое немагчыма ў выпадку аднабаковага прыблізнага пошуку ў звычайным каталогу.

А яшчэ SLUBsemantics вырашае праблему моўнай шматзначнасці. Калі вы шукаеце Python, то можаце мець на ўвазе змяю, мову праграмавання альбо калектыў комікаў Monty Python. Звычайныя каталогі прапануюць усе вынікі разам, а ў нас яны сартуюцца па рубрыках «біялогія», «інфарматыка» і «кіно».
 
Відэа: Пошук у каталогу SLUBsemantics

SLUBsemantics baut auf bereits vorhandenen Konzepten auf …

SLUBsemantics грунтуецца на ўжо існуючых канцэпцыях…

Так, мы карыстаемся досведам, які ўжо існуе. Напрыклад, Вікіпедыя дае нам магчымасць рабіць пераклад. Мы распрацавалі метад, з дапамогай якога нашы запыты параўноўваюцца з артыкуламі Вікіпедыі. Там апісваюцца значэнні, там мы атрымліваем шматмоўе. Потым усё параўноўваецца з нашымі фондамі.

Ідэальны артыкул з энцыклапедыі

Як вы плануеце развівацца далей?
 
Што тычыцца Вікіпедыі, то мы выкарыстоўваем яе як сховішча дадзеных. Хаця яно і вялікае, але ўсё-ткі мае межы. Таму сёння ў межах праекта d: swarm мы спрабуем сабраць разам крыніцы дадзеных рознага паходжання. Мы збіраем інфармацыю, зводзім яе разам і ў выніку атрымліваем інтэграваныя і ачышчаныя ад неістотнай інфармацыі дадзеныя – ідэальны артыкул для энцыклапедыі. Наступны крок – атрымаць больш дакладныя звесткі і не быць пры гэтым перагружаным неістотнай інфармацыяй.
 
Вы хочаце быць лепшымі за Гугл…
 
Так, хай сабе гэта, можа быць, і гучыць даволі нацягнута. Наша перавага палягае ў тым, што мы расцём не ў шырыню, а ў глыбіню. Гуглу неабходна знайсці такія рашэнні, якія б падышлі ўсім і якія можна было б выкарыстоўваць паўсюль. Нашы паслугі пакуль што прызначаюцца для тутэйшай мэтавай аўдыторыі. Наша асноўная група карыстальнікаў – гэта не мільярды людзей, а каля 80.000 асобаў. І мы ведаем, з каго складаецца наша мэтавая аўдыторыя. Таму мы можам працаваць з больш тонкім інструментамі, чым Гугл, можам канцэнтравацца на пэўных гатунках дадзеных і прафесійных мовах. Урэшце: так, мы хацелі б абслугоўваць нашых карыстальнікаў лепш, чым гэта робіць Гугл.

Паслугі, якія карыстаюцца попытам

Ці зацікавіліся іншыя бібліятэкі вашымі распрацоўкамі?

Так, у цяперашні момант Брытанская бібліятэка тэстуе прататып, які грунтуецца на нашай тэхналогіі. А мы праводзім кансультацыі з іншымі буйнымі бібліятэкамі Германіі і Еўропы. Напрыклад, мы вядзем перамовы з Нямецкай нацыянальнай бібліятэкай ў Лейпцыгу і Франкфурце-на-Майне – яна распрацоўвае канцэпцыю Нямецкай электроннай бібліятэкі – а адтуль зусім недалёка да Еўрапеаны.
 
Як будзе развівацца семантычнае сеціва ў бібліятэках у будучыні?
 
Я лічу, што бібліятэкам трэба ісці далей па гэтым шляху. Нам неабходна разглядаць Гугл, Флікр ды іншыя прадукты інтэрнэт-індустрыі ў якасці ўзораў і вырашаць, што мы можам рабіць лепш. Нягледзячы на тое, што ў эканамічным плане мы не канкуруем з гэтымі кампаніямі,  мы, тым не менш, працуем на рынку прапаноў і попыту. Кожная бібліятэка павінна быць у стане адказаць на пытанне, дзеля чаго яна існуе – сёння, праз дзесяць і праз дваццаць гадоў. І калі гаварыць пра невялікую гарадскую бібліятэку, то адказы выглядаюць, вядома, інакш, чым у выпадку такога буйнога сховішча, як Бібліятэка федэральнай зямлі Саксонія – Дзяржаўная бібліятэка Універсітэта ў Дрэздэне.