Mākslīgais intelekts Latvijā
Ar neironu tīkliem tulko valodas un šķiro zivis
Latvijā mākslīgo intelektu (MI) pēta un attīsta gan pētniecības institūtos, gan biznesa vajadzībām, attīstot pielietojumus industriālo procesu vadībā zivsaimniecībā, kā arī valodu automatizētas tulkošanas un apstrādes jomā. Būtiska nozīme MI attīstībai gan “tīrā” pētniecība, gan attīstot pielietojumus biznesam ir mašīnmācīšanās.
Juris Kaža
Mākslīgais intelekts (MI) ir aktuāls jēdziens medijos daudzviet pasaulē. Izsakoties ļoti vispārēji, MI atbilst vienam no agrākiem apzīmējumiem datoru sistēmām “tautas valodā” - elektroniskas smadzenes. Tā sauca drēbju skapja izmēra ierīces, kuras sastapa uzņēmumu telpās un pētniecības iestādes jau pēdējā gadsimta 50. un 60. gados. Taču tikai pēdējos pāris gadu desmitos, datorsistēmas ir ieguvušas spējas, kas ir kaut cik līdzīgas īstām smadzenēm, proti, mācīties un mācoties uzlabot savas darbības precizitāti un efektivitāti.
MI attīstībā, īpaši tās apakšnozarē, māšīnmācīšanās (MM), pēdējos gados ir panākumi un attiecīga mediju uzmanība tādiem MM balstītiem risinājumiem kā valodu tulkošana, balss un tekstu apstrāde, industriālu procesu vadībā, satiksmes un sabiedrības drošībā, bezpilota lidaparātu vadīšanā u.c. jomās.
“MI ir plaša zinātnes nozare, kas pastāv jau no pagājušā gadsimta vidus. Tā iekļauj pētījumus par visa veida metodēm, ar kurām datoros, robotos un citās mašīnās radīt inteliģences spējas - uztveri, domāšanu, plānošanu, mācīšanos u.c.,” teica Latvijas Elektronikas un datorzinātņu institūta (EDI) Robotikas un mašīnuztveres laboratorijas vadītājs Dr. Roberts Kadiķis. Dr. Kadiķis skaidroja, ka “pēdējos gados MI joma piedzīvo bumu. Precīzāk būtu gan teikt, ka to piedzīvo viena no MI apakšnozarēm - MM.”
Latvijā aktīvi pēta MI un MM, attīsta jaunus paņēmienus vai noslīpē esošos un komercializē atklājumus un izgudrojumus. Tas notiek Dr. Kadiķa vadītā laboratorijā, kur, kā viņš to raksturo: “Lielākā daļa mūsu pētījumu notiek pētniecības projektu ietvaros. Šādu projektu rezultāts parasti ir jaunas zināšanas publikāciju veidā, vai demonstratori t.i. laboratorijas apstākļos tiek nodemonstrēts, ka, piemēram, robots tiešām atrod kaudzē paceļamu objektu, to paņem, noklasificē un iemet attiecīgajā kastē.”
Māca robotus šķirot zivis un taru
Pavisam praktiskiem savu produktu attīstīšanas mērķiem MM izmanto Latvijas uzņēmums “Peruza”, kas jau teju 30 gadus rūpējas, lai zvejnieku atvestās zivis (vai to sagrieztās daļas) “iemet attiecīgajā kārbā”. “Peruza” ražo zivju apstrādes un konservu pakošanas automatizētas līnijas eksportam uz visu pasauli. Ar Latvija izstrādātām un ražotām zivju konservu līnijām jau sen vietām lielā mērā aizstāts vienmuļš un ne īpaši tīrīgs un patīkams cilvēku roku darbs ar zivju gabaliem un “ķeskām”. To dara “Peruza” sakomplektētas robotu līnijas, kuru vadīšanas programmatūrai tagad māca aizvien (priekš datora) sarežģītākus uzdevums. Pērn demonstrētā Latvijas Televīzijas filmā rādīja, kā “Peruza” robotam māca atpazīt, pacelt un pārvietot lielu zivi (laša maketu) no krustam-šķērsam samestas zivju kaudzes. Robots “mācās” paņemot to, ko tā sensori “saprot” kā zivi un saņemot signālu no cilvēka-trenera vai citas sistēmas, vai izvēle bijusi pareiza. Tādējādi vadības dators, pareizāk sakot, t.s. neironu tīkls, kas elektroniski simulē cilvēka smadzeņu šūnu - neironu uzbūvi, arvien vairāk saprot, kāds priekšmets atbilst “zivij”. Drīzumā šādi roboti varētu aizstāt cilvēku roku darbu Norvēģijas lašu audzēšanas industrijā.Ja ar MM paņēmieniem robota vadības sistēma var pazīt lasi, to tāpat, “barojot” ar citiem datiem, var iemācīt darboties ar dārzeņiem un augļiem. Tā “Peruza” paplašina darbību pārtikas apstrādē ārpus zivju konservu nozares. Ir arī izstrādāts robots, kas iemācīts šķirot stikla un plastmasas taru. To eventuāli varētu pielietot automatizētas depozītu sistēmas ieviešanai Latvijā. Tad, tāpat kā daudzās citās Eiropas valstīs, iedzīvotāji varēs nodot kārbas, stikla un plastmasas pudeles kā pagadās, un depozītu automāts tās “atpazīst” un attiecīgi šķiros.
Ar mašīnmācīšanos uzlabo tulkošanu un apmāca runājošus robotus
Nozare, kur Latvijas uzņēmums “Tilde” tiek pamatoti uzskatīts par vadošu MI un MM pielietošana ir t.s. valodu tehnoloģija. Jēdziens ietver mašīntulkošanu, sarakstes ikdienas valodā saprašanu, balss atpazīšanu un atdarināšanu lasot ievadītus tekstus, ka arī kombinējot visas šīs mākas t.s. klientu apkalpošanas robotos. Viens tāds robots, kustīgs jaunas sievietes attēls ekrānā, kas saprot un atbild angļu valodā, kalpo pieņemot cilvēkus “Tilde” mājas foajē Rīgā.“Tildes” Mākslīgā intelekta attīstības vadītājs un pētnieks Mārcis Pinnis skaidroja: “Mēs “Tildē” mašīnmācīšanās metodes izmantojam, lai izstrādātu lielu daļu valodas tehnoloģiju un produktu. Pēdējo piecu gadu laikā mašīnmācīšanās jomā lielai daļai uzdevumu mēs lietojam dažādu veidu dziļos neironu tīklus. Piemēram, mašīntulkošanas sistēmu, runas atpazīšanas sistēmu, runas sintēzes sistēmu, virtuālo asistentu dabiskās valodas sapratnes modeļu apmācībai izmantojam dziļos neironu tīklus”.
Pinnis arī stāstīja, ka, lai “Tildes” valodu risinājumi darbotos un vispār būtu iespējami, ir jāprot ne tikai šo neironu tīklu programmēšana, bet arī jāzina daudz par attiecīgo valodu struktūru, gramatiku, vārdu formām u.c., lai MM process notiktu jēgpilni. “Ja mums ir zināms vārdnīcas ieraksts tulkošanai no angļu uz latviešu valodu, mums nepietiek, ka mēs zinām vārda tulkojuma vārdnīcas formu, lai to varētu pareizi ielabot tulkojumā. Tas tāpēc, ka latviešu valodā mēs nelietojam teikumos tikai un vienīgi vārdnīcas formas; mums būtu jāzina visi locījumi. Savukārt tad, kad tulko no vācu uz angļu valodu, tas, ka mums ir vārdnīcas forma, lielākajā daļā kontekstu būs pietiekami,” viņš teica.
Būtisks faktors MM pielietošanai ir pieejamo datu kopu daudzums un dažādība. Vienai valodai var pietikt rakstisku datu, vārdnīcu, literārie teksti ar ko apmācīt neironu tīklu, bet pietrūkst balss paraugu attiecīgajā valodā un tās iespējamos dialektos. “Latviešu valodai, piemēram, šobrīd nav neviena runas tulkošanas korpusa, tāpēc mums vēl runas tulkošanas tehnoloģijas nav attīstītas. Latviešu valodai nav arī “Siri”, “Alexa”, “Cortana” (visi ar runu darbināmi palīgi) analogu, jo šādu tehnoloģiju izstrāde prasa ļoti lielus datu apjomus. Tomēr, mums ir fokusēti un jomām pielāgoti tērzēšanas boti (piem., Covidbots, uzņēmuma reģistra palīdze Una, un Valsts Ieņēmumu dienesta robots Toms, u.c.), kuru izstrādei ir nepieciešams būtiski mazāks datu apjoms,” stāstīja Pinnis.
Tomēr “Tildes” speciālists norādīja, ka arī bez latviešu “Siri” versijas valodas tehnoloģiju kompānijai ir ar ko lepoties. “Mūsu neironu mašīntulkošanas tehnoloģijas ir mūsu veiksmīgākais valodas tehnoloģiju eksporta produkts. Mēs ar mašīntulkošanas tehnoloģijām esam atbalstījuši jau astoņas Eiropas Savienības Padomes prezidentūras (plašāk par Prezidentūras tulkotāju ir pieejams: presidencymt.eu un Vācijas prezidentūras mājaslapā), kā arī sniedzam konsultācijas un atbalstām ar datiem un dažādiem risinājumiem mašīntulkošanas risinājumu izstrādē Eiropas Komisiju,” Pinnis klāstija e-pastā.
MI laboratorijas vadītājs Dr. Kadiķis stāstīja, ka neironu tīklu bums, kuriem patlaban rodas aizvien lielāks pielietojums, radies dažu informācijas tehnoloģiju jaunumu ietekmē. “Tīklu ideja nav jauna, bet tie sāka pārsteidzoši labi darboties, kad pētniekiem parādījās pieeja pie diviem jauniem elementiem - lieliem datiem, uz kuriem tīklus apmācīt, un lieliem, viegli izmantojamiem skaitļošanas resursiem (grafiskajiem procesoriem jeb videokartēm), ar kuriem šos tīklus apmācīt,” pētnieks skaidroja. Ar t.s. “dziļiem” neironu tīkliem EDI darbojas kopš 2014. gada.
MI sistēmas jāpieradina pie haosa un jāsaprot ko tās īsti “domā”
Vaicāts kādas vēl daļēji vai pilnībā neatrisinātas MI problēmas viņa laboratorija un EDI pēta, Dr. Kadiķis nosauca vairākas:- Robotu darbošanās neparedzētos, haotiskos apstākļos.
“Mūsu pētījumos mēs darbojamies ar objektiem, kas haotiski sabērti kaudzēs. Papildus izaicinājums ir tas, ka objekti savā starpā var būt līdzīgi, un datorredzes algoritmiem jāspēj izšķirt, kurš no objektiem katrā brīdī ir ērti paņemams un nav daļēji aizklāts ar tāda paša vai līdzīga izskata objektiem,” viņš stāstīja, norādot ka šie pētījumu noder, piemēram, taras un kārbu šķirošanai un citiem pielietojumiem. - Datu problēma, kas skar autonomu automašīnu vadības sistēmas apmācību.
Patlaban to cenšoties darīt neironu tīklam rādot video no īstu braucošu mašīnu redzesloka, taču tur “ar roku” jāmarķē būtiski priekšmeti - koks, gājējs, siena, malā stāvoša mašīna u.tml. “Viens no ceļiem, ko iet arī EDI, ir sintētisku datu ģenerēšana un lietošana. Skatoties uz filmu un datorspēļu attīstību, datorgrafika strauji uzlabojas un kļūst arvien līdzīgāka dzīvei. Virtuālajā pasaulē nav problēmu ar datu marķēšanu, jo katram objektam jau ir definēta tā precīza atrašanās vieta šajā virtuālajā pasaulē,” stāstīja Dr. Kadiķis. - Izskaidrojams MI.
MI risinājumi izmantojot MM un neironu tīklus bieži sniedz apbrīnojami labus rezultātus, kaut vai medicīniska diagnostika ar mašīnredzi pētot ādas anomālijas, taču bieži nav saprotams kas noticis MI “melnā kastē”. “Neironu tīkls var noklasificēt ādas veidojumu par ļaundabīgu, bet mēs nedabūsim atbildi uz jautājumu - kāpēc tas tā domā, vai pēc kādiem parametriem tas vadījies sniedzot šādu diagnozi,” laboratorijas vadītājs teica un norādīja ka “Tāpēc šobrīd pasaulē ļoti dinamiska joma, kuru pēta arī EDI, ir izskaidrojamais mākslīgais intelekts (explainable AI jeb xAI), kas tomēr ļautu gūt atbildes vai norādes uz to, kas konkrēti ieejas datos ietekmējis MI pieņemto lēmumu.” - Iegulta inteliģence.
Kā skaidro Dr. Kadiķis, EDI cenšas izstrādāt īpašu ar MI un MM spējām jau aprīkotu jeb iegulētu mikroprocesora dizainu, kas darbotos ar zemu elektrības patēriņu portatīvas un kustīgas platformās, piem. telefonos, dronos, vai citas iekārtās kur procesors nav pastāvīgo pieslēgts strāvai.