Latviešu valodas runas atpazīšanas diktēšanas sistēmas risinājuma izstrāde sociālo pakalpojumu jomā kvalitātes un pieejamības nodrošināšanai

IT kompetences centrs īsteno projektu “Informācijas un komunikācijas tehnoloģiju kompetences centrs”, id. Nr. 5.1.1.2.i.0/1/22/A/CFLA/008.

Projekta “Informācijas un komunikācijas tehnoloģiju kompetences centrs” mērķis ir paaugstināt informācijas un komunikācijas tehnoloģiju (IKT) nozares komersantu konkurētspēju, sadarbībā ar zinātniskajām institūcijām līdz 2025. gada 30. jūnijam īstenojot vismaz 12 nozares un starpnozaru pētījumus Biznesa procesu analīzes tehnoloģiju un Dabīgās valodas tehnoloģiju jomās, lai to rezultātā vismaz 10 komersanti attīstu un ieviestu ražošanā jaunus produktus un tehnoloģijas.

SIA “ZZ Dats” sadarbībā ar SIA “RGP” un SIA “Rehabilitācijas centrs “Tērvete”” turpina īstenot pētniecības projektu Nr.2.3 “Latviešu valodas runas atpazīšanas diktēšanas sistēmas risinājuma izstrāde sociālo pakalpojumu jomā kvalitātes un pieejamības nodrošināšanai” IT Kompetences centra Projekta Nr. 5.1.1.2.i.0/1/22/A/CFLA/008 ietvarā.

Laika posmā no 01.04.2024. līdz 30.06.2024. ir veikta risinājuma arhitektūras projektējuma izstrāde, kā ietvaros ir veiktas šādas darbības:

  • Tirgus, biznesa vajadzību definēšana;
  • Pakalpojuma sniedzēja praktiskās pieredzes un vajadzību sociālo pakalpojumu sniegšanas jomā apzināšana;
  • Risinājuma aizmugursistēmas projektējuma izstrāde;
  • Risinājuma lietotājsaskarsnes projektējuma izstrāde;
  • Runas atpazīšanas API projektējuma izstrāde;
  • Valodas un akustikas mašīnmācīšanās modeļu alternatīvu izvēle, atbilstoši definētajām prasībām.

Iegūtās zināšanas tiek tālāk izmantotas Risinājuma implementācijā un validācijā reālās darbības vidē.

Paralēli ir uzsākta un tiek turpināta mašīnmācīšanās un rezultātu novērtēšanas datu kopu izveide, kuru plānots ir pabeigt līdfz 30.09.2024. Aktivitātes ietvaros tiek veikta tekstu arhīva apkopošana un anonimizācija, kas sevī ietvers tekstu izguvi no atskaišu arhīva, personas datu (vārds, uzvārds, personas kods, adreses, u.c.) identificēšanu un dzēšanu. Tiek nodrošināta teksta korpusa sagatavošana nozarspecifiskai valodas modelēšanai (t.sk. teksta pēcapstrādei) un runas korpusa izveide pielāgota runas atpazīšanas modeļa izveidei, kas sevī ietvers runas paraugu ortogrāfisko transkribēšanu, skaitļu, saīsinājumu un citu teksta elementu apstrādi, audio ierakstu un transkripciju segmentēšanu, teksta strukturēšanu, un ko nodrošinās ārpakalpojumā piesaistītā zinātniskā institūcija.

Projekts tiek īstenots Latvijas Atveseļošanas un noturības mehānisma plāna 5.1.r. reformu un investīciju virziena “Produktivitātes paaugstināšana caur investīciju apjoma palielināšanu P&A” 5.1.1.r. reformas “Inovāciju pārvaldība un privāto P&A investīciju motivācija” 5.1.1.2.i. investīcijas „Atbalsta instruments inovāciju klasteru attīstībai” darbības programmas ietvaros.

Projekta kopējās izmaksas: 230 985,76 EUR, plānotais atbalsts 153 238,53 EUR. Projekta īstenošanas ilgums 12 mēneši: no 01.04.2024. līdz 31.03.2025.

Citi raksti

Par informācijas drošības incidentu

Laikā no 2024. gada 29. oktobra līdz 2. novembrim atsevišķām personām, bija izdevies piekļūt meklēšanas indeksam, uz kura tika dublēti neliela daļa datu no Vienotās pašvaldību informācijas sistēmas.