DE1023 Mašīnmācīšanās tekstuālo datu apstrādei

Kods DE1023
Nosaukums Mašīnmācīšanās tekstuālo datu apstrādei
Statuss Brīvās izvēles
Līmenis un tips Pamatstudiju, Akadēmiskais
Tematiskā joma Datorika
Struktūrvienība Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Mācībspēks Zane Seņko, Tatjana Smirnova, Marina Platonova, Tatjana Menise, Tatjana Kelebeka, Oksana Ivanova, Sintija Petroviča-Kļaviņa
Kredītpunkti 3.0
Daļas 1
Anotācija Studiju kurss piedāvā pirmā cikla augstākās izglītības bakalaura studiju programmu studējošajiem iespēju attīstīt zināšanas, kompetenci un prasmes dažādu mašīnmācīšanās rīku lietošanā un to pielāgošanā tekstuālo datu apstrādei, lai risinātu virkni kontekstuzdevumu nozarē un zinātnēieskaitot korpusa un tekstuālo datu analīzi, datu pirmapstrādi un attēlojumu, sentimenta analīzi un mašīntulkošanas rīku lietošanu. Studējošajiem jāattīsta vispusīga izpratne par mūsdienu multimodālā digitālā teksta būtību, cita starpā ņemot vērā tekstuālo datu vākšanas, apstrādes un attēlošanas ētiskos, drošības un ilgtspējības aspektus. Studējošie gūs pieredzi datu ieguves un tekstizraces pieeju, datu strukturēšanas un datu vizualizācijas metožu praktiskā pielietošanā. Viņi spēs pārbaudīt, segmentēt un atkārtoti izmantot tekstuālo datu analīzes rezultātus, pielietojot atbilstošas mašīnmācīšanās metodes, kā arī attīstīs prasmes kvalitatīvo un kvantitatīvo datu analīzes metožu lietošanā. Pēc studiju kursa pabeigšanas studējošie spēs risināt ierobežotas definīcijas problēmas, demonstrējot digitālo kompetenci un prasmes, kas atbilst vismaz 5.-6. līmenim saskaņā ar DIGICOMP 2.2 (t.sk., dabiskās valodas apstrāde (DVA), dabiskās valodas ģenerēšana (DVĢ), uzraudzīta un neuzraudzīta mašīnmācīšanās tekstuālo datu apstrādei, mašīntulkošanas lietojumprogrammas, progresīvas teksta apstrādes lietojumprogrammas)..
Studiju kursa saturs
Saturs Pilna un nepilna laika klātienes studijas Nepilna laika neklātienes studijas
Kontaktstundas Patstāvīgais darbs Kontaktstundas Patstāvīgais darbs
Teksta būtība. 4 4 0 0
Teksts kā datu kopa: Tekstuālo datu būtība, organizācija un principi. 4 4 0 0
Tekstuālo datu analīzes ierobežojumi. 3 4 0 0
Teksta pirmapstrāde un attēlošana. 4 4 0 0
Tekstuālo datu analīzes kvantitatīvās metodes. 3 4 0 0
Neuzraudzīta mašīnmācīšanās tekstuālo datu apstrādei. 4 4 0 0
Tekstuālo datu analīzes kvalitatīvās metodes. 4 4 0 0
Uzraudzīta mašīnmācīšanās tekstuālo datu apstrādei. 4 4 0 0
Transformatoru modeļi teksta apstrādē. 4 4 0 0
Progresīvas teksta apstrādes lietojumprogrammas. 4 4 0 0
Pārbaudes darbi. 2 0 0 0
Kopā: 40 40 0 0
Mērķis un uzdevumi, izteikti
kompetencēs un prasmēs
Studiju kursa mērķi: - attīstīt studējošo izpratni par automatizētas tekstuālo datu apstrādes iespējām, ierobežojumiem, lietojumprogrammām un to iespējamiem paplašinājumiem; - padziļināt studējošo zināšanas par mašīnmācīšanās rīku piedāvātajām iespējām dažādu tekstuālo datu apstrādes uzdevumu risināšanā; - nodrošināt studējošajiem iespēju apgūt un attīstīt nozarē pieprasītas prasmes tekstuālo datu apstrādē; Studiju kursa uzdevumi: - attīstīt studējošo prasmes tekstuālo datu apstrādē, strukturēšanā un attēlošanā, ieskaitot datu un datu analīzes rezultātu vizualizāciju; - attīstīt studējošo iemaņas, lai meistarīgi lietotu kvantitatīvas un kvalitatīvas tekstuālo datu apstrādes metodes nozares kontekstuzdevumu efektīvai risināšanai; - iepazīstināt studējošos ar DVA, DVĢ, sentimentu analīzes un digitālo stāstījumu veidošanas principiem; - iepazīstināt studējošos ar mašīnmācīšanās lietojumprogrammu paplašinājumiem tekstuālo datu apstrādē (runas atpazīšana, teksta rezumēšana, sarunvalodas mākslīgais intelekts, sarunboti u.c.).
Sasniedzamie studiju
rezultāti un to vērtēšana
Spēj apzināties automatizētas tekstuālo datu apstrādes iespējas, ierobežojumus, lietojumprogrammas un to iespējamos paplašinājumus. - Praktiskie uzdevumi, pārbaudes darbi. Studējošie spēj izvēlēties, pielāgot un izmantot tekstuālo datu apstrādes rīkus ar mašīnmācīšanās funkcionalitāti kontekstuzdevumu risināšanai.
Spēj apstrādāt, strukturēt un attēlot tekstuālus datus dažādu nozares un pētniecības kontekstuzdevumu risināšanai. - Praktiskie uzdevumi, pārbaudes darbi, eksāmens. Studējošie prasmīgi izmanto teksta pirmapstrādes, vārdšķiras marķēšanas, celmošanas un lemmatizācijas metodes un attēlo tekstuālos datus atbilstošā formātā (vektorizācija, vienizcēluma kodējums, Bag-of-Words, N-grammas, TF-IDF).
Spēj meistarīgi pielietot kvantitatīvās un kvalitatīvās tekstuālo datu apstrādes metodes kontekstuzdevumu efektīvai risināšanai nozarē. - Praktiskie uzdevumi, pārbaudes darbi, eksāmens. Studējošie demonstrē spēju piemērot uz biežumu balstītu pieeju, veikt tematu modelēšanu, viedokļu apkopošanu un informācijas meklēšanu, kā arī citus saistītus uzdevumus.
Pārzina DVA, DVĢ, sentimentu analīzes un digitālo stāstījumu veidošanas pamatprincipus un spēj tos izmantot, lai risinātu uzdevumus ar ierobežotu definīciju. - Praktiskie uzdevumi, pārbaudes darbi, eksāmens. Studējošie demonstrē spēju veikt tematisko analīzi, satura analīzi un stāstījuma analīzi un pielietot stāstījuma veidošanas paņēmienus.
Izprot mašīnmācīšanās lietojumprogrammu iespējamos paplašinājumus tekstuālo datu apstrādē un iespējamos scenārijus turpmākai attiecīgo prasmju un iemaņu pilnveidošanai. - Praktiskie uzdevumi, pārbaudes darbi. Studējošie demonstrē prasmi izmantot progresīvus mašīnmācīšanās rīkus (runas atpazīšana, teksta rezumēšana, sarunvalodas mākslīgais intelekts, sarunboti u.c.).
Studiju rezultātu vērtēšanas kritēriji
Praktiskie uzdevumi - 40%
Pārbaudes darbi - 30%
Eksāmens - 30%
 
Priekšzināšanas Angļu valodas zināšanas B2 līmenī, saskaņā ar Eiropas kopīgajām pamatnostādnēm valodu apguvei, programmēšanas pamatprasmes.
Studiju kursa plānojums
Daļa KP Stundas Pārbaudījumi Pārbaudījumi (brīvai izvēlei)
Lekcijas Prakt. d. Lab. Ieskaite Eksāmens Darbs Ieskaite Eksāmens Darbs
1 3.0 20.0 20.0 0.0 * *

Pieteikties uz šo kursu

[Kursa apraksts PDF formātā]