DE1086 Mašīnmācīšanās tekstuālo datu apstrādei

Kods DE1086
Nosaukums Mašīnmācīšanās tekstuālo datu apstrādei
Statuss Obligātais/Ierobežotās izvēles; Brīvās izvēles
Līmenis un tips Pamatstudiju, Akadēmiskais
Tematiskā joma Datorika
Struktūrvienība Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Mācībspēks Oksana Ivanova, Sintija Petroviča-Kļaviņa
Kredītpunkti 3.0
Daļas 1
Anotācija Studiju kurss sniedz ieskatu jēdzienos, izaicinājumos un iespējās, kas saistītas ar tekstuālo datu apstrādi, izmantojot mašīnmācīšanās rīkus. Studiju kursa laikā studējošie attīsta kompetenci lietot un pielāgot mašīnmācīšanās metodes tekstuālo datu apstrādei. Studējošie apgūst, kā validēt, segmentēt un atkārtoti izmantot tekstuālo datu analīzes rezultātus, izmantojot piemērotas mašīnmācīšanās metodes. Studiju kursa pamataktivitātes ietver teksta/korpusa pirmapstrādi un attēlojumu, sentimenta analīzi, tekstizraci, vizualizāciju, kā arī ievadprocesus mašīntulkošanā, dabiskās valodas ģenerēšanā (DVĢ) un dabiskās valodas apstrādē (DVA). Studējošie strādā ar mūsdienīgiem digitāliem tekstiem (tostarp multimodālos kontekstos) un risina ētikas, drošības un ilgtspējas jautājumus datu vākšanā, apstrādē un attēlošanā..
Studiju kursa saturs
Saturs Pilna un nepilna laika klātienes studijas Nepilna laika neklātienes studijas
Kontaktstundas Patstāvīgais darbs Kontaktstundas Patstāvīgais darbs
Ievads tekstuālo datu jomā. 3 4 0 0
Teksts kā dati un ētikas normas (tekstu tipi, korpusi, metadati, licencēšana, privātums, neobjektivitāte un atkārtojamība). 2 4 0 0
Teksta pirmapstrādes paņēmieni. 3 5 0 0
Dabiskās valodas apstrādes izaicinājumi. 4 6 0 0
Kvantitatīvās pieejas tekstuālo datu analīzei. 3 5 0 0
Neuzraudzīta mašīnmācīšanās: metodes tekstuālo datu apstrādei. 3 4 0 0
Kvalitatīvās pieejas tekstuālo datu analīzei. 3 4 0 0
Uzraudzīta mašīnmācīšanās: no iezīmēm līdz transformatoriem. 3 4 0 0
Transformatori un lielie valodas modeļi. 3 4 0 0
Progresīvas teksta apstrādes lietojumprogrammas: multimodāla dabiskās valodas apstrāde. 3 5 0 0
Pārbaudes darbi. 2 4 0 0
Kopā: 32 49 0 0
Mērķis un uzdevumi, izteikti
kompetencēs un prasmēs
Studiju kursa mērķi: - veidot studējošo konceptuālu izpratni par galvenajiem jēdzieniem, izaicinājumiem un iespējām tekstuālo datu apstrādē, izmantojot mašīnmācīšanās metodes; - attīstīt studējošo praktisku kompetenci izvēlēties, pielietot un pielāgot mašīnmācīšanās metodes digitālajiem tekstiem (tostarp multimodālos kontekstos); - veicināt studējošo atbildīgu praksi, visā darba plūsmā integrējot validāciju, atkārtotu izmantojamību, kā arī ētikas, drošības un ilgtspējas apsvērumus. Studiju kursa uzdevumi: - veidot studējošo kompetenci tekstuālo datu apstrādē un strukturēšanā, ar uzsvaru uz datu attēlošanu un rezultātu vizualizāciju; - eksperimentēt ar plašu mašīnmācīšanās metožu klāstu un pielāgot tās problēmas kontekstam; - nodrošināt studējošajiem pamatzināšanas sentimenta analīzē, tekstizracē, kā arī ievadprocesos mašīntulkošanā/DVĢ/DVA; - iepazīstināt studējošos ar progresīvām un jaunradītām mašīnmācīšanās lietojumprogrammām tekstuālo datu apstrādē.
Sasniedzamie studiju
rezultāti un to vērtēšana
Spēj apliecināt izpratni par tekstuālo datu apstrādes izaicinājumiem un iespējām, izmantojot mašīnmācīšanās rīkus. - Praktiskie uzdevumi, pārbaudes darbi. Tiek novērtēta studējošo spēja apstrādāt tekstuālus datus, izmantot mašīnmācīšanās rīkus.
Spēj veikt teksta korpusu apstrādi un analīzi (tīrīšanu, tokenizāciju, normalizāciju, marķēšanu/anotēšanu). - Praktiskie uzdevumi, pārbaudes darbi, eksāmens. Tiek novērtēta studējošo spēja apstrādāt un analizēt teksta korpusu.
Spēj apliecināt izpratni par uzraudzītas un neuzraudzītas mašīnmācīšanās principiem. - Praktiskie uzdevumi, eksāmens. Tiek novērtēta studējošo izpratne par dažādiem mašīnmācīšanās principiem.
Spēj pielietot DVA, DVĢ un sentimenta analīzes pamatprincipus, lai risinātu dažādus ar datu analītiku saistītus uzdevumus. - Praktiskie uzdevumi, eksāmens. Tiek novērtēta studējošo spēja risināt dažādus ar datu analītiku saistītus kontekstuzdevumus.
Spēj apliecināt izpratni par progresīviem mašīnmācīšanās pielietojumiem tekstuālo datu apstrādē. - Praktiskie uzdevumi, pārbaudes darbi. Tiek novērtēta studējošo spēja izmantot jaunākus mašīnmācīšanās rīkus tekstuālo datu apstrādē.
Studiju rezultātu vērtēšanas kritēriji
Praktiskie uzdevumi - 40%
Pārbaudes darbi - 30%
Eksāmens - 30%
 
Priekšzināšanas Angļu valodas zināšanas B2 līmenī, saskaņā ar Eiropas kopīgajām pamatnostādnēm valodu apguvei, ja studiju kurss tiek apgūts angļu valodā.
Studiju kursa plānojums
Daļa KP Stundas Pārbaudījumi Pārbaudījumi (brīvai izvēlei)
Lekcijas Prakt. d. Lab. Ieskaite Eksāmens Darbs Ieskaite Eksāmens Darbs
1 3.0 16.0 16.0 0.0 * *

Pieteikties uz šo kursu

[Kursa apraksts PDF formātā]