ETH729 Digitālā sentimentu analīze

Kods ETH729
Nosaukums Digitālā sentimentu analīze
Statuss Brīvās izvēles
Līmenis un tips Augstākā līmeņa, Akadēmiskais
Tematiskā joma Datorika
Struktūrvienība Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Mācībspēks Tatjana Kelebeka, Tatjana Smirnova, Zane Seņko, Oksana Ivanova, Alīna Vagele-Kricina, Tatjana Menise, Marina Platonova
Kredītpunkti 2.0 (3.0 ECTS)
Daļas 1
Anotācija Studiju kurss galvenokārt ir vērsts uz padziļinātu un augsti specializētu zināšanu līmeņa kompetenču un prasmju attīstīšanu studentiem, kuri apgūst gan humanitāro zinātņu, gan starpdisciplināro STEM+ balstīto, gan informācijas tehnoloģiju studiju programmas. Studiju kurss paredzēts augstākā līmeņa studiju programmu studentiem ar pamatzināšanām dabiskās valodas apstrādē, kuri vēlas pilnveidot savas kompetences noskaņojuma analīzē un tekstuālu datu apstrādē dažādu ar nozari saistītu lietišķo uzdevumu risināšanai. Studenti mācīsies klasificēt nestrukturētus un daļēji strukturētus datus, lai noteiktu noskaņojuma polaritāti (piemēram, pozitīvs, negatīvs vai neitrāls), izmantojot bezmaksas un/vai maksas rīkus, ko viņi pielāgos savām pētniecības, mācību un profesionālajām vajadzībām. Studenti mācīsies izgūt un atlasīt ar noskaņojumu saistītos raksturojumus un kontekstuālās iezīmes, lietojot atbilstošus modeļus, un novērtēt ar emocijām saistīto vārdu nozīmi tekstā un kopējo analizētā teksta noskaņojumu. Studenti attīstīs prasmes izgūt teksta semantisko informāciju, to analizēt, klasificēt un novērtēt noskaņojuma kontekstā, lai uzlabotu klientu pieredzi, kā arī kvalitātes nodrošināšanas nolūkos. Studenti apgūs runas marķēšanu, lietvārdu salikteņu iegūšanu, emociju identificēšanu un noskaņojuma analīzi, pievērsīsies tādiem jēdzieniem kā polaritāte, nodomi un subjektivitāte, praktiski strādājot ar Python programmēšanas valodu un tajā pieejamām bibliotēkām noskaņojuma analīzei, piemēram, NLTK un TextBlob. Praktisko uzdevumu ietvaros studenti realizēs leksikonā balstītu noskaņojuma analīzi (piemēram, izmantojot VADER (Valence Aware Dictionary and sEntiment Reasoner) leksikonu), izmantos iepriekš apmācītus modeļus dažādiem klasifikācijas uzdevumiem, ieskaitot noskaņojuma identificēšanai (piemēram, RoBERTa modeli vai citus pieejamos transformera tipa modeļus, kas pieejami apkopotā veidā Hugging Face platformā) un citus risinājumus, piemēram, Matplotlib bibliotēku rezultātu vizualizācijai un novērtēšanai..
Ņemot vērā noskaņojuma analīzes pievienoto vērtību mārketinga datu izpētē, e-komercijā, sabiedriskās domas izpētē, komercizpētē, politikas plānošanā, izglītības efektivitātes novērtēšanā un citās jomās, zināšanas, kompetences un prasmes, ko studenti apgūs studiju kursā, veicinās viņu profesionālās spējas un nodarbinātību un palīdzēs risināt aktuālas nozares kontekstuzdevumus..
Studiju kursa saturs
Saturs Pilna un nepilna laika klātienes studijas Nepilna laika neklātienes studijas
Kontaktstundas Patstāvīgais darbs Kontaktstundas Patstāvīgais darbs
Ievads noskaņojuma analīzē. 3 4 0 0
Noskaņojums un emocijas. 3 4 0 0
Noskaņojuma analīze mārketinga kampaņās. 3 5 0 0
Noskaņojuma analīze kultūras diskursā. 3 5 0 0
Teksta priekšapstrāde noskaņojuma analīzei. 3 4 0 0
Noskaņojuma analīzes process: metodes un procedūras. 3 5 0 0
Konteksta nozīme noskaņojuma analīzē. 3 4 0 0
Nozares specifiskās valodas nozīme noskaņojuma analīzē. 3 4 0 0
Noskaņojuma leksikoni un vārdnīcas. 3 4 0 0
Iepriekš apmācīti valodu modeļi noskaņojuma analīzei. 3 5 0 0
Ētiskie apsvērumi noskaņojuma analīzē. 2 4 0 0
Kopā: 32 48 0 0
Mērķis un uzdevumi, izteikti
kompetencēs un prasmēs
Studiju kursa mērķi: - attīstīt studentu zināšanas par noskaņojuma analīzes pamatjēdzieniem, piemēram, polaritāti, nodomiem un subjektivitāti, bi-gramiem, tri-gramiem un n-gramiem; - attīstīt studentu kompetenci normalizēt un attēlot tekstu, izmantojot dažās metodes (Bag-of-Words, TF-IDF u.c. metodes); - stiprināt studentu kompetenci izstrādāt, pielāgot un testēt apmācītos klasifikācijas modeļus noskaņojuma analīzei, izmantojot atbilstošu programmatūru. Studiju kursa uzdevumi: - padziļināt studentu prasmes veikt datu priekšapstrādi un izpēti noskaņojuma analīzei; - attīstīt studentu prasmes praktiski veikt teksta tokenizāciju, lematizāciju, datu attīrīšanu; - attīstīt studentu prasmes izgūt un analizēt n-gramus; - attīstīt studentu prasmes sasaistīt vārdu vektorus ar noskaņojumu klasifikācijas modeļiem; - attīstīt studentu prasmes līdzdarboties, lai piedāvātu un radītu risinājumus starpdisciplināriem, dažāda sarežģītības līmeņa, ar valodu tehnoloģiju un ierobežotu definīciju saistītiem semiotikas izaicinājumiem, kas vērsti uz pārdomātu cilvēkiem un videi risku minimizējošu digitālo tehnoloģiju lietošanu, tostarp to lietošanu sociālai labklājībai un sociālajai integrācijai; - attīstīt studentu izpratni par noskaņojuma analīzes veikšanas ētiskajiem aspektiem un tās ilgtspējīgu un ētisku piemērošanu.
Sasniedzamie studiju
rezultāti un to vērtēšana
Studenti spēj izstrādāt, pielāgot un testēt apmācītos modeļus noskaņojuma analīzei, lietojot atbilstošu programmatūru. - Metodes: praktiski uzdevumi, situācijas izpēte, eksāmens. Studenti demonstrē atbilstošu kompetences līmeni dabiskās valodas apstrādes jomā.
Studenti iegūst zināšanas par noskaņojuma analīzes pamatjēdzieniem, piemēram, polaritāti, nodomiem un subjektivitāti, bi-gramiem, tri-gramiem un n-gramiem. - Metodes: praktiski uzdevumi, situācijas izpēte, eksāmens. Studenti lieto atbilstošu terminoloģiju noskaņojuma analīzes uzdevumu izvirzīšanai un īstenošanai.
Studenti spēj demonstrēt zināšanas testa normalizēšanā un attēlošanā, izmantojot dažādas metodes (piemēram, Bag-of-Words, TF-IDF u.c. metodes). - Metodes: praktiski uzdevumi, situācijas izpēte, eksāmens. Studenti sekmīgi veic praktiskus uzdevumus teksta normalizācijā un attēlošanā ar dažādām metodēm.
Studenti spēj veikt teksta priekšapstrādi un izpēti noskaņojuma analīzei, izgūt n-gramus, kā arī sasaistīt izgūtos vārdu vektorus ar noskaņojuma klasifikāciju. - Metodes: praktiski uzdevumi, situācijas izpēte, eksāmens. Studenti sekmīgi veic praktiskus noskaņojuma analīzes uzdevumus, sasniedzot noteiktos izpildes rādītājus.
Studenti spēj līdzdarboties, lai piedāvātu un radītu risinājumus starpdisciplināriem, dažāda sarežģītības līmeņa, ar valodu tehnoloģiju un ierobežotu definīciju saistītiem noskaņojuma analīzes izaicinājumiem, kas vērsti uz pārdomātu cilvēkiem un videi risku minimizējošu digitālo tehnoloģiju lietošanu, tostarp to lietošanu sociālai labklājībai. - Metodes: praktiski uzdevumi, situācijas izpēte. Studenti demonstrē augsta līmeņa digitālās, sociālās un komunikācijas prasmes, risinot praktiskus kontekstuzdevumus un izaicinošas problēmas nozarē.
Studiju rezultātu vērtēšanas kritēriji
Praktiski uzdevumi - 20%
Situācijas izpēte - 40%
Eksāmens - 40%
 
Priekšzināšanas Pamatzināšanas Python programmēšanas valodā un dabiskās valodas apstrādē; DigComp 3.-4. Līmenī atbilstoši Eiropas Iedzīvotāju digitālās kompetences ietvaram, angļu valodas zināšanas vismaz B2 līmenī saskaņa ar EKPVA
Studiju kursa plānojums
Daļa KP EKPS Stundas Pārbaudījumi Pārbaudījumi (brīvai izvēlei)
Lekcijas Prakt. d. Lab. Ieskaite Eksāmens Darbs Ieskaite Eksāmens Darbs
1 2.0 3.0 1.0 1.0 0.0 *

Pieteikties uz šo kursu

[Kursa apraksts PDF formātā]