DE0854 Statistiskā izpēte: teorija un pielietojumi finansēs

Kods DE0854
Nosaukums Statistiskā izpēte: teorija un pielietojumi finansēs
Statuss Obligātais/Ierobežotās izvēles
Līmenis un tips Augstākā līmeņa, Akadēmiskais
Tematiskā joma Matemātika un statistika
Struktūrvienība Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Mācībspēks Andrejs Matvejevs, Viktors Ajevskis
Kredītpunkti 6.0
Daļas 1
Anotācija Statistiskās izpētes pamatā ir koncepcija, ka datorprogramma var iemācīties un pielāgoties jauniem datiem bez cilvēka iejaukšanās. Statistiskā izpētē tiek izmantoti statistikas algoritmi, lai identificētu vēsturiskos paraugus datos, kuri var tikt izmantoti, lai izveidotu nākotnes tendenču prognozes. Izmantojot piemērus no ekonomikas un finansēm, studiju kurss nodrošina studentiem praktisku pieredzi ar tipisku statistiskās izpētes darbplūsmu, kas ietver datu priekšapstrādi un modeļu parametru novērtējumu, kā arī modeļu prognožu veiktspējas analīzi. Pēc studiju kursa apgūšanas studenti varēs praktiski pielietot iegūtās zināšanas, izmantojot statistikas programmatūras paketes R vidē..
Studiju kursa saturs
Saturs Pilna un nepilna laika klātienes studijas Nepilna laika neklātienes studijas
Kontaktstundas Patstāvīgais darbs Kontaktstundas Patstāvīgais darbs
Ievads kursā un organizatoriskā informācija. Statistiskā programmatūra R/Rstudio. Reproducējami pētījumi ar R Markdown. Datu apstrādes un vizualizācijas rīki. Pētniecisko datu pirmā analīze R vidē. 16 24 0 0
Ievads statistiskās izpētes kursā. Ievads prognozēšanas modelēšanas procesā un tā galvenajos posmos, piemēram, savstarpējā validācijā un paraugu sadalē. Dispersijas un novirzes kompromiss. 8 12 0 0
Lineārā regresija un mainīgo inženierija. Mainīgo izvēles metodes lineārās modeļos, kuru mērķis ir atlasīt ierobežotu regresoru skaitu, ar vislabāko atkarīgā mainīgā prognozēs veiktspēju. Pielietojums 8 12 0 0
Sarukšanas pieeja regresijas parametru novērtēšanai, kas balstās uz koeficienta vērtību samazināšanas nulles virzienā, salīdzinot ar OLS aplēsēm. Modeļu novērtēšana, kad regresoru skaits p > n. 3 5 0 0
Koeficienta sarukšanas veikšana, izmantojot sodu regresijas modeļus kā Ridge regresijas un LASSO / Elastīgo tīklu (ET) modeļus. LASSO / ET modeļi salīdzināšana. Pielietojums finansēs. 3 4 0 0
Datu dimensijas samazināšanas paņēmieni. Alternatīvu pieeju informācijas izmantošana ļoti lielās datu kopās, veidojot k lineāras kombinācijas no sākotnējiem p regresoriem, ar p >> k. 3 5 0 0
K lineārās kombinācijas vai projekcijas izmantošana, lai prognozētu atkarīgo mainīgo. Visplašāk izmantotas metodes ietver galveno komponentu analīzi (PCA), galveno komponentu regresiju (PCR). 3 4 0 0
Regresijas koka modeļi, kas balstīti uz atkarīgā mainīgā stratifikāciju vai segmentēšanu atsevišķos nepārklājošos blokos. Metodes, kurām ir augsta prognozes veiktspēja un meža regresija. 2 3 0 0
Koku regresijas modeļi un mainīgie, kas automātiski nodrošina datu segmentēšanas. Pielietojums finansēs. 2 3 0 0
Regresijas koka modeļi, kas tie var patvaļīgi labi tuvināt nelineāras attiecības starp atkarīgiem un skaidrojošajiem mainīgajiem. 2 3 0 0
Statistiskās izpētes metodes, kuru veiktspēja var būt kritiski atkarīga no hiperparametru izvēlētajām vērtībām. Hiperparametru pielāgošanas nozīme modeļa izvēles procesā. 3 4 0 0
R programmatūras sistēma, kas nodrošina, lai pārredzamā un reproducējamā veidā tika veiktas hiperparametru vērtību ietekmes analīzi uz tā paša modeļa prognozēšanas veiktspēju. Pielietojums finansēs. 3 5 0 0
Teksta dati. Sentimentu analīze. Pielietojums finansēs. 8 12 0 0
Kopā: 64 96 0 0
Mērķis un uzdevumi, izteikti
kompetencēs un prasmēs
Studiju kursa mērķis ir iepazīstināt studentus ar mūsdienu statistiskās izpētes rīkiem un to pielietojumu praksē. Papildus mērķis ir iepazīstināt studentus ar moderniem teksta analīzes metodēm un to pielietojumu finansēs. Studiju kursa uzdevums ir apmācīt studentus pielietot datu prognozēšanas metodes, kas ietver lineāru regresiju, datu sarukšanas un datu dimensijas samazināšanas pieejas, kā arī koku regresijas modeļus.
Sasniedzamie studiju
rezultāti un to vērtēšana
Prot analizēt datus ar lineārās regresijas palīdzību izmantojot R programmatūru un izveidot datu analīzes kopsavilkumu R Markdown vidē. - Laboratorijas darbs. Tests. Eksāmens.
Prot pielietot koeficientu sarukšanas regresijas metodes/datu dimensijas samazināšanas metodes/koku regresijas modeļus datu analīzei. - Laboratorijas darbs. Tests. Eksāmens.
Prot pielietot teksta apstrādes un analīzes rīkus. - Laboratorijas darbs. Tests. Eksāmens.
Prot izveidot statistiskās izpētes darba plūsmu jaunu datu analīzei un prezentēt analīzes rezultātus publikas priekšā. - Kursa darbs. Tests. Eksāmens.
Studiju rezultātu vērtēšanas kritēriji
Laboratorijas darbs. 1. tests - 10%
Laboratorijas darbs. 2. tests - 10%
Laboratorijas darbs. 3. tests - 10%
Kursa darbs. 4. tests - 35%
Eksāmens - 35%
 
Priekšzināšanas Augstākā matemātika pamatkursa apjomā, Varbūtību teorija un matemātiskā statistika pamatkursa apjomā.
Studiju kursa plānojums
Daļa KP Stundas Pārbaudījumi
Lekcijas Prakt. d. Lab. Ieskaite Eksāmens Darbs
1 6.0 32.0 0.0 32.0 *

Pieteikties uz šo kursu

[Kursa apraksts PDF formātā]