Datan esikäsittely (3op)
Toteutuksen tunnus: TTVD0100-3001
Toteutuksen perustiedot
- Ilmoittautumisaika
- 03.08.2020 - 30.08.2020
- Ilmoittautuminen toteutukselle on päättynyt.
- Ajoitus
- 31.08.2020 - 30.10.2020
- Toteutus on päättynyt.
- Opintopistemäärä
- 3 op
- Lähiosuus
- 0 op
- Virtuaaliosuus
- 3 op
- Toteutustapa
- Etäopetus
- Yksikkö
- Teknologiayksikkö
- Opetuskielet
- suomi
- Paikat
- 0 - 60
- Opettajat
- Antti Häkkinen
- Vastuuopettaja
- Antti Häkkinen
- Ryhmät
-
ZJA20STIDAAvoin amk, tekniikka, ICT, Data-analytiikka ja tekoäly
- Opintojakso
- TTVD0100
Oppimateriaalit
Opintojakson verkkosivut (luentomateriaali, harjoitukset, harjoitustyöohjeistus)
Arviointiasteikko
0-5
Virtuaaliosuus
3
Opiskelijan ajankäyttö ja kuormitus
Harjoitukset 60 h ja harjoitustyö 21 h. Yhteensä 81 h
Arviointikriteerit, tyydyttävä (1)
Hylätty 0: Opiskelija ei hallitse aihealuetta
Välttävä 1: Opiskelija tietää ja ymmärtää datan merkityksen ja sen tuomat edut. Opiskelija tietää datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Tyydyttävä 2: Opiskelija hallitsee datan hakemisen tietystä lähteestä. Opiskelija osaa toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa samaansa dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Opiskelija osaa arvioida omia ratkaisujaan datan esikäsittelyssä.
Arviointikriteerit, hyvä (3)
Hyvä 3: Opiskelija hallitsee datan hakemisen useammasta lähteestä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Kiitettävä 4: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Opiskelija osaa arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Arviointikriteerit, kiitettävä (5)
Erinomainen 5: Opiskelija hallitsee datan hakemisen erilaisista lähteistä. Opiskelija osaa suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Opiskelija osaa soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Opiskelija osaa kriittisesti arvioida ja perustella omia ratkaisujaan datan esikäsittelyssä.
Opetuskieli
fi
Opetusmenetelmät
Opintojakso sisältää harjoituksia eri aihealueilta sekä opintojakson aihepiirejä yhdistävän harjoitustyön.
Aika ja paikka
Opintojakso toteutetaan verkkototeutuksena.
Opintopistemäärä
3
Esitietovaatimukset
Tietotekniikan peruskäyttö taidot, ohjelmoinnin perusosaaminen ja Python-ohjelmointikielen tunteminen ja osaaminen.
Sisältö
- Erilaiset IoT lähteet/formaatit, JSON, APIt, SQL:stä taulujen haku jne
- Muuttujatyypit
- Datan esikäsittely ennen analysointiohjelmaan tuomista
- Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
- Eri datalähteiden yhdistäminen
- Datan enkoodaus
Tavoitteet
Opiskelija ymmärtää data-analytiikka prosessin ja sen tuomat haasteet Opiskelija osaa tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Opiskelija osaa soveltaa datan esikäsittelyssä tarvittavia menetelmiä.