Datan esikäsittely (4 op)
Toteutuksen tunnus: TTC8030-3010
Toteutuksen perustiedot
- Ilmoittautumisaika
-
01.08.2024 - 22.08.2024
Ilmoittautuminen toteutukselle on päättynyt.
- Ajoitus
-
02.09.2024 - 06.10.2024
Toteutus on päättynyt.
- Opintopistemäärä
- 4 op
- Lähiosuus
- 0 op
- Virtuaaliosuus
- 4 op
- Toteutustapa
- Etäopetus
- Yksikkö
- Teknologiayksikkö
- Opetuskielet
- suomi
- Paikat
- 0 - 35
- Koulutus
- Tieto- ja viestintätekniikka (AMK)
- Opettajat
- Antti Häkkinen
- Ryhmät
-
TTV22S5Tieto- ja viestintätekniikka (AMK)
-
TTV22S2Tieto- ja viestintätekniikka (AMK)
-
TTV22S3Tieto- ja viestintätekniikka (AMK)
-
TTV22S1Tieto- ja viestintätekniikka (AMK)
-
TTV22SMTieto- ja viestintätekniikka (AMK)
-
TTV22S4Tieto- ja viestintätekniikka (AMK)
-
TTV22SM2Tieto- ja viestintätekniikka (AMK)
-
ZJA24STIDA1Avoin amk, Data-analytiikka 1, Verkko
- Opintojakso
- TTC8030
Oppimateriaalit
Opintojakson verkkosivut (luentomateriaali, harjoitukset, muu ohjeistus).
Arviointiasteikko
0-5
Virtuaaliosuus
4
Opiskelijan ajankäyttö ja kuormitus
Ympäristön valmistelut, harjoitukset ja materiaaliin tutustuminen 108 h. Yhteensä 108 h
Arviointikriteerit, tyydyttävä (1)
Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä.
Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Arviointikriteerit, hyvä (3)
Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.
Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.
Arviointikriteerit, kiitettävä (5)
Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.
Opetuskieli
fi
Opetusmenetelmät
Opintojakso sisältää harjoitustehtäviä opintojakson eri aihealueilta.
Aika ja paikka
Opintojakso toteutetaan verkkototeutuksena (ei kontaktiopetusta). Opiskelija voi edetä toteutuksella omaan tahtiin.
Opintopistemäärä
4
Esitietovaatimukset
Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.
Sisältö
o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne
o Muuttujatyypit
o Datan esikäsittely ennen analysointiohjelmaan tuomista
o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet)
o Eri datalähteiden yhdistäminen
Tavoitteet
Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä.
EUR-ACE-osaamiset:
Tieto ja ymmärrys
Tekniikan soveltaminen käytäntöön