Tekoälykästä aineistonhallintaa: Tekoälystä apua aineistonhallintasuunnitelman laadintaan?

Mikä aineistonhallintasuunnitelma?

Aineistonhallinta on olennainen osa vastuullista projektinhallintaa tai tutkimusta, ja sen keskeinen työkalu on aineistonhallintasuunnitelma eli dmp (data management plan).

Aineistonhallintasuunnitelmassa kirjoitetaan auki, mitä aineistoja projektissa kerätään, miten niitä käsitellään ja dokumentoidaan, minne ne tallennetaan ja kenellä on niihin pääsy, millaisia riskejä aineistoon liittyy, avataanko aineistoa ja mitä aineistolle tapahtuu projektin jälkeen, sekä millaisia rooleja ja vastuita aineistoihin liittyy.

Aineistonhallintasuunnitelma tehdään Metropoliassa pääsääntöisesti DMPTuuli-verkkotyökalulla. Se tehdään joko projektin valmisteluvaiheessa tai aivan toteutuksen alussa, ennen kuin mitään aineistoa on kerätty.

DMPTuulin mallipohjat kysymyksineen ohjaavat suunnitelman tekoa, mutta kysymyksiin vastaaminen saattaa joskus olla haastavaa, kun projekti on vasta alussa. Tässä kohtaa tekoäly tukiälynä saattaa auttaa.

Huomioi tekoälyn rajoitukset

Tuottava tekoäly on sangen pätevä kaveri tuottamaan yleistajuista tekstiä; tämä saattaisi johtaa kiusaukseen pyytää tekoälyä laatimaan projektille aineistonhallintasuunnitelma suoraan, suunnitelman kysymyksiä itse sen enempää pohtimatta. Tämä ei kuitenkaan kannata monestakaan syystä.

DMPTuuli-konsortion järjestämässä työpajassa testailtiin marraskuussa 2024 aineistonhallintasuunnitelman luomista automaattisesti tekoälyllä fiktiivisen tutkimussuunnitelman pohjalta. Tulokset olivat odotetun laiset: ”Erityisesti aineistonhallintasuunnitelman laatimisessa tekoäly pääsi parhaimmillaankin köykäisen suunnitelman tasolle, juuri ja juuri hyväksyttyyn suoritukseen vaikkapa opintojakson osana” (Satama 2024, 39). Tekoälyn tuottama aineistonhallintasuunnitelma oli liian yleistajuinen, kun se oli tuotettu pelkästään tutkimussuunnitelman pohjalta. Palastelemalla ja antamalla tarkempia taustatietoja tulosta olisi todennäköisesti voinut parantaa.

Aineistonhallintasuunnitelma on työkalu aineistonhallintaan. Se on elävä dokumentti, joka täydentyy ja muokkautuu tutkimuksen tai projektin aikana, ja siinä suunniteltuja asioita on tarkoitus noudattaa läpi projektin. Tästä syystä on tärkeää, että suunnitelma on konkreettinen ja käsittelee juuri tämän nimenomaisen projektin aineistoja.

Aineistonhallintasuunnitelma sisältää paljon riskien arviointia ja eettistä pohdintaa. Projektin onnistumisen kannalta on tärkeää, että projektissa on aidosti tunnistettu riskit ja pohdittu, miten ne minimoidaan ja ratkaistaan. Tekoäly ei myöskään välttämättä osaa huomioida kaikkia juuri kyseisen projektin aineistoihin liittyviä riskejä, tai se saattaa ehdottaa toimia, jotka eivät sovellu projektiin. Projektitiimin tulee myös ymmärtää suunnitelman sisältö, joten ajattelua ei kannata kokonaan ulkoistaa tekoälylle.

Huomaa, että projektin tutkimussuunnitelma on yleisesti ottaen salassa pidettävä asiakirja, jotta tutkimuksen uutuusarvo säilyy. Sitä ei siis kannata syöttää avoimiin tekoälysovelluksiin ilman tarkkaa etukäteistä harkintaa. Tämä koskee erityisesti avoimia verkkopohjaisia tekoälysovelluksia, joita käyttämällä saatat antaa datallesi käyttöoikeuden kolmansille osapuolille.

Sellaisille tekoälysovelluksille, jotka hyödyntävät käyttäjän syötteitä tekoälymallinsa kouluttamiseen, ei pidä syöttää muuta kuin julkisia tietoja. Metropolian tekoälyn tietosuoja – ja tietoturva -toimintaohjeen mukaan tekoälylle syötetyt tiedot eivät saa sisältää salassa pidettävää tietoa.

Aineistonhallintasuunnitelmat sen sijaan eivät yleensä sisällä salassa pidettävää tietoa, mutta jos näin olisi, varmista ettet syötä tekoälysovelluksille tällaista tietoa vahingossa.

Tukiälyä suunnitelman tekoon

Miten tekoälyä sitten kannattaisi käyttää aineistonhallintasuunnitelman laadinnassa? Ainakin sparrailuun, syventämiseen, esimerkkeihin ja kommentointiin.

Sataman mukaan ”tyhjän paperin kammon selättämiseen tekoäly on erinomainen, ja tämä pitää paikkansa myös aineistonhallinnassa. Se luo rakennetta, antaa malliksi sopivia esimerkkejä ja ohjaa lisätietoihin väsymättömän assistentin tavoin” (Satama 2024, 40)

Voit antaa tekoälylle taustatiedoksi tietoa projektista, sen aineistoista ja aineistonhallinnan tarpeista, sekä haluamasi aineistonhallintasuunnitelmapohjan. Saat ladattua tyhjän pohjan kysymyksineen esimerkiksi DMPTuulista, josta löytyy organisaatioiden pohjien lisäksi myös rahoittajien omia pohjia.

Jos käyttämälläsi tekoälysovelluksella on pääsy ajantasaiseen internetiin, voit antaa sille julkisen organisaatiosi aineistonhallinnan oppaan verkkosivun ja pyytää varmistamaan, että aineistonhallintasuunnitelma on yhdenmukainen ohjeistuksen kanssa. Voit tehdä saman myös rahoittajan ohjeille.

Huomaa, että tekoälymalleilla on yleensä rajallinen konteksti-ikkuna, eli tekoäly pystyy ”muistamaan” vain tietyn määrän tekstiä kerrallaan. Pitkissä keskusteluissa tekoäly saattaa unohtaa sille antamiasi ohjeita ja saatat joutua muistuttamaan niistä. Esimerkiksi omissa testauksissani tekoäly lakkasi loppuvaiheessa noudattamasta mallipohjaa ja alkoi keksiä kysymyksiä itse. Jollain tekoälysovelluksilla on mahdollista määritellä erillinen oma malli, johon voi lisätä taustatiedostoja, joista malli voi hakea tietoa keskustelun aikana. Konteksti-ikkunan rajoitteita voi ratkaista myös palastelemalla keskustelun ja taustatietojen syöttämisen.

Tekoälylle annetut promptit eli kehotteet vaikuttavat paljon tulosten laatuun. Tarkkuuden ja taustatietojen lisäksi voit antaa tekoälylle myös jonkin roolin ja pyytää arvioimaan suunnitelmaa tästä näkökulmasta. Näkökulmaa voi vielä tarkentaa kehotteessa.

Esimerkkejä rooleista ovat vaikkapa:

”Olet rahoittajan X arvioija. Etsi kohdat, joissa dmp ei vastaa työpakettirakennetta.”
”Olet tietosuojavastaava. Tarkista, onko henkilötietojen käsittely kuvattu riittävästi.”
”Olet tietoturva-asiantuntija. Arvioi onko tietoturvariskeihin varauduttu riittävästi.”
”Olet tutkimusetiikan asiantuntija. Tarkista, onko tutkimuseettiset riskit ja riskit tutkittaville tunnistettu.”
”Olet budjettikriittinen tarkastaja. Ovatko aineistonhallinnan resurssit huomioitu realistisesti?”

Tekoälyä kannattaa myös pyytää olemaan kriittinen. Pyydä tekoälyltä ehdotuksia, kysy tarkentavia kysymyksiä ja esimerkkejä, tai pyydä tekoälyä kysymään ajatteluasi ohjaavia kysymyksiä sinulta, jolloin pääset oikeasti pohtimaan projektisi aineistonhallintaa syvällisesti.

Vastuu säilyy ihmisellä

Huomaa, että tekoälyn luomat vastaukset eivät aina ole oikein ja siksi vastuu tietojen tarkistamisesta on aina ihmisellä. Jos et ymmärrä jotain tekoälyn antamaa vastausta, älä laita sitä suunnitelmaasi. Voit aina myös kysyä tekoälyltä tarkentavia kysymyksiä ja antaa sille ehdotuksia.

Voit myös kertoa tekoälylle, miten jokin asia on tarkoitus toteuttaa ja pyytää siihen kommentteja tai lisäehdotuksia. Esimerkiksi laadunvarmistusta tai tutkimusetiikkaa koskevissa kysymyksissä voit pyytää tekoälyltä lisäehdotuksia toimenpiteiksi, ja päättää sen jälkeen, kannattaako ne sisällyttää projektiin.

Voit myös syöttää tekoälylle luonnoksen jo tekemästäsi aineistonhallintasuunnitelmasta, ja pyytää siihen kommentteja ja täydennysehdotuksia. Tekoäly voi tarkistaa, että suunnitelma on selkeä ja ristiriidaton. Voit jopa pyytää tekoälyä kritisoimaan suunnitelmaa: näin löydät mahdollisesti aukkopaikkoja, joita et ole itse hoksannut.

Tekoäly saattaa ehdottaa tarpeettomia, liian yleisluontoisia korulauseita kuten ”aineistonhallinnassa käytetään tietoturvallisia tallennusratkaisuja”. Siivoa tällaiset pois suunnitelmasta ja keskity konkretiaan. Kerro esimerkiksi tarkalleen, minne aineisto tallennetaan ja miten tietoturvasta huolehditaan.

Rohkeasti testailemaan

Löydät todennäköisimmin parhaimmat tavat hyödyntää tekoälyä aineistonhallintasuunnitelmasi laadinnassa rohkeasti testailemalla. On makukysymys, haluatko käydä koko suunnitelman läpi tekoälyn ohjaamana, keskustella sen kanssa tietystä kysymyksestä tai aihepiiristä, tai pyytää siltä kommentteja jo luonnostelemaasi vastaukseen. Tekoälyltä voi myös pyytää vinkkejä sen itsensä käyttöön; esimerkiksi mitä kysymyksiä sinun kannattaisi kysyä.

Tekoäly myös kehittyy jatkuvasti, jolloin sen toimintamekaniikkoihin saattaa tulla muutoksia.

Tekoälyn kanssa kannattaa yleisesti ottaen olla niin sanottu kriittinen lukija: kyseenalaista, kysy, vaadi tarkennuksia. Vaikka tekoäly tekee virheitä, se antaa myös hyviä ehdotuksia, ideoita ja pohdittavaa, joita et välttämättä olisi itse keksinyt.

Muista osallistaa myös projektitiimiä

Koska projektin aineistonhallinta on yhteistyötä, johon osallistuu enemmän tai vähemmän koko projektitiimi, pelkkä tekoäly sparrailukaverina ei tietenkään riitä. Tekoäly auttaa keksimään ratkaisuja ja voi helpottaa suunnitelman tekoa, mutta viime kädessä aineistonhallintasuunnitelma tulee käydä läpi koko tiimin kanssa yhteisesti ja sopia noudatettavista käytänteistä, joihin kaikki sitoutuvat.

Ja jotta kaikki tuki ei jäisi vain tekoälyn varaan, voit pyytää aineistonhallintasuunnitelmaasi yleensä myös asiantuntijakommentteja oman organisaatiosi datatuesta. Metropoliassa tämä tapahtuu DMPTuulin kautta tai sähköpostitse datatuki@metropolia.fi, mikäli olet Metropolian henkilökuntaa.

Lisämateriaali

Linkki tekoälyn kanssa käytyyn esimerkkikeskusteluun

Käytetty tekoäly: OpenAI:n kehittämä ChatGPT-kielimalli (versio GPT-4o), elokuun 2025 versio. Palveluun pääsee osoitteesta https://chat.openai.com.

Esimerkkiprojekti kaikkine tietoineen on fiktiivinen.

Lähteet

Satama, M. 2024. Tekoälyllä parempaa tutkimusdatanhallintaa? Signum 4/2024, 36–40.

Metropolian tekoälyn tietosuojan- ja tietoturvan toimintaohje

Kirjoittaja

Joona Koiranen
Asiantuntija, Metropolia Ammattikorkeakoulu

Joona Koiranen toimii asiantuntijana ja tiimivastaavana Metropolian Projektin toteutus- ja ohjauspalveluissa. Hän on filosofian maisteri ja väitöskirjatutkija.

Tutustu tekijään