Project Description
Syntyi uusia näkökulmia
RPA -koulutus oli hieno lisä opiskelijoiden taitojen tukemiseksi
Projektissa pyrittiin lähemmäksi virheettymyyttä
Fonecta
Fonecta-konserni on suomalainen yhteystieto- ja mediayhtiö, joka on osa kansainvälistä European Directories -nimistä konsernia. Fonectan tarjoaa erikokoisille yrityksille digitaalisen markkinoinnin palveluja kuten verkkomainontaa, kotisivuja ja verkkolöydettävyyden palveluja.
Fonecta tuli mukaan Digi-Salama -hankkeeseen, jotta he saisivat datakannastaan virheettömämmän. Tällä hetkellä on niin suuri määrä dataa, että joukosta löytyy epäsäännöllisyyksiä ja outouksia. He haluaisivat, projektiryhmän kehittävän tavan, jolla sovellus oppii itse ratkomaan virheitä ja jossa sovellus oppisi samalla itse. Tavoitteena oli myös pohtia ohjelmistorobotiikan liiketaloudellisia hyötyjä yritykselle.
Datamassaa on valtavasti
Projektin aiheena ja tavoitteena on käydä Fonectan datamassaa läpi ja etsiä sieltä epäsäännöllisyyksiä, outouksia tai muuta sellaista. Toimeksiantaja haluaa datan prosessoinnin käyttöön tekoälysovelluksen RPA:n (Robotic Process Automation). Nyt datamassa joudutaan käymään läpi manuaalisesti, mutta tarkoituksena olisi, että tulevaisuudessa automaatio hoitaisi datamassan parannukset ja korjaukset. Tavoitteena on käyttää tekoälyä, joka tarkoittaa sitä, että ohjelma oppisi itse myös samalla ja näin osaisi tulevaisuudessa ennustaa jo ennen virheen sattumista, että mitä on mahdollisesti pian tapahtumassa, jos jotakin ei nyt muuteta. RPA:han tutustuminen oli osa projektia.
RPA koulutusmahdollisuus nosti projektin tasoa
Kehittämissuunnitelma on projektianalyysiin perustuva ehdotus liiketoiminnan kehittämisestä. Tämän tarkoituksena on olla apuna yritykselle liiketoimintaa uudistaessa tai suunniteltaessa. Datamassan ohjelmoinnilla on mahdollista saada selkeämpi ja toimivampi tuote. Uhkana voi olla myös ihmisten tekemät virheet robotin teossa. RPA on verrattain uusi asia yrityksissä, eli sen kehitys on usein pitkä matka. Jos robotin teko kestää pitkään, voi olla, että sovellukset ehtivät muuttua välissä.
Innovaatioprojektiin kuului kahden päivän Robotic Process Automation koulutus, jossa opiskelijat harjoittelivat ohjelmistorobotiikan käyttämistä. Käytimme automatisoinnissa UiPath Studiota millä teimme alkeellisen robotin. Robotin tarkoituksena on ainoastaan näyttää, miten se käytännössä toimii. Toteutettu koulutus paransi opiskelijoiden työskentelykykyjä, ja antaa paremmat edellytykset robotin kehityksen onnistumiselle.
Projektiassistentti jatkoi projektia itsenäisesti. Projektissa keskityttiin lopulta yritysten osoitetietojen prosessointiin, koska näistä löytyi selkeää epäsäännöllisyyttä ja esimerkiksi kirjoitusvirheitä. Tavoitteena oli varmistaa tietojen oikeellisuus löytämällä ohjelmallisesti mahdolliset poikkeamat sekä suorittamalla niihin automaattisia korjauksia. Datasetin käsittely tehtiin Jupyter Notebook -ohjelmointiympäristössä Python-ohjelmointikielellä. Kirjastoista käytössä olivat pandas sekä muutamat kielenprosessointiin liittyvät NLTK-kirjastot. Datasettiä piti esikäsitellä, jotta tarpeeton data, poikkeamat ja puuttuva data eivät sotkeneet saatuja tuloksia.
Inhimillisten virheitä vähemmän
Jotkut virheellisesti korjatut osoitteet sisälsivät lähtökohtaisesti paljon ylimääräistä tietoa, eli ylimääräisiä merkkejä, jotka heikensivät korjausfunktioiden suorituskykyä merkittävästi. Ainoastaan perusteellisempi esikäsittely olisi voinut parantaa tässä tuloksia. Voi kuitenkin olla haastavaa löytää lisää sellaisia yleispäteviä kaavoja, joilla karsia turhaa tietoa pois vertailusta. Vaihtoehtoina ovat esimerkiksi numeroiden ja merkintöjen (c/o, as jne.) poistaminen sekä osoitekentän sisällön pilkkominen osiin.
Ohjelmistorobotiikkaa voidaan hyödyntää monissa työtehtävissä, joissa sama tehtävä toistuu joka päivä samanlaisena. Robotti eliminoi inhimillisiä virheitä, vähentää resursointia ja henkilöstön osaamiseen liittyviä riskejä. Automatisaatio lisää kilpailukykyä ja vaikka työtehtäviä katoaa, niin yleensä tilalle syntyy korvaavia työtehtäviä. Robotille täytyy opettaa todella monia erilaisia mahdollisia ongelmatilanteita, jotta robotti osaa itse tulevaisuudessa ratkoa niitä halutulla tavalla. Tämä vaatii robotin kehittäjiltä korkeaa ymmärrystä siitä, miten tekoäly ratkaisee tämänkaltaiset ongelmat.
Saatiin aikaiseksi PoC
Lopputuloksena oli proof of concept -asteella oleva auto-correct -ohjelma, joka kävi läpi automaattisesti läpi yhteystietoja, tarkisti niiden oikeellisuuden Postin tietokantojen avulla ja tarvittaessa korjasi mahdollisimman oikeaan muotoon. Korjaaminen toteutettiin kolmella hieman erilaisella menetelmällä ja tuloksia vertailtiin.
Sami Veikkolainen, Fonecta Oy:ltä kertoi, että yhteistyö oli hyvää ja näin saadaan uusia näkökulmia sekä mahdollistetaan opiskelijoille reittejä työelämään.