Palvelun tila:Valmis
Palvelun nimi | Henkilön yksilöinti |
---|---|
Palvelun kuvaus | Virkalija yhdistää Oppijan palvelukokonaisuudessa olevat päällekkäiset saman henkilön ilmentymät yhdeksi yksilölliseksi uniikiksi identiteetiksi, jolle annetaan kansallinen oppijanumero. |
Tunniste (label) | SPECS-107 |
Vaatimukset | - |
Palvelun käyttäjät | virkailijat, joiden tehtävänä on yksilöidä henkilöitä |
Ylätason kuvaus ("proosa") | |
Rautalankamallit |
|
Prosessikuvaukset | Prosessikuvien päivitys käynnissä |
Käyttötapauskaaviot |
|
Tilakaaviot |
|
Käyttötapauskuvaukset | |
Tietomalli | Toimijat |
Koodistot | "henkilötietokanta", "henkilölimbo" |
Liittyvät palvelut ja moduulit |
|
Huomioita | Jira: SPECS-107 |
Yhteyshenkilö |
|
2 Comments
Unknown User (juha.tretjakov@oph.fi)
Hetuttomien yksilöinti -prosessikaavio -pdf on piirretty näiden Lauran muistiinpanojen pohjalta, joista voi myös tarkentaa prosessin kulkua:
Hetuttomien yksilöinti
24.10.2012 (Seppo, Joonas, Kata, Elina, Juha, Joni, Marcus, Laura)
Tyypillinen työnkulku
- kaikki hakemukset, joista puuttuu henkilötunnus pitää käsitellä manuaalisesti (automatisointiin liittyy liikaa riskejä?)
- hetuttomien yksilöinti tehdään vertailemalla hakemuksella olevia tietoja järjestelmässä oleviin tietoihin
- virkailija = OPH tai oppilaitos (korkeakoulujen osalta linjaamatta)
Poikkeustilanteet
- mitä tehdään, kun virkailija yhdistää väärin?
Muita huomioita
- passinumero ei voi olla pakollinen tieto (kaikilla ei ole hakuvaiheessa passinumeroa)
- UAF: niputetaanko hakijat yhteen vaikka hakijalle voi olla useita hakemuksia (erillishaku)
- hakuvaiheessa tarkistus: hetu/ulkkarisäännöt (ei turhia päällekkäisiä hakemuksia)
- KSHJ:n asiakaspalvelu-työryhmän linjattava, kuka tekee yksilöinnin korkea-asteella, toisella asteella yksilöinnin tekee OPH
- tarvittaneen nettihaku-kanta jossa hakemukset ovat, hakemuksen hetu-vertailu niitä hakemuksia vasten (ei back-endia vasten, se on paljon monimutkaisempaa)
Unknown User (juha.tretjakov@oph.fi)
Tietojen (esim. nimien) vertailussa käyttäjän syötteen ja VTJ:n tiedon kanssa pitäisi käyttää approksimointia
Tehdään vertailu niin, että se käyttää vertailuun etäisyysfunktiota. Yksinkertaisin etäisyysfunktio on esim. Levenshtein distance. Säädetään maksimiarvoksi vaikka kaksi. Koodi pitäisi toteuttaa niin, että funktiota ja algoritmia voi vaihtaa ja että funktio kirjoittaa lokia tekemisistään. Voidaan sitten säätää sitä, jos tulee ongelmia. Valmiita kirjastoja ja malleja löytyy esim. githubista nimellä stringdist, ja distance. Lisää löytyy. Ja vielä yksinkertaisempi etäisyysfunktio on ihan vaan epäsumea merkkijonovertailu (eli sama kuin Levenshtein = nolla).
Lisätietoja merkkijonojen sumeasta vertailusta: http://en.wikipedia.org/wiki/Approximate_string_matching