Väestötietojärjestelmän suomalaisten nimiaineistot
Dataset Profile
Odm ID | 57282ad6-3ab1-48fb-983a-8aba5ff8d29a
|
---|---|
Title | Väestötietojärjestelmän suomalaisten nimiaineistot
|
Notes | Väestötietojärjestelmästä on poimittu erilliset etunimiä ja sukunimiä koskevat nimiluettelot ja nimien kappalemääräiset esiintymät väestötietojärjestelmässä. Tietosuojasyistä etunimiä, joita on alle 10 kappaletta ja sukunimiä, joita on alle 20 kappaletta, ei esitetä luetteloissa.
Etunimiaineisto on jaettu miesten ja naisten nimiksi sen mukaisesti, miten nimet esiintyvät väestötietojärjestelmässä eri sukupuolta olevilla henkilöillä. Etunimistä on muodostettu erilliset miesten ja naisten nimiä koskevat luettelot, joista ensimmäinen kuvaa kaikkien etunimien esiintymiä, toinen nimen esiintymistä ensimmäisenä etunimenä ja kolmas nimen esiintymistä muuna kuin ensimmäisenä etunimenä. Sukunimiaineistossa on lueteltu sukunimet esiintymien lukumäärän mukaisessa suuruusjärjestyksessä. Nimiaineistot on muodostettu suomalaisten voimassaolevien nimien pohjalta, joten niissä on huomioitu väestötietojärjestelmään rekisteröityjen elossa olevien Suomessa tai ulkomailla asuvien Suomen kansalaisten nimistö. Ulkomaiden kansalaisten, kuolleiden henkilöiden nimiä tai henkilöiden entisiä nimiä ei ole huomioitu. Välinimet on laskettu aineistossa etunimiksi, samoin erisnimen sisältävät patronyymit ja matronyymit kuten Matinpoika tai Maijantytär. Sen sijaan patronyymejä, jotka ainoastaan viittaavat toiseen erisnimeen olematta itse erisnimiä kuten ibn, bin, ben ei ole aineistossa lueteltu. Nimen kirjoitusasusta riippuen mm. nimen vokaalipaino voi olla eri kohdassa. Nämä painotukset ovat näkyvillä aineistossa, jolloin esim. Viren ja Virén esiintyvät aineistossa omina niminään. Myös avioliiton kautta syntyneet yhdistelmänimet, esim. Korhonen-Virtanen, esiintyvät aineistossa tässä yhdistelmämuodossa, mikäli niitä on yli 20 kappaletta. Nimiaineistot on poimittu syyskuussa 2015. Nimiaineisto on CSV-tiedostomuodossa. Lisäksi jokaisesta luettelosta on laadittu PDF-muotoinen lyhennelmä, jossa on tuhat yleisintä nimeä. |
Author | pekkpa
|
Author Email | |
Catalogue Url | |
Dataset Url | |
Metadata Updated | 2015-09-29 02:58:03
|
Tags | |
Date Released | |
Date Updated | |
Update Frequency | |
Organisation | Väestörekisterikeskus
|
Country | |
State | |
Platform | ckan
|
Language | fi
|
Version | (not set)
|