European
Data Catalogues
Dataset

CKAN

Sub menu


Väestötietojärjestelmän suomalaisten nimiaineistot

Dataset Profile

Odm ID
57282ad6-3ab1-48fb-983a-8aba5ff8d29a
Title
Väestötietojärjestelmän suomalaisten nimiaineistot
Notes
Väestötietojärjestelmästä on poimittu erilliset etunimiä ja sukunimiä koskevat nimiluettelot ja nimien kappalemääräiset esiintymät väestötietojärjestelmässä. Tietosuojasyistä etunimiä, joita on alle 10 kappaletta ja sukunimiä, joita on alle 20 kappaletta, ei esitetä luetteloissa.

Etunimiaineisto on jaettu miesten ja naisten nimiksi sen mukaisesti, miten nimet esiintyvät väestötietojärjestelmässä eri sukupuolta olevilla henkilöillä. Etunimistä on muodostettu erilliset miesten ja naisten nimiä koskevat luettelot, joista ensimmäinen kuvaa kaikkien etunimien esiintymiä, toinen nimen esiintymistä ensimmäisenä etunimenä ja kolmas nimen esiintymistä muuna kuin ensimmäisenä etunimenä.

Sukunimiaineistossa on lueteltu sukunimet esiintymien lukumäärän mukaisessa suuruusjärjestyksessä.

Nimiaineistot on muodostettu suomalaisten voimassaolevien nimien pohjalta, joten niissä on huomioitu väestötietojärjestelmään rekisteröityjen elossa olevien Suomessa tai ulkomailla asuvien Suomen kansalaisten nimistö. Ulkomaiden kansalaisten, kuolleiden henkilöiden nimiä tai henkilöiden entisiä nimiä ei ole huomioitu. Välinimet on laskettu aineistossa etunimiksi, samoin erisnimen sisältävät patronyymit ja matronyymit kuten Matinpoika tai Maijantytär. Sen sijaan patronyymejä, jotka ainoastaan viittaavat toiseen erisnimeen olematta itse erisnimiä kuten ibn, bin, ben ei ole aineistossa lueteltu.

Nimen kirjoitusasusta riippuen mm. nimen vokaalipaino voi olla eri kohdassa. Nämä painotukset ovat näkyvillä aineistossa, jolloin esim. Viren ja Virén esiintyvät aineistossa omina niminään. Myös avioliiton kautta syntyneet yhdistelmänimet, esim. Korhonen-Virtanen, esiintyvät aineistossa tässä yhdistelmämuodossa, mikäli niitä on yli 20 kappaletta.

Nimiaineistot on poimittu syyskuussa 2015.

Nimiaineisto on CSV-tiedostomuodossa. Lisäksi jokaisesta luettelosta on laadittu PDF-muotoinen lyhennelmä, jossa on tuhat yleisintä nimeä.
Author
pekkpa
Author Email
Catalogue Url
Dataset Url
Metadata Updated
2015-09-29 02:58:03
Tags
Date Released
Date Updated
Update Frequency
Organisation
Väestörekisterikeskus
Country
State
Platform
ckan
Language
fi
Version
(not set)