2.6 Filtrering av datasettutvalg
Filtrering av datasett gjøres gjennom å bruke kommandoene drop eller keep etter at man først har laget et datasett ved hjelp av en import-kommando:
import ds/BEFOLKNING_KJOENN as kjønn
drop if kjønn == '1'
If-betingelser kan brukes i mange sammenhenger i microdata.no, og kan bygges opp med de vanlige logiske operatorene:
-
Større enn:
> -
Mindre enn:
< -
Er lik:
== -
Større enn eller lik:
>= -
Mindre enn eller lik:
<= -
Er ulik:
!= -
Eller:
| -
Og:
&
For å fjerne personer under 18 år fra utvalget, kan en skrive følgende:
keep if alder >= 18
Verdi for manglende data ("missingverdier") kan angis på følgende måte:
sysmiss(<variabel>)
For å fjerne alle individer uten oppgitt lønnsinntekt, kan en da skrive:
drop if sysmiss( lonn )
Det er også mulig å trekke et tilfeldig utvalg av en datapopulasjon. Dette gjøres med kommandoen sample. For mer om syntax og eksempler, bruk kommandoen help sample.