Kommandoer
Analyse
anova
anova var-name var-list [if] [, options]
Beskrivelse
Analyse av varians og kovarians. Gjelder variansanalyse- (ANOVA) og kovariansanalyse- (ANCOVA) modeller for balanserte og ubalanserte design. Det er påkrevd med en variabelliste der den første variablen er kontinuerlig. I anovaanalyse skal de uavhengige variablene være faktorvariabler, mens ancova-analyse inkluderer en metrisk variabel
Options
noconstant-Undertrykker modellens konstantledd (der linja krysser y-aksen)
posthoc-Kjører en mer detaljert toveis TukeyHSD-analyse med sammenlikninger mellom alle kategorier i de(n) uavhengige kategoriske variabelen(e)
Eksempler
anova inntekt kjønn utdanning
Toveis faktoriell anovaanalyse av inntekt over kjønn og utdanning
anova inntekt kjønn utdanning kjønn#utdanning
Toveis faktoriell anovaanalyse av inntekt over kjønn og utdanning med interaksjonsledd
anova inntekt kjønn##utdanning
Toveis faktoriell anovaanalyse av inntekt over kjønn og utdanning med interaksjonsledd
anova inntekt kjønn utdanning if kjønn == 'kvinne'
Toveis faktoriell anovaanalyse med modifiserende utrykk
ci
ci var-list [, options]
Beskrivelse
Vis konfidensintervaller og standardfeil for hver enkelt variabel i variabellisten
Options
level()-Spesifiserer konfidensnivået i prosent for konfidensintervallene. Standarden er 95, altså 95%
Eksempler
ci inntekt2004
Vis konfidensintervaller (standardnivå: 95%) og standardfeil for variabelen inntekt2004
ci inntekt2004 inntekt2003, level(90)
Vis konfidensintervaller sett til 90% og standardfeil for variablene inntekt2004 og inntekt2003
correlate
correlate var-list [if] [, options]
Beskrivelse
Vis korrelasjosmatrisen for de inkluderte variablene. Dersom en skriver correlate uten variabelliste, vises korrelasjonsmål for alle variablene i datasettet. Dette gjelder også ved bruk av options-alternativene
Options
covariance-Vis kovariansen for de forskjellige variablene istedet for korrelasjonsverdiene
pairwise-Manglende verdier blir slettet parvis istedetfor standardmåten (listevis sletting)
obs-Matrisen inkluderer antall observasjoner som har blitt brukt til å kalkulere hver korrelasjonskoeffisient
sig-Vis signifikansverdien til hver gruppe
Eksempler
correlate kjonn alder inntekt
Treveis korrelasjonsmatrise
correlate alder inntekt if kjonn == 'kvinne'
Toveis korrelasjonsmatrise med modifiserende utrykk
normaltest
normaltest var-list [if]
Beskrivelse
Normaltest-kommandoen kjører et utvalg tester for normalfordeling for valgte variabler, eller hele datasett dersom ingen variabler er oppgitt. For hver test er måltall og p-verdi oppgitt.
Testene som kjøres er skewness, kurtosis, s-k (ikke justert), Jarque-Bera og Shapiro-Wilk
Options
Eksempler
normaltest var1 var2
Kjør testene på var1 og var2
normaltest
Kjør testene på alle variabler i datasettet
transitions-panel
transitions-panel var-name var-list [if]
Beskrivelse
Vis to-veis frekvens/sannsynlighet for overganger mellom alle kombinasjoner av kategoriske verdier over tid (overgangssannsynligheter), for en gitt variabel. Forspalten representerer utgangsverdiene, mens tabellhodet representerer overgangsverdien. Spesifiseres flere variabler, vises toveis overgangstabeller for hver variabel i respektive tabeller.
Overganger representeres som standard gjennom frekvenser og prosenter (rekkevis). Overganger enten fra eller til manglende verdi (sysmiss) holdes utenfor tabuleringen. Overgangsratene gjelder alle overganger fra ett tidspunkt til et annet, målt over alle måletidspunkter. Kommandoen er kompatibel med kategoriske variabler
Options
Eksempler
transitions-panel var1 var2
Vis overgangssannsynligheter for to variabler (i separate tabeller)
Bindinger
let
let name = expression
Beskrivelse
Generer ny binding. Denne blir definert ved et uttrykk etter =. En binding lagrer en konkret verdi i motsetning til variabler som lagrer en mengde data.
Bindinger defineres i klienten og har ingen sammenheng med de konfidensielle verdiene i variablene. De er ment til å representere repetitive informasjon som en dato, årstall eller lignende.
Du kan derfor se den lagrede verdien av bindingene når du kjører let-kommandoen, i sidepanelet, eller ved å klikke på verdiene etter at de er generert.
Bindinger kan lagre et tall, en streng, eller et navn og skiller seg fra variabler ved at man refererer til de med et $ foran navnet på bindingen.
Bindinger kan også genereres og evalueres på samme sted ved å bruke et bindings-uttrykk. Dette er et uttrykk inne i en blokk omringet av $(...).
Ved å bruke et slik uttrykk kan du slippe å definere en binding i en egen kommando som skal kun brukes èn gang. Merk at at koden blir mer kompleks ved å bruke disse uttrykkene - om en binding gjentas flere ganger er det anbefalt å gi den et eget navn via let.
På samme måte som at variabler har et sett med funksjoner som kan operere på de, har bindinger et sett med prosedyrer som kan brukes. Se help-procedure for mer informasjon om disse.
Options
Eksempler
let årstall = '2011-11-12'
Genererer en binding til årstall med årstallet 2011-11-12 i en streng
let årstall = date_fmt(2011, 11, 12)
Genererer en binding til årstall ved hjelp av prosedyren date_fmt
let siv = sivstand_ ++ $år
Genererer en binding til navnet siv. Om f.eks den eksisterende bindingen år har verdien 12, blir $siv = sivstand_12
import fdb/SIVSTANDFDT_SIVSTAND $årstall as $siv
Importerer variabelen SIVSTANDFDT_SIVSTAND ved å bruke årstallet lagret i årstall og navnet lagret i $siv. Dette er ekvivalent med å kjøre import fdb/SIVSTANDFDT_SIVSTAND 2011-11-12 as sivstand_12
import fdb/SIVSTANDFDT_SIVSTAND date_fmt(2011, 11, 12) as sivstand_ ++ $år
Importerer variabelen SIVSTANDFDT_SIVSTAND med å bruke verdier generert i bindings-uttrykk. Dette uttrykket er ekvivalent med det over. Når datoer forventes kan man gi inn en prosedyre direkte for å få datoverdien. Se help procedure for mer informasjon om disse. Når et nytt navn forventes kan man gi inn et uttrykk direkte. Konkatineringsoperatoren ++ slår sammen symbolet og verdien lagret i bindinen $år til verdien sivstand_12
for
for i [, j] in (iter0, iter1, ..., iterN | range-from : range-to) [, iters...] [; g in ..]
Beskrivelse
Start en løkke over alle iterator-verdiene etter in. Dette kan enten en liste av verdier, eller et numerisk verdiområde gitt med n : m (inklusiv).
Alle etterfølgende kommandoer frem til løkken er lukket med end vil bli kjørt med iteratoren bundet til den første verdien gitt, i = iter0.
Når end eksekveres vil så alle kommandoene inne i løkken bli kjørt med de etterfølgende iteratorverdiene, i = iter1, ... i = iterN.
Alle bindinger som skapes inne i løkken er lokale for den løkke-iterasjonen, men variabler som skapes, eller endringer på eksisterende variabler vil være tilgjengelige etter løkken.
Itererasjon over flere verdier samtidig støttes ved en form for løkke-'comprehension'. For å iterere over tupler, tripler. osv av verdier oppgis et sett med flere iteratorer separert med komma før in.
Like mange lister med verdier, eller verdiområder, også separert av komma, må oppgis etter in.
Nøstede løkker oppnås med å følge løkken med en ; og så et nytt sett med iteratorer og verdier. Den siste løkken vil så kjøres for hver av de forestående iteasjonene.
Options
Eksempler
for forelder in mor, far
Starter en løkke med iteratoren forelder over symbolene mor og far
for år in 0 : 5
Starter en løkke på år over heltallene fra 0 til og med 5
for år, verdi in 0 : 2, første andre tredje
Starter en løkke på år og verdi over verdiene 0 første, 1 andre og 2 tredje
for år, verdi in 0 : 2, første andre tredje; sted in 'indre' 'ytre'
Starter en løkke på år, verdi og sted over verdiene 0 første indre, 1 andre indre, 2 tredje indre, 0 første ytre, 1 andre ytre og 2 tredje ytre
end
end
Beskrivelse
Avslutt løkken og kjører kommandoene i løkken for de resterende iteasjonene. Se help for.
Options
Datasett
require
require datastore as local-ds-alias
Beskrivelse
Opprett kobling fra en versjonert datakilde til et lokalt alias. Må brukes før import av data kan gjenmomføres.
Merk at denne kommandoen gjelder globalt, altså på tvers av dine datasett. Det lokale aliaset brukes som prefix sammen med et /-tegn i forbindelse med import av variabler
Options
Eksempler
require no.ssb.fdb:9 as ds
Lager en kobling fra versjon 9 av SSB sin registerdatabase til det lokale navnet ds
create-dataset
create-dataset new-dataset
Beskrivelse
Opprett et tomt datasett med det oppgitte navnet. Datasettet aktiveres automatisk når kommandoen kjøres.
Options
Eksempler
create-dataset newdata
Oppretter et tomt datasett med navn newdata
delete-dataset
delete-dataset dataset
Beskrivelse
Slett hele det spesifiserte datasettet og alle de inkluderte variablene
Options
Eksempler
delete-dataset PERSON
Sletter hele datasettet PERSON
use
use dataset
Beskrivelse
Aktiver et eksisterende datasett. Dersom to eller flere datasett er opprettet gjennom kommandoen create-dataset, må denne kommandoen brukes for å forflytte seg fra ett datasett til et annet.
Options
Eksempler
use trygdedatasett
Aktiverer datasettet trygdedatasett
clone-dataset
clone-dataset dataset new-dataset
Beskrivelse
Kopier et datasett
Options
Eksempler
clone-dataset set1 set2
Lag en kopi av datasettet set1 og gi det navnet set2
clone-units
clone-units dataset new-dataset
Beskrivelse
Oppretter et nytt tomt datasett som består av populasjonen/enhetene fra et angitt datasett. Bruk kommandoen use for å aktivere det nye datasettet
Options
Eksempler
clone-units set1 set2
Lager et nytt tomt datasett, set2, som består av populasjonen fra set1
rename-dataset
rename-dataset dataset new-dataset
Beskrivelse
Gir nytt navn til et eksisterende datasett
Options
Eksempler
rename-dataset navn nyttnavn
Datasettet endrer navn fra navn til nyttnavn. All annen informasjon forblir som før
reshape-from-panel
reshape-from-panel
Beskrivelse
Kommandoen endrer datastrukturen fra panel-/long-format til wide-format der opplysningene struktureres horisontalt på variabelnivå med én record per enhet.
Datasett med panel-/long-format lages enten gjennom kommandoen import-panel eller reshape-to-panel. Alle variabler i datasettet du står i restruktureres til wide-format etter at kommandoen er kjørt.
Variablene får suffiks basert på undernivået gitt ved variabelen date@panel.
Options
reshape-to-panel
reshape-to-panel variable-prefixes
Beskrivelse
Datasett som er laget ved bruk av import-kommandoen er av typen 'wide' (opplysninger om hver enhet struktureres på variabelnivå). Kommandoen endrer datastrukturen slik at den blir på panel-/long-format, og opplysninger om hver enhet struktureres da vertikalt på observasjons-/record-nivå.
Kommandoen tar et sett med prefiks til eksisterende variabler. Disse bestemmer hvilke variabler som omgjøres til panelvariabler i det nye formatet og suffiksene til hver variabel bestemmer innholdet i datokolonnen (typisk brukes alle bokstaver frem til siffer/suffiks som angir årstall, dato, nummer eller liknende). Kun sifre og spesialtegn som ikke er bokstaver godtas som suffiks. Øvrige variabler i datasettet regnes som faste opplysninger og repeteres for alle observasjoner per enhet i det nye panel-datasettet
Options
Eksempler
reshape-to-panel sivilstand kommune
Gjør om datasettet til long-format med de to variablene sivilstand og kommune. Det opprinnelige datasettet har variablene sivilstand19, sivilstand20, sivilstand21, kommune19, kommune20 og kommune21.
Opplysningene legges da nedover med tre observasjoner per enhet, sortert i stigende rekkefølge etter suffiks-sifrene 19, 20 og 21. Hjelpevariabelen panel@date opprettes automatisk, og inneholder suffiks-verdiene 19, 20 og 21.
reshape-to-panel arbeidstid heltid_deltid
Gjør om datasettet til long_format med de to variablene arbeidstid og heltid_deltid. Det opprinnelige datasettet har variablene arbeidstid2021_01_01, arbeidstid2021_02_01, arbeidstid2021_03_01,
heltid_deltid2021_01_01, heltid_deltid2021_02_01 og heltid_deltid2021_03_01. Opplysningene legges da nedover med tre observasjoner per enhet, sortert i stigende rekkefølge etter ISO-datoene 2021_01_01, 2021_02_01 og 2021_03_01.
Tilrettelegging
import
import register-var [time] [as name] [, options]
Beskrivelse
Generer en ny tverrsnittsvariabel i det gjeldende datasettet basert på en registervariabel i en tilkoblet datakilde med et spesifisert måletidspunkt. Dersom ingen datasett eksisterer, må man opprette et først. Dersom et nytt navn ikke spesifiseres får variabelen et standardnavn. Merk at dato skal utelates for konstante variabler.
Se kommandoen create-dataset for å opprette datasett og require for å koble til datakilder
Options
outer_join-Spesifiser at 'outer join' skal brukes ved import av datasettet.
Dette vil inkludere rader fra både det eksisterende datasettet, samt alle rader fra datasettet til variabelen som importeres. Altså gjøres en (full) outer join. Dette er i motsetning til en vanlig import som fungerer på (outer) left join prinsippet. Det vil si at alle radene i det eksisterende datasettet og kun radene til import-variabelen som eksisterer i dette vil bli importert.
Eksempler
import fd/F_REHAB_INNV_GRAD 2011-11-12 as rehab2011
Tverrsnittsvariabelen rehab2011 blir skapt fra registervariabelen fd/F_REHAB_INNV_GRAD, med måletidspunkt 12. november 2011 og lagt til i det gjeldende datasettet
import fd/INNTEKT_WLONN 2011-11-12
En tverrsnittsvariabel blir skapt fra registervariabelen fd/INNTEKT_WLONN, med måletidspunkt 12. november 2011 og lagt til i det gjeldende datasettet. Siden navn ikke er spesifisert får den et standardnavn basert på registervariabelnavnet
import fd/BEFOLKNING_FOEDSELS_AAR_MND as fødselsdato
En tverrsnittsvariabel med fast opplysning blir skapt fra registervariabelen fd/BEFOLKNING_FOEDSELS_AAR_MND og lagt til i det gjeldende datasettet. Siden fd/BEFOLKNING_FOEDSELS_AAR_MND er en konstant variabel skal man ikke oppgi noe måletidspunkt
import-event
import-event register-var time to time [as name] [, options]
Beskrivelse
Generer en ny hendelsesvariabel/forløpsvariabel i det gjeldende datasettet basert på en registervariabel i en tilkoblet datakilde i det spesifiserte tidsrommet. Dersom et nytt navn ikke spesifiseres får variabelen et standardnavn.
Dersom ingen datasett eksisterer, må man opprette et først. Hendelsesvariabler/forløpsvariabler kan ikke importeres inn i et datasett med tverrsnittsdata (og vice versa). Det er heller ikke mulig å importere flere hendelsesvariabler/forløpsvariabler inn i ett og samme datasett (en må da opprette et eget datasett for hver variabel).
Se kommandoen create-dataset for å opprette datasett og require for å koble til datakilder
Options
Eksempler
import-event fd/F_REHAB_INNV_GRAD 2011-11-12 to 2012-11-12 as rehab2011to2012
Forløpsvariablelen rehab2011to2012 blir skapt fra registervariabelen fd/F_REHAB_INNV_GRAD for perioden 12. november 2011 til 12. november 2012 og lagt til i det gjeldende datasettet
import-panel
import-panel register-var register-var-list time [time ...]
Beskrivelse
Importerer de valgte variablene i 'langt' format med repeterte enheter fra variabler i en tilkoblet datakilde. Dette muliggjør analyse via panelmetoder. Kan kun brukes i et tomt datasett.
Se kommandoen create-dataset for å opprette datasett og require for å koble til datakilder
Options
Eksempler
import-panel ds/BEFOLKNING_KJONN ds/INNTEKT_WLONN 2001-01-01 2002-02-02 2003-01-01
Importerer to variabler på tre tidspunkt
generate
generate name = expression [if]
Beskrivelse
Skap ny variabel. Denne blir definert ved et uttrykk etter =. Generelle aritmetiske funksjoner er støttet. Funksjonsuttrykk støttes også (oversikt over funksjoner vises ved å bruke kommandoen help-function)
Options
Eksempler
generate nyvariabel = inntekt/2
genererer en variabel som heter nyvariabel. Verdien for hver enhet vil være halvparten av inntekstverdien
generate nyvariabel = inntekt/2 if fodear < 1985
Skaper en variabel ved navn nyvariabel der verdien for hver enhet er lik inntekten delt på to dersom de er født før 1985. Alle andre får manglende verdier
rename
rename old-name new-name
Beskrivelse
Gir nye navn til eksisterende variabler
Options
Eksempler
rename loonn lonn
Variabelen endrer navn fra loonn til lonn. Verdiene og all annen informasjon forblir som før
clone-variables
clone-variables var-name [-> new-name] [var-name [-> new-name] ...] [, options]
Beskrivelse
Lag kopier av en eller flere variabler. Kopiene kan få eksplisitte navn eller originalens navn med et prefiks og/eller et suffiks
Options
prefix()-Angi prefiks som skal brukes sammen med originalvariablenes navn til å navngi kopiene
suffix()-Bruk originalvariablenes navn og angitt suffiks til å navngi kopiene
Eksempler
clone-variables var1 -> new1 var2 -> new2
Lager kopier av var1 og var2 med navn new1 og new2
clone-variables var1 var2, prefix('new_')
Oppretter variablene new_var1 og new_var2
drop
drop (var-list | if)
Beskrivelse
Fjern variabler, enheter eller observasjoner fra datasettet dersom en betingelse blir oppfylt. En kan fjerne enten en variabelliste, drop var-list, eller gitte observasjoner (for eksempel drop if var-name > x), men ikke begge deler samtidig.
Når var-list er spesifisert vil variabelkolonnen bli fjernet. Når if er spesifisert, vil de gjeldende observasjonen bli slettet.
Options
Eksempler
drop alder
fjerner variabelen alder fra datasettet
drop if inntekt < 500000
Sletter alle observasjoner på alle variabler der enheten har en verdi på under 500000 for variabelen inntekt
keep
keep (var-list | if)
Beskrivelse
Sletter alle observasjoner og enheter i datasettet som ikke oppfyller de spesifiserte kriteriene og beholder de som gjør det. En kan beholde enten en variabelliste, keep var-list, eller gitte observasjoner (for eksempel keep if var-name > x).
Når var-list er spesifisert vil variabelkolonnen bli beholdt. Når if er spesifisert, vil de gjeldende observasjonene bli beholdt.
Options
Eksempler
keep alder
Beholder variabelen alder i datasettet, og sletter alle andre
keep if alder < 20
Beholder alle observasjoner for enheter der alder er under 20 og sletter alle andre
aggregate
aggregate (statistic) var-name -> new-name [[(statistic)] var-name -> new-name...] [, options]
Beskrivelse
Kjører en oppsummerende utregning av en variabel der man grupperer etter en grupperingsvariabel oppgitt i by()-parameteret. Datasettet vil etter utregningen bestå av en ny variabel med de utregnede verdiene. Denne spesifiseres etter ->-tegnet. Man kan lage flere utregninger samtidig, også med forskjellige statistic-spesifiseringer. For at utregningene skal fungere må verdiene være på numerisk format (bortsett fra måletypen count).
Kommandoen har likheter med collapse. Forskjellen er at aggregate beholder datastrukturen og legger bare til de utregnede verdiene på variabelnivå, mens collapse gjør en aggregering av hele datasettet der den nye enhetstypen blir bestemt av by-variabelen. Et slikt aggregert datasett vil dessuten bare inneholde de aggregerte variablene. Ved bruk av aggregate beholder man alle de andre variablene.
statistic kan være følgende: mean, min, max, median, count (antall enheter med gyldig verdi), sum, semean (standardfeil av gjennomsnitt), sebinomial (binominal standardfeil av gjennomsnitt), sd (standardavvik), percent (prosentandel gyldige verdier), iqr (interkvartilbredde), gini (gini-koeffisient). Alle aggregeringsvariantene krever at variabelen er numerisk bortsett fra count.
Options
by()-Grupperingsvariabelen utregningen skal grupperes over
Eksempler
aggregate (mean) lønn -> snittlønn, by(kommune)
Regner ut gjennomsnittet av variabelen lønn gruppert etter variabelen kommune.
Alle enheter med samme bostedskommune får samme gjennomsnittsverdi. Resultatet legges i den nye variabelen snittlønn.
aggregate (mean) lønn -> snittlønn (min) lønn -> minimumslønn (max) lønn -> maksimumslønn, by(kjønn)
Regner ut hhv. gjennomsnitt, minimums- og maksimumsverdi av variabelen lønn, gruppert etter variabelen kjønn.
Alle enheter med samme kjønn får tilegnet samme verdi for gjennomsnitt, minimums- og maksimumsverdi.
De utregnede verdiene legges i de nye variablene snittlønn, minimumslønn og maksimumslønn
aggregate (mean) lønn -> snittlønn formue -> snittformue strømforbruk -> snittforbruk (max) strømforbruk -> maksforbruk, by(kommune)
Regner ut gjennomsnitt av hhv. variablene lønn, formue og strømforbruk, og maksverdi for strømforbruk, gruppert etter variabelen kommune.
Alle enheter med samme bostedskommune får tilegnet samme verdi for snittlønn, snittformue, snittforbruk og maksforbruk.
aggregate (sum) inntekt -> familieinntekt, by(familienummer)
Summerer inntekt over alle familiemedlemmer gitt ved variabelen familienummer. Alle medlemmer av den samme
familien får samme verdi for summert familieinntekt. Den summerte verdien legges i den nye variabelen familieinntekt.
collapse
collapse (statistic) var-name [-> new-name] [((statistic) var-name [-> new-name])...] [, options]
Beskrivelse
Aggreger variabler etter grupperingsvariabel oppgitt i by()-parameteret. Datasettet vil etter aggregering bestå av de spesifiserte aggregeringsvariablene (opprinnelige verdier erstattes med aggregert verdi) samt grupperingsvariabelen,
og enhetstype defineres av grupperingsvariablen. En kan aggregere mange numeriske variabler samtidig, også med forskjellige statistic-spesifiseringer.
statistic kan være følgende: mean, min, max, median, count (antall enheter med gyldig verdi), sum, semean (standardfeil av gjennomsnitt), sebinomial (binominal standardfeil av gjennomsnitt), sd (standardavvik), percent (prosentandel gyldige verdier), iqr (interkvartilbredde), gini (gini-koeffisient). Alle aggregeringsvariantene krever at variabelen er numerisk bortsett fra count.
Options
by()-Grupperingsvariabelen det aggregeres opp til
Eksempler
collapse (mean) lønn, by(bosted)
Kollapser variabelen lønn og lager en ny variabel som viser snittverdien for lønn for hver enhet i bostedsvariablen (grupperingsvariablen).
collapse (mean) lønn (min) Start@lønn (max) Stop@lønn, by(kjønn)
Aggregering av variablene lønn, Start@lønn og Stop@lønn. lønn blir skapt om til en aggregert variabel som gir snittverdien per kjønn, mens Start@lønn blir skapt om til å vise tidligste startverdi for Start@lønn.
Stop@lønn blir på samme måte skapt om til å vise siste stoppverdi for Stop@lønn
collapse (sum) inntekt -> familieinntekt, by(familienummer)
Aggregerer opp fra personnivå til familienivå (summerer familiemedlemmers inntekter og lager familieinntekt) og kobler familiedataene på et persondatasett.
Gir også et nytt navn til den aggregerte variabelen inntekt som blir familieinntekt for å gjenspeile dette
merge
merge var-list into dataset [on variable]
Beskrivelse
Koble variabler inn i et annet datasett på samme eller lavere enhetsnivå. Den kan f.eks. brukes til å koble faste opplysninger inn i et forløpsdatasett eller til å koble aggregert informasjon på kommunenivå inn i et persondatasett med bostedskommune som koblingsvariabel
Options
Eksempler
merge kjønn inntekt10 into datasett1
Kobler variablene kjønn og inntekt10 inn i datasett1. Enhetsidentifikatoren i datasett1 blir brukt for kobling siden ingen koblingsvariabel er eksplisitt oppgitt
merge antallinnbyggere into persondatasett on bostedskommune16
Kobler en aggregert variabel (antall innbyggere aggregert til kommunenivå) inn som en kontekstuell variabel i et persondatasett. Koblingsvariablen er bostedskommune16
recode
recode var-list (rule) [(rule)...] [if] [, options]
Beskrivelse
Endre verdiene til en eller flere variabler i henhold til et sett med regler. Verdier som ikke berøres av noen regler forblir uendret. De opprinnelige variablene overskrives. En regel består av en venstreside og en høyreside separert av =.
Regler omkoder enten et sett med tallverdier, eller et sett med strenger.
Venstresiden spesifiserer verdier som skal omkodes og er enten en liste av diskrete verdier og/eller lukkede intervaller; eller en av kodene missing, nonmissing eller * der sistnevnte betyr enhver verdi. Intervaller kan kun benyttes for omkoding av tallverdier. Her kan også også verdiene min og max brukes for den hhv. minste og største koden i kodelisten.
Høyresiden spesifiserer erstatterverdien. Reglene kjøres i den rekkefølgen de er oppgitt. Verdier som allerede er omkodet påvirkes ikke av påfølgende regler. Regler som følger etter en med venstreside lik * får dermed ingen virkning.
Options
prefix()-Opprett ny(e) variabel/-ler med de omkodete verdier, som tar originalnavnet med det spesifiserte prefikset foran
generate()-Opprett nye variabler for de de omkodete verdier, med agnitt prefiks
Eksempler
recode var1 (1 2 3 = 0)
Endrer verdiene 1, 2 og 3 til 0 i variabelen var1.
recode var1 var2 ('1' '2' '3' = '0') ('4' = '1')
Endrer verdiene '1', '2', '3' til '0' og verdien '4' til '1' i variablene var1 og var2 av alfanumerisk datatype.
recode var1 var2 (1/7 = 0)
Endrer verdiene fra 1 til 7 til 0 i variablene var1 og var2. Dette er kun mulig for omkoding av tall.
recode var1 var2 (1/7 = 0) (nonmissing = 1) (missing = 99 "vet ikke" missing)
Endrer verdiene fra 1 til 7 til 0, andre gyldige verdier til 1, samt alle missing-verdier til 99 i variablene var1 og var2. Verdien 99 får i tillegg merkelappen "vet ikke" og flagges som missing.
recode var1 var2 (1/7 = 0) (* = 99)
Endrer verdiene fra 1 til 7 til 0, alle andre verdier til 99 i variablene var1 og var2
recode var1 var2 (min/5 = 0) (10/max = 99)
Endrer verdiene i intervallet mellom den minste i kodelisten og 5 til 0 og verdiene i intervallet mellom 10 og den største koden til 99 i variablene var1 og var2.
recode var1 var2 (1/7 = 0), prefix('new_')
Oppretter variablene new_var1 og new_var2 som inneholder omkodete verdier fra hhv. var1 og var2.
recode regstat ('3' '5' = '0' 'ikke-bosatt')
Endrer verdiene '3' og '5' til '0' for variabelen regstat, og lager en verdi-label med navnet 'ikke-bosatt' som knyttes til denne verdien.
replace
replace var-name = expression [if]
Beskrivelse
Endr verdier for enheter i en variabel dersom de dekkes av det definerte uttrykket. Om ikke forblir de som de var.
Generelle aritmetiske funksjoner er støttet. Funksjonsuttrykk støttes også (oversikt over funksjoner vises ved å bruke kommandoen help-function)
Options
Eksempler
replace inntekt = inntekt/10
Erstatter verdiene for inntekt med inntekt delt på ti.
replace inntekt = inntekt/10 if kjonn==1
Som over, men kun for de enheter som har verdien 1 for kjønn
destring
destring var-list [, options]
Beskrivelse
Konverter alfanumeriske verdier til numeriske verdier. Dette kan bare gjøres for variabler med alfanumerisk dataformat.
Etter at kommandoen er kjørt, vil spesifisert(e) variabel/variabler endre format til numerisk. Inneholder verdikodene bokstaver eller andre ikke-numeriske tegn, vil du få en feilmelding.
Options
prefix()-Opprett ny(e) variabel(er) med de omkodete verdiene, som tar originalnavnet med det spesifiserte prefikset foran.
ignore()-Fjern spesifiserte ikke-numeriske karakterer før konvertering. Slik kan du konvertere ellers delvis gyldige verdier til numeriske verdier.
force-Koder med bokstaver (og andre ikke-tall) settes til missing. Er spesielt nyttig om dette gjelder noen få koder.
dpcomma-Alfanumeriske kommategn konverteres til desimaltegn og erstattes med punktum