Det har pågått ett intensivt utvecklingsarbete på Statistiska Centralbyrån (SCB) under de senaste åren i syfte att standardisera och effektivisera statistikproduktionsprocessen. I detta utvecklingsarbete har fokus främst riktats mot processerna insamling och granskning. Ett flertal studier har visat att det finns potential att reducera granskningens omfattning samtidigt som den övergripande kvaliteten i undersökningarna bibehålls. För att uppnå detta krävs att nya arbetssätt, metoder och verktyg utvecklas och implementeras.
Den traditionella ansatsen på SCB har varit att i granskningsprocessen försöka hitta och rätta alla databearbetnings- och mätfel. Ingen skillnad har gjorts mellan stora och små fel eller om felen har någon effekt på statistiken eller inte. Detta är en ineffektiv ansats där stora resurser åtgår till att rätta fel som inte påverkar den statistiska redovisningen nämnvärt. I mer moderna ansatser betonas vikten av att hitta betydelsefulla fel som har stor påverkan på parameterskattningarna och att fel som inte ger någon påverkan bör lämnas som de är eller åtgärdas via imputering. Detta, att inte granska allt, kallas för selektiv granskning.
SCB har beslutat att införa metoden selektiv granskning med poängfunktioner. Metoden fordrar att poängberäkningar görs, dessa utförs i verktyget Selekt. Verktyget ingår i den framtida verktygslådan för granskning som är under utveckling vid SCB och är uppbyggt av ett stort antal parametrar. För att uppnå så effektiv granskning som möjligt måste de mest lämpliga parametervärdena sökas för att sedan implementeras i Selekt.
I denna studie har ett datamaterial från undersökningen Kortperiodisk Sysselsättningsstatistik, privat sektor (KSP) använts för att studera sambanden mellan statistikens kvalitet och valet av parametrar i Selekt. Valet av datamaterial motiveras främst av att Selekt ska implementeras i KSP under år 2010. De parametrar som har behandlats i studien kallas för KAPPA, TAU och LAMBDA samt variablerna RPB_20 och Kostnad.
Logistisk regression har använts för att undersöka vilken påverkan parametrarna har på den bias (kallad RPB) som införs i skattningarna vid selektiv granskning. En ansats valdes där sambandet mellan responsvariabeln RPB_20 och förklaringsvariablerna KAPPA, TAU och Kostnad studerades separat för olika värden på LAMBDA.
Vid resultatframställningen indikerades tidigt att valet av värde på LAMBDA inte verkade ha någon nämnvärd betydelse för modellen och i de fortsatta analyserna stärktes denna misstanke och kom att omfatta även KAPPA och TAU. Det var redan från början känt att Kostnad är en viktig variabel att ta hänsyn till och för att undersöka detta närmare konstruerades en modell bestående av ett fjärdegradspolynom med enbart variabeln Kostnad. Modellen lyckades fånga upp huvuddragen av variationen i RPB_20.
Det går inte att dra generella slutsatser från den studie som här har genomförts. Resultaten visar dock att en modell utan KAPPA, TAU och LAMBDA fungerar för att beskriva variationen i RPB_20. Valet av värden på KAPPA, TAU och LAMBDA i Selekt är av mindre betydelse. I implementeringsarbetet av Selekt i KSP rekommenderas därför att, förutom RPB, fokusera på variabeln Kostnad för att hitta den mest lämpliga kombinationen av parameterinställningar.