Multipla mål

Relaterad information
Bedömning av måluppfyllelse - en introduktion Att använda hjälpinformation vid bedömning av måluppfyllelse

Hem » Bedömning av måluppfyllelse » Multipla mål

Multipla indikatorer

Antalet indikatorer kan vara mycket stort. Låt oss beteckna dem Y₁, Y₂, ..., Y_n (och använder samma beteckningar för deras värden). De kan behandlas på olika sätt, mycket beroende på hur målfunktionen eller målfunktionerna formuleras. De kan t.ex.

behandlas som n stycken separata indikatorer, eller
vägas samman till en indikator Y, där alltså Y=w₁Y₁ + w₂Y₂ + ... +w_nY_n , eller
betraktas som en multivariat variabel (Y₁, Y₂, ..., Y_n)

I fallet b sätts vikterna w₁ med hänsyn till hur viktiga de olika indikatorerna bedöms, noggrannheten i deras skattningar (och där inbegrips skalenheter) och även korrelationer mellan skattningarna. Ofta sätts summan av vikterna till 1, men det är inte nödvändigt. Man behöver inte heller använda alla de ursprungliga indikatorerna (sätt vissa w₁=0).

För fallen b och c kan (Y₁, Y₂, ..., Y_n) resultera i flera (men färre) nya indikatorer som man kan betrakta som separata, var och en i en dimension eller flera. Vi kan alltså att det är fallen a eller c som gäller i fortsättningen. I fallet c har vi en eller flera multivariata (vektorvärda) indikatorer, i fall a är de en-dimensionella.

Multipla mål

Multipla mål komplicerar teorin och praktiken väsentligt. Nedan antyds problemen, och några lösningar på dem (om de finns) presenteras inte. Vi har ett mål för varje indikator. Om samtliga indikatorer är en-dimensionella kan målet vara

Y_i ≥ G_i

för alla indikatorer i=1,...,n)

Om vi först antar att vi vill använda hypotesprövning för att avgöra om målet är uppfyllt får vi problem, dels med val av testfunktion (statistika) och dels med att kontrollera sannolikheten att begå ett fel av typ I, alltså att påstå att målet är uppfyllt när det inte är sant, alltså om det för åtminstone en indikator gäller att Y_i < G_i. Problemet är för komplicerat för att behandlas ytterligare här. Samma sak gäller för angreppssättet med konfidensintervall. Det finns dock (multivariata) för multinormalfördelade variabler konfidensellipsoider för de sanna värdena (Y₁, Y₂, ..., Y_n) , men de är inte optimala för en målfunktion av ovanstående typ.

Vad blir det då för problem om vi använder hypotesprövning varje indikator för sig? Sannolikheten att påstå att målet är uppnått, givet att det inte är det, kontrolleras varje test för sig. Upprepar vi nu prövningen många gånger blir sannolikheten att vi åtminstone någon gång påstår att målet är uppnått, givet att det inte är det att bli betydligt större. Om sannolikheten är 5 % per gång kan den ”globala” sannolikheten i värsta fall bli 50 % om vi har 10 indikatorer. Om man här, med 10 indikatorer, skulle vilja kontrollera den ”globala” sannolikheten på nivån 5 % måste vi välja nivån 0.5 % per gång (eller nästan det) och då ökar siffran 1.645 i avsnitt 5 till 2.323, d.v.s. kravet på övermål

_i - G_i per test ökar väsentligt.

Nu bör man väl tillägga här att om målen (gränserna G_i) är rimligt satta, med syftet att urskilja det som verkligen behöver åtgärdas, och om datamängderna är rimligt stora och har god kvalitet så borde dels de flesta målen vara uppfyllda och även testerna visa det. Det blir nog vanligare att man inte törs påstå att målet är uppfyllt trots att det är det än det omvända.

Använder man i stället ”direkt insättning” uppstår problemet att försöka ange ”sannolikheten för fel beslut (felklassificering)”. För varje enskild indikator kan det gå, men det är om vill vi göra beräkningen ”globalt” som det blir komplicerat.

I bägge fallen kompliceras teorin ytterligare om man tillåter sig att acceptera att målet inte är uppfyllt för en viss (liten) andel av indikatorerna.

Andra metoder att avgöra om statusen är god kan användas om vi anlägger det multivariata betraktelsesättet, alltså ser hela vektorn (Y₁, Y₂, ..., Y_n) som en indikator. En metod kan vara diskriminantanalys, vilken då skulle kunna tillämpas så att man för ett antal objekt med hög status har värden på (Y₁, Y₂, ..., Y_n) och likaså för ett antal objekt med låg status. Här kan man då för ett nytt objekt, med okänd status, använda de två datamängderna för att avgöra om det nya objektet tillhör populationen med hög status eller den med låg status (man kan använda fler än två populationer).

Per objekt eller en population av objekt

Ett mål (en- eller flerdimensionellt) kan gälla enstaka objekt (enstaka sjöar, enstaka habitat) eller en population av objekt (alla sjöar i ett län eller i riket). På liknande sätt som i föregående avsnitt får vi problem med beräkningar av sannolikheter och risker. Nedan ges bara en antydan om detta.

Används hypotesprövning för enstaka objekt får vi räkna med att ett (kanske stort) antal objekt inte kan bevisas ha uppfyllt målet, antingen därför att de i verkligheten uppfyllt det med liten marginal eller för att precisionen i skattningen

är låg (för litet data). Andelen objekt som felaktigt bedömts uppfylla målet kontrolleras till del genom signifikansnivån.

Används metoden med direkt insättning för enstaka objekt kommer man givetvis att råka ut för en viss andel felklassificeringar. Skulle man kunna beräkna sannolikheten för var och en och om de mätningar som görs för olika objekt sker oberoende av varandra finns det möjligheter att utföra sannolikhetsberäkningar för andelen felklassificeringar (förväntade andelen kan relativt enkelt beräknas).

För en population kan målet vara formulerat på litet olika sätt. Målet kan t.ex. vara ”för alla objekt ska ett villkor vara uppfyllt” eller ”för en viss given andel av objekten ska ett villkor vara uppfyllt” eller ”för en viss andel av populationens totala areal ska ett villkor vara uppfyllt”. Inget av de här exemplen medger enkla beräkningar av sannolikheten för felaktigt beslut. En orsak till detta är att de observerade objekten i populationen normalt utgör ett sampel (stickprov) och att mätningar på objekten själva är ett sampel (i tid eller rum). Att 7 av 10 objekt enligt något kriterium (av de ovan relaterade) är godkända behöver inte betyda att ett skattat värde på 70 % godkända av objekten i hela populationen är särskilt bra. Orsaken till att tre ej är godkända kan ju vara att data var otillräckliga för att kunna godkänna dem.

En sammanfattning av de senaste avsnitten

Med många variabler och många objekt kommer säkerligen en hel del felklassificeringar att göras. Att utföra formella beräkningar av sannolikheter för olika slags fel torde vara rätt komplicerade och kanske inte speciellt meningsfulla. Ska vi ha full kontroll t.ex. av signifikansnivån vid hypotesprövning skulle det troligen krävas enorma resurser på data-insamling. En del utredningsarbete verkar dock vara befogat för att finna lämpliga beslutsregler.