Amalgamenheten

Orimliga beräkningsmodeller

Av nedanstående brev framgår hur fakultetsgruppens beräknings modeller är som skapade för att kunna avfärda patienternas hälsoförbättringar som ringa eller mycket små!

Det är hög tid och absolut nödvändigt med en etisk granskning av fakultetsgruppen, och av vilka ovidkommande intressen som skulle kunna ligga bakom denna rapport. Det verkar högst osannolikt att denna negativa framställning av effekten på amalgamsanering enbart skulle bero på okunskap.

I flera fall kring amalgam och mätmetoder för detta, finns klara belägg för att "man" har ändrat "åsikter" efter att miljonbelopp i forskningbidrag utbetalats! I åratal har tobaksindustrin betalat ut forskningspengar för att få fram rätt typ av rapporter. (se brev Amalgam jämfört med tobak)

Att marknaden "pengarna" styr kommer vi nog aldrig ifrån, men då det så här påtagligt drabbar patienter, som inte får den vård de bör få, måste det beivras med all kraft. Vilka åtgärder kommer våra politikerna nu att vidta? Det är väl inte möjligt att detta skall få fortgå utan åtgärder från politiker och beslutsfattare? Kostnaderna för "meningslös" sjukvård och sjukersättning kommer bara att fortsätta stiga om inte dessa patienter får adekvat hjälp.

Date: Wed, 19 Jan 2000 11:38
To: (Enligt sändlista )

Subject: Fakultetsgruppens andra delrapport (2)

I min förra kommentar till FG:s andra delrapport snuddade jag vid ett problem som har stor betydelse för hur resultaten kommit att tolkas. Rapporten beskriver statistiskt hur enskilda symtom förändrats i olika *grupper* av patienter, men det som saknas är ett samlat grepp på *individernas* hälsotillstånd före och efter amalgamsanering. I ett stycke mitt på sid 5 diskuteras visserligen enkätens mått på livskvalitet, men FG förbigår frågorna om subjektiv fysisk resp psykisk hälsa som också ställdes vid uppföljningen. Livskvaliteten hade enligt FG:s redovisning förbättrats hos 75% av de färdigsanerade. Inte desto mindre drar man slutsatser som den följande (sid 7):

"Denna undersökning av den kliniska erfarenheten vid Amalgamenheten på Akademiska sjukhuset i Uppsala visar att behandlingsresultaten i en grupp med mycket vida diagnostiska ramar sannolikast är måttliga."

Upsala Nya Tidnings referat hade rubriker som "Besvär trots amalgamsanering: Få patienter helt friska" och "Få nöjda efter amalgamsanering: Patienter anger måttlig förbättring av besvären". Rubrikerna är inte orimliga, eftersom detta är ett möjligt sätt att läsa delrapporten. Säkert har andra läsare än UNT fått ungefär samma uppfattning om resultatet. Men kan det konkreta värdet av amalgamsanering fastställas genom att 30 olika självskattade symtom var för sig blir föremål för olika statistiska beräkningar? Patienterna har faktiskt inte sagt att de bara blivit måttligt förbättrade.

Siffrorna som fyller FG:s tabeller härstammar ju från svar på frågeformulär som satts samman för ändamålet. Det är inte fråga om mätinstrument i någon vetenskaplig mening, utan ganska enkla redskap för att registrera och gradera förekomst av symtom. När man skall analysera resultaten gäller det att undvika fallgropar och att inte bygga alltför avancerade analyser på sådana relativt grova skattningsdata.

Symtombilden vid "amalgamsjuka" är oenhetlig. Det förekommer många olika symtom, men alla patienter har inte alla symtom. En patient som saknar ett symtom (eller har det i obetydlig grad) kan ju inte bli väsentligt förbättrad på just den punkten. FG har inte tagit hänsyn till detta när de använder resultaten i den s k B-skalan, utan där finns en barlast i statistiken av fall som inte *kan* förbättras. Detta påverkar givetvis de statistiska beräkningarna, så att värdet av amalgamsaneringen blir systematiskt underskattat.

I tabell 2 anges (symtom för symtom) hur många procent av patienterna som förbättrats minst två skalsteg i B-skalan under den tid som uppföljningen omfattar. I beräkningsunderlaget ingår då patienter som inte alls hade symtomet före behandling (skalsteg 1), och även patienter som endast hade kryssat för skalsteg 2. För dem finns således ingen möjlighet att förbättras två skalsteg. Det naturliga borde ha varit att lämna dem utanför i statistiken. Ser man på enskilda symtom är det i storleksordningen 10-25% av patienterna som markerar skalsteg 1, och något färre som markerar 2. Detta varierar en hel del, så att för vissa symtom (4, 11, 14, 20, 26) har minst 45% markerat 1 eller 2. Självklart blir då andelen förbättrade i tabell 2 särskilt låg för dessa symtom. Längre fram skall vi se att FG på mycket diskutabla grunder bedömde att just resultaten med B-skalan var de mest rättvisande.

Ett starkt förenklat exempel kan belysa problemet. Säg att en tredjedel av patienterna i en grupp från början hade kronisk trötthet, en tredjedel mag-tarmbesvär och en tredjedel muskelvärk, men att ingen hade mer än ett av dessa symtom. Antag vidare att alla som hade dessa symtom fick dem klart förbättrade efter sanering. Då blir utfallet med FG:s sätt att räkna att endast en tredjedel är förbättrade i var och en av de tre symtomkategorierna. Intrycket av mycket måttlig behandlingsframgång är då givetvis helt vilseledande.

Man kan naturligtvis eliminera just det här systematiska felet, men det löser inte de andra problem som beror på att FG:s uppläggning är så ensidigt inriktad på symtom. Det är nödvändigt att helhetsbedöma individer, inte symtom, om man vill veta hur många som uppnått verkligt väsentliga hälsoförbättringar.

Patienterna har kommit till Amalgamenheten efter ett i regel mångårigt vårdsökande på grund av kroniska besvär som ingen annan lyckats hjälpa dem med. Den bakgrunden får inte förloras ur sikte när man gör en uppföljning. Självklart kan inte alla i en sådan grupp bli bättre, och säkert har vissa blivit sämre oavsett vad Amalgamenheten gjort. Så är det ju alltid när man försöker hjälpa patienter med dålig prognos. Vad man behöver ta reda på är hur många som blivit varaktigt bättre efter amalgamsanering, och givetvis måste man också vara uppmärksam på om saneringen kan ha skadat patienter, vilket är fullt möjligt om den utförs av tandläkare som är okunniga på området. Behandlingar för helt andra sjukdomstillstånd bedöms ju självklart på liknande sätt.

Ett enkelt exempel: Om en cancerbehandling inte uppenbart skadar patienterna och det visar sig att 50% av de behandlade lever utan symtom efter 5 år måste slutsatsen bli att detta är en fullt användbar behandling som kan rekommenderas till dess något ännu bättre dyker upp. Det skulle säkert inte falla någon in att räkna ut ett statistiskt medelutfall och sedan påstå att behandlingen är verkningslös eftersom genomsnittspatienten varken är frisk eller avliden. På motsvarande sätt är det något bakvänt med att låta försämrade patienters symtompoäng direkt påverka bedömningen av amalgamsaneringens värde, såsom FG gjort i tabell 1.

Det är tämligen meningslöst att försöka förstå hur enskilda patienter har det genom att läsa tabeller över 30 olika symtom och hur vanligt det är att de förbättras efter amalgamsanering. För det första vet vi ju att inte alla patienter haft alla symtom. För det andra har varje individ sin unika kombination av symtom, vilket betyder att det är väldigt olika vilka symtom som är avgörande för att en viss person inte kan leva ett normalt liv. FG diskuterar inte alls detta, utan tycks förutsätta att det inte finns något bättre sätt att bedöma värdet av amalgamsanering än att analysera ett symtom i taget. Jag kan uppriktigt sagt inte alls begripa hur man tänkt sig att det skall fungera ens på det teoretiska planet. Det är ändå alltid individer som är sjuka eller friska, och när symtomen är så många och så varierande som vid "amalgamsjuka" är det vetenskapligt orimligt att lämna individperspektivet utanför.

FG har betänkligheter därför att skalorna ger något olika resultat:

"Resultatet på C-skalan ligger genomgående något bättre än övriga skalor. B-skalan och MU1 är emellertid relativt konkordanta, både i nivån på symptomförbättringar och i konkordans av symptomförekomst. En systematisk överskattning i C-skalan är rimlig med tanke på att patientgruppen i mycket hög grad är självselekterad och således kan tänkas markera en stor tillfredsställelse med vården. Det faktum att de fått sitt tentativa problem åtgärdat gör att de markerar för en starkare förbättring i C-skalan än vad som verkligen motsvaras av den somatiska symptomförbättringen, mätt i B-skalan. Vi bedömer mot denna bakgrund att B-skalan och MU1 sannolikt är de mest valida." (sid 5)

Man ser i citatet ovan att FG utan vidare tillåter sig en spekulativ tolkning som skyller diskrepanserna på patienterna och deras förväntningar. FG:s föga evidensbaserade slutsats blir att C-skalan kan läggas åt sidan, och därmed de klart bättre resultat som den skalan uppvisat. Skalorna är emellertid väsentligt olika konstruerade, först och främst eftersom C-skalan låter patienten själv direkt skatta ett siffervärde på *förändring* av symtomet. Den s k MU1 innehåller enkla ja/nej-frågor om 15 symtom som bara beskrivs med enstaka ord och ofta inte överensstämmer helt med någon kategori i de andra skalorna. Både C- och B-skalan innehåller betydligt fylligare definitioner av symtomen. MU1 fick patienterna fylla i vid två tillfällen, de båda andra endast vid uppföljningen. MU1 är klart den tekniskt svagaste skalan, och det enda redovisade skälet för FG:s positiva bedömning är att den råkade visa hygglig överensstämmelse med B-skalan.

Den som är intresserad av vidare tekniska enskildheter får jag hänvisa till rapporten. Klart är emellertid att de tre skalorna är så olika inbördes, att det inte behövs några särskilt märkliga förklaringar för att acceptera att resultaten i viss mån skiljer sig åt. När FG insinuant tillskriver patienterna denna brist på överensstämmelse glömmer de antagligen att skalorna inte är utprovade mätinstrument, och att FG:s egen hantering av svaren också kan ha skapat skevheter. Som redan påpekats har resultaten systematiskt påverkats av att FG delvis byggt beräkningarna i B-skalan på patienter som i utgångsläget inte hade det symtom vars förbättring skulle studeras. Den förklaringen torde i själva verket vara helt tillräcklig för att rehabilitera C-skalan, som FG inte trodde gav rättvisande resultat.

Av alla de data från uppföljningen som FG tagit upp i rapporten framstår livskvalitetsskattningarna som de mest upplysande om man är intresserad av den vardagliga och nödvändiga frågan om hur många som blev bättre av amalgamsanering. Dessa skattningar har helt klart svagheter, men de saknar åtminstone de systematiska fel som uppkommit genom att FG behandlat varje symtom för sig på det sätt jag diskuterat ovan. FG lämnar till synes motvilligt ifrån sig uppgiften att 75% av de sanerade hade blivit bättre -- så här går det till: "även i gruppen med slutförd sanering finns en grupp på 25% som inte uppvisar någon förbättring eller t.o.m. livskvalitetförsämring." (sid 5)

Svagheterna i FG:s analys av uppföljningsmaterialet är stora och uppenbara. Den som litar på rapportens slutsatser får en föga rättvisande bild av amalgamsaneringens hälsoeffekter. Vad man säkert kan säga utan att göra om hela databearbetningen är att FG grovt underskattar den positiva effekt som saneringen haft på en stor grupp svårt sjuka patienter som i åratal vandrat genom den svenska sjukvårdsapparaten utan att bli hjälpta.

Jag får senare återkomma till FG:s hantering av placebofrågan. FG har uppenbarligen använt en artikel av Klock och medarbetare (referens nr 1 i första delrapporten) som förebild för den delen av sitt analysarbete, och det finns åtskilligt att kommentera i det sammanhanget.

Per Dalén

Fakultetsgruppens andra delrapport PDF

   Tabeller PDF
   Bilaga 1 Fakultetsgruppens första delrapport PDF
   Bilaga 2 Vetenskap som täckmantel
             En historia om hur man med vetenskapen som täckmantel kan
knäcka en verksamhet och slå undan benen på en patientgrupp.
   Bilaga 3 PDF
   Bilaga 4 PDF

Ett brev till Lars Holmberg och fakultetsgruppen.
Ang: Fakultetsgruppens andra delrapport

brev: Amalgam jämfört med tobak

Brev tre ang: Fakultetsgruppens andra delrapport
Om Fakultetsgruppens hantering av placebofrågan.

http://www.kvicksilver.org/amalgamenheten