Porovnanie spoľahlivosti AO a Evansovej klasifikácie trochanterických zlomenín
Comparison of Reliability of AO/ASIF and Evan’s Classifications
Purpose of the study:
There are many of classification systems for grading trochanteric fractures. Of these the AO/ASIF and Evan’s classification systems are widely used. To be a beneficial tool for indicating a method of treatment or permitting communication between surgeons, the classification system should be reliable and reproducible. The aim of this study was to compare the interobserver reliability and intraobserver reproducibility of the AO/ASIF and Evan’s classifications.
Material and Methods:
Plain preoperative and the first postoperative radiographs of 39 consecutive series of patients were classified using the AO/ASIF (with and without subgroups) and Evan’s classifications by five observers (2 ex-perienced surgeons, an experienced radiologist and 2 medical students). The same radiographs were classified by the same observers three months later. Observers agreement was assessed with the weighed coefficient kappa (κ).
Results:
The mean kappa (κ) value for interobserver reliability was 0.43 with the AO/ASIF subgroups (31 A1.1-A3.3), 0.51 with the AO/ASIF main groups (31A1-A3), and 0.37 with Evan’s classification. The mean κ value for intraobserver reproducibility was 0.50, 0.53 and 0.42 respectively. Perfect agreement of all observations in the first session was obtained 18 times (46%) with the AO/ASIF main groups, twice with the AO/ASIF subgroups (5%), and 5 times (13%) with Evan’s classification and 18 (46%), 2 (5%) and 4 times (10%) in the second session respectively.
Discussion and Conclusions:
Our data confirm outcomes of other authors that both the AO/ASIF and Evan’s classifications have moderate to fair inter- and intraobserver reliability with the best mean kappa values for the classification in the AO/ASIF three main groups. Using of early postoperative radiographs for classification did not increase the accuracy of classifying trochanteric fractures in comparison with other authors’ outcomes.
Key words:
kappa statistics, interobserver reliability, intraobserver reproducibility, trochanteric fractures.
Autoři:
Radoslav Morochovič 1; Dana Potočeková 2; Henrieta Blašková 3; Ivan Bugáň 1
Působiště autorů:
Department of Trauma Surgery, School of Medicine, University of P. J. Šafárik and FNLP, Košice
1; Klinika úrazovej chirurgie LF UPJŠ a FNLP, Košice
1; Institute of Medical Informatics, School of Medicine, University of P. J. Šafárik, Košice
2; Ústav lekárskej informatiky LF UPJŠ, Košice
2; Department of Radiodiagnostics and Nuclear Medicine, FNLP, Košice
3; Klinika rádiodiagnostiky a nukleárnej medicíny FNLP, Košice
3
Vyšlo v časopise:
Úraz chir. 16., 2008, č.1
Souhrn
Účel práce:
Pre oblasť trochanterickej oblasti proximálneho femuru existuje viacero klasifikácií. Medzi inými AO/ASIF a Evansova klasifikácia. Aby klasifikácia bola vhodná na určenie spôsobu liečby a bola presným nástrojom komunikácie medzi chirurgami musí byť spoľahlivou a reprodukovateľnou. Preto cieľom práce je porovnanie interobserver spoľahlivosti a intraobserver reprodukovateľnosti AO/ASIF a Evansovej klasifikácie.
Materiál a metódy:
Vstupné predoperačné a prvé pooperačné rtg snímky 39 po sebe nasledujúcich pacientov s trochantericou zlomeninou boli hodnotené podľa AO/ASIF (s/ bez delenia do podskupín) a Evansovej klasifikácie piatimi hodnotiacimi (2x skúsenými úrazovými chirurgami, 1x röntgenológom a 2 x študentami medicíny). Tá istá séria rtg snímok bola hodnotená tými istými hodnotiacimi o 3 mesiace. Výsledná zhoda bola zhodnotená váženým koeficientom kappa (κ).
Výsledky:
Priemerná hodnota kappa pre interobserver spoľahlivosť bola 0,43 pri delení do podskupín podľa AO/ASIF (31 A1.1-A3.3), 0,51 pri hodnotení do AO/ASIF základných skupín a 0,37 pri Evansovej klasifikácii. Priemerná hodnota kappa pre intraobserver reprodukovateľnosť bola 0,50, 0,53 a 0,42. Úplná zhoda všetkých hodnotiacich bola dosiahnutá 18x (46 %) pri AO /ASIF klasifikácii do hlavných skupín v oboch sede-niach, 2x (5 %) pri klasifikácii do podskupín podľa AO/ASIF v oboch sedeniach a 5x (13 %) pri prvom a 4x (10 %) pri druhom sedení pri Evansovej klasifikácii.
Diskusia a záver:
Naše výsledky potvrdzujú závery iných autorov, že obe klasifikácie majú miernu až slabú inter - a intraobserver spoľahlivosť s najvyšším priemerom koeficientu kappa pre klasifikáciu AO/ASIF s rozdelením do hlavných skupín. Použitie prvých pooperačných snímok nezvýšilo priemernú hodnotu kappa v sledovanom súbore v porovnaní s inými autormi.
Kľúčové slová:
kappa štatistika, interobserver spoľahlivosť, intraobserver reprodukovateľnosť, trochanterické zlomeniny.
ÚVOD
Pre mnohé anatomické lokality existuje viacero klasifikácií zlomenín. Pri ich vytváraní sa autori opierali o rôzne kritériá: mechanizmus vzniku zlomeniny, priebeh lomnej línie, početnosť a mieru dislokácie úlomkov a pod. V trochanterickej oblasti femuru sa pre klasifikáciu zlomenín často používajú AO a Evansova klasifikácia [1, 5]. Kompletná AO klasifikácia rozdeľuje pertrochanterické zlomeniny na tri základné skupiny a deväť jednotlivých podtypov podľa priebehu lomnej línie a počtu úlomkov (tab. 1). Evansova klasifikácia rozdeľuje pertrochanterické zlomeniny na dva základné typy podľa priebehu lomnej línie. Prvý typ sa ďalej delí na štyri podtypy na základe rozsahu mediálnej (calcar femoris) a laterálnej (veľký trochanter) kominúcie úlomkov (tab. 2).
Správne zaklasifikovanie typu zlomeniny spĺňa v klinickej praxi viacero úloh. Slúži na výber adekvátneho spôsobu liečby, na jej základe sa dá predpovedať dĺžka hojenia, pravdepodobná prognóza liečby a v neposlednom rade je nevyhnutnou podmienkou pri porovnaní výsledkov rôznych spôsobov liečby pri tom type zlomeniny [4, 11]. Aby klasifikácia spĺňala tieto požiadavky musí byť spoľahlivá a reprodukovateľná. Spoľahlivosť klasifikácie odzrkadľuje mieru rovnakého určenia typu zlomeniny pri jej hodnotení viacerými hodnotiacimi (angl. interobserver reliability) a reprodukovateľnosť pri opakovanom posúdení tým istým hodnotiacim (angl. intraobserver reproducibility) [4].
Cieľom predkladanej práce je porovnanie spoľahlivosti a reprodukovateľnosti AO/ASIF a Evansovej klasifikácie skupinou piatich hodnotiacich.
Materiál a metóda
Na hodnotenie boli vybrané röntgenové (rtg) snímky 39 po sebe nasledujúcich pacientov hospitalizovaných v roku 2004 na Klinike úrazovej chirurgie v Košiciach s diagnózou trochanterickej zlomeniny.
Každá rtg snímka bola hodnotená piatimi hodnotiacimi, z ktorých ani jeden pri hodnotení trochanterických zlomenín predtým nepoužíval AO/ASIF alebo Evansovu klasifikáciu. Skupina hodnotiacich bola zložená z jedného skúseného röntgenológa (R), z dvoch skúsených úrazových chirurgov (T1, T2) a z dvoch študentov medicíny (M1, M2).
Na hodnotenie typu zlomeniny boli použité AO/ASIF a Evansova klasifikácia (tab. 1, 2) [1, 5]. Hodnotenie typu zlomeniny bolo vykonané dvakrát. Prvýkrát bola klasifikovaná zlomenina podľa AO/ASIF (9 podskupín 31 A1.1 – A3.3) a druhýkrát podľa Evansa (5 typov). Všetky hodnotenia boli vykonané na základe vstupných predoperačných (35 x iba anteroposteriórna (AP) projekcia, 4x AP aj axiálna projekcia) a prvých pooperačných rtg snímok v oboch projekciách.
Pred prvým hodnotením boli na rtg snímkach (nepoužitých pre ďalšie hodnotenie) a na trojrozmernom modeli femuru (Pravý femur 2230, Synbone AG, Švajčiarsko) demonštrované jednotlivé typy trochanterických zlomenín. Navyše každý hodnotiaci mal počas celého hodnotenia k dispozícii grafické vyobrazenie a slovný popis oboch klasifikácií.
Po troch mesiacoch boli použité tie isté rtg snímky pri rovnakom procese hodnotenia zlomenín tými istými hodnotiacimi.
Hodnotiaci neboli oboznámení s výsledkom klasifikácie po prvom sedení a rtg snímky nemali k dispozícii v čase medzi oboma hodnoteniami.
Miera spoľahlivosti v klasifikovaní medzi jednotlivými hodnotiacimi (interobserver) a miera reprodukovateľnosti v klasifikovaní medzi samotnými hodnotiacimi s odstupom troch mesiacov (intraobserver) bola vypočítaná uvedená hodnotou kappa (κ) [2, 12]. Za vynikajúcu zhodu medzi hodnotiacimi sa považoval výsledok koeficientu κ > 0,80, za výraznú zhodu ak κ bola v rozmedzí (0,80–0,61), za miernu zhodu κ (0,60 – 0,41), slabú zhodu κ (0,40 – 0,21) a takmer žiadnu zhodu ak κ (0,2 – 0,0) [2].
Definitívne zatriedenie posudzovaných rtg snímok do jednotlivých typov zlomenín v hodnotenom súbore bolo určené na základe prevažujúcich súhlasných odpovedí hodnotiacich. Ak bol počet súhlasných odpovedí rovnaký, typ zlomeniny bol určený dohodou medzi autormi.
Výpočty hodnôt váženého κ boli vykonané počítačovými programami Statistica Cz 6.1 (Statsoft Inc., USA) a Arcus QuickStat Biomedical 1.1 (StatsDirect Ltd., UK).
VÝSLEDKY
Zastúpenie jednotlivých typov zlomenín podľa klasifikácií AO/ASIF a Evans je uvedené v tab. 3 a 4. V skupine prevládali zlomeniny klasifikované podľa AO/ASIF ako 31 A2 a podskupiny 2 a 3 podľa Evansovej klasifikácie.
Výsledky spoľahlivosti a reprodukovateľnosti sú zhrnuté v tab. 1 až 3. Priemerná hodnota κ pre interobserver spoľahlivosť pri klasifikácii zlomenín podľa AO/ASIF do troch základných skupín (31 A1-A3) bola 0,51 (mierna zhoda) a intraobserver 0,53 (mierna zhoda).
Priemerné κ pre interobserver spoľahlivosť pri klasifikácii zlomenín podľa AO/ASIF do deviatich podskupín (31 A1.1-A3.3) bolo 0,43 (mierna zhoda) a pre intraobserver 0,50 (mierna zhoda). Pri klasifikácii podľa Evansa boli dosiahnuté priemerné hodnoty interobserver 0,37 (slabá zhoda) s intraobserver reprodukovateľnosťou 0,42 (mierna zhoda).
Úplná zhoda medzi všetkými hodnotiacimi sa pri klasifikácii do skupín (31 A1-A3) podľa AO/ASIF vyskytla 18 krát pri prvom i pri druhom hodnotení. Pri hodnotení do podskupín (31 A1.1-A3.3) v rámci klasifikácie AO/ASIF sa úplná zhoda dosiahla dvakrát v každom zo sedení a pri klasifikácii podľa Evansa pri prvom hodnotení päťkrát a pri druhom štyrikrát.
DISKUSIA
Kappa štatistika počíta mieru zhody vo výpovediach hodnotiacich, pričom výsledný koeficient kappa (κ) zohľadňuje aj náhodne dosiahnuté zhodné hodnotenia. Teoreticky hodnota κ môže byť v rozmedzí od –1 až po 1, kde –1 vyjadruje absolútny nesúhlas v hodnoteniach (žiadna výpoveď hodnotiaceho A nebola zhodná s výpoveďou hodnotiaceho B) a hodnota 1 úplný súhlas v každej z výpovedí.
Porovnanie spoľahlivosti klasifikácii trochanterických zlomenín bolo predmetom viacerých prác [6, 8, 10, 11]. Výber hodnotiacich v publikovaných prácach bol rôzny. Kým Gehrchen a kol. [6] a Pervez a kol. [10] vybrali do hodnotiacej skupiny chirurgov s rôznou dĺžkou praxe Jin a kol. [8] vybral iba chirurgov s dostatočne dlhou praxou. Keďže akákoľvek klasifikácia by mala byť jednoznačná a jej použitie by malo byť po ozrejmení jej princípov pre kohokoľvek jednoduché, do skupiny nami vybraných piatich hodnotiacich boli zaradení zástupcovia troch rôznych skupín. Skupiny úrazových chirurgov, ktorá hodnotí ako rtg snímky tak i zlomeninu samotnú pri jej osteosyntéze, skupiny röntgenológov, ktorá hodnotí iba rtg snímky a skupiny študentov medicíny, ktorá sa ešte s hodnotením zlomenín nestretla.
V našej práci sme nehodnotili rozdiely medzi podskupinami hodnotiacich pre ich nízky počet v každej z nich. Rozdiel medzi podskupinami hodnotiacich zhodnotil vo svojej práci Schipper a kol. [11]. Pri porovnaní skupiny skúsených chirurgov, začínajúcich chirurgov a röntgenológov a ich dosiahnutých priemerných hodnôt kappa (inter- aj intraobserver) nezistil medzi týmito skupinami významný rozdiel.
Pre správne zhodnotenie zlomeniny je nevyhnutná štandardná rtg snímka postihnutého proximálneho femuru [3, 9]. Viacerí autori používali pri hodnotení zlomenín iba predoperačné snímky proximálneho femuru v dvoch projekciách [6, 10, 11]. Nami hodnotené predoperačné rtg snímky neboli vždy v požadovaných dvoch projekciách a pri výraznej deformite končatiny dochádzalo ku skresleniu zobrazovaného priebehu a rozsahu zlomeniny. Z tohoto dôvodu sme pri hodnotení použili aj prvé pooperačné snímky v oboch projekciách.
Vypočítané priemerné hodnoty κ pre interobserver spoľahlivosť a intraobserver reprodukovateľnosť AO/ASIF klasifikácie do troch skupín (31 A1-A3) dosiahli nižšie hodnoty ako vypočítané hodnoty iných autorov (tab. 8). Hodnoty κ s rozdelením do 9 podskupín podľa AO/ASIF a podľa Evansovej klasifikácie boli podobné.
Prezentované výsledky potvrdzujú závery ďalších autorov o miernej až slabej spoľahlivosti testovaných klasifikácií trochanterických zlomenín s najvyššou mierou spoľahlivosti a reprodukovateľnosti pri klasifikovaní zlomenín iba do troch skupín podľa AO/ASIF (31 A1-A3) [6, 8, 10, 11]. Pri tomto zaklasifikovaní zlomenín bola v našom hodnotení dosiahnutá v 18 prípadoch (46 %) úplná zhoda výpovedí hodnotiacich.
ZÁVER
Spoľahlivosť AO/ASIF a Evansovej klasifikácie trochanterických zlomenín hodnotená na základe predoperačných ako aj štandardných pooperačných rtg snímok dosahovala iba miernu až slabú mieru spoľahlivosti. Z tohoto dôvodu definitívne posúdenie typu zlomeniny zostáva na operatérovi a jeho schopnosti predoperačne alebo peroperačne určiť jej rozsah a kominúciu.
MUDr. Radoslav Morochovič, Ph.D.
Klinika úrazové chirurgie FN Košice
Rastislavova 43
040 01 Košice, SR
rado17@post.sk
Zdroje
1. Fracture and dislocation compendium. Orthopaedic Trauma Association Committee for Coding and Classification. J Orthop Trauma. 10 Suppl 1, 1996, č. s. v-ix, 32–35.
2. AUDIGE, L., BHANDARI, M., KELLAM, J. How reliable are reliability studies of fracture classifications? A systematic review of their methodologies. Acta Orthop Scand. 2004, 75, 184–194.
3. BARTONÍČEK, J., DOUŠA, P., SKÁLA-ROSEN-BAUM, J., KOŠŤÁL, R. Trochanterické zlomeniny. Souborný referát. Úraz chir. 2002, 10, 13–24.
4. BURSTEIN, A. H. Fracture classification systems: do they work and are they useful? J Bone Joint Surg. 1993,75-A, 12, 1743–1744.
5. EVANS, E. M. The treatment of trochanteric fractures of the femur. J Bone Joint Surg. 1949, 31-B, 190–203.
6. GEHRCHEN, P. M., NIELSEN, J. O., OLESEN, B. Poor reproducibility of Evans' classification of the trochanteric fracture. Assessment of 4 observers in 52 cases. Acta Orthop Scand. 1993, 64, 71–72.
7. JENSEN, J. S., MICHAELSEN, M. Trochanteric femoral fractures treated with McLaughlin osteosynthesis. Acta Orthop Scand. 1975, 46, 795–803.
8. JIN, W. J., DAI, L. Y., CUI, Y. M. et al. Reliability of classification systems for intertrochanteric fractures of the proximal femur in experienced orthopaedic surgeons. Injury. 2005, 36, 858–861.
9. KITKA, M., CIBUR, P., MOLČÁNYI, T., NOVOT-NÝ, Š., ROŠÁK, M. Výsledky a komplikácie po osteosyntézach proximálneho konca femuru dynamic-kou skĺznou skrutkou. Úraz chir. 1999, 7, 9–12.
10. PERVEZ, H., PARKER, M. J., PRYOR, G. A., LUTCHMAN, L., CHIRODIAN, N. Classification of trochanteric fracture of the proximal femur: a study of the reliability of current systems. Injury. 2002, 33. 713–715.
11. SCHIPPER, I. B., STEYERBERG, E. W., CASTE-LEIN, R. M., VAN VUGT, A. B. Reliability of the AO/ASIF classification for pertrochanteric femoral fractures. Acta Orthop Scand. 2001, 72, 36–41.
12. SIM, J., WRIGHT, C. C. The kappa statistic in reliability studies: use, interpretation, and sample size requirements. Phys Ther. 2005, 85, 257–268.
Štítky
Surgery Traumatology Trauma surgeryČlánok vyšiel v časopise
Trauma Surgery
2008 Číslo 1
- Metamizole at a Glance and in Practice – Effective Non-Opioid Analgesic for All Ages
- Obstacle Called Vasospasm: Which Solution Is Most Effective in Microsurgery and How to Pharmacologically Assist It?
- Current Insights into the Antispasmodic and Analgesic Effects of Metamizole on the Gastrointestinal Tract
- Spasmolytic Effect of Metamizole
- Metamizole in perioperative treatment in children under 14 years – results of a questionnaire survey from practice
Najčítanejšie v tomto čísle
- Functional results after treatment of radial head fractures
- FRACTURES OF PROXIMAL FEMUR, COMPLICATIONS OF TREATMENT WITH SHORT PROXIMAL NAIL SYNTHES
- A Prospective Comparison of clinical examination RTG, US and CT artrography and Arthroscopy to Detect Rotator Cuff Tears
- Comparison of Reliability of AO/ASIF and Evan’s Classifications