Biostat szótár





Untitled Document




Betűjegyzék

A Á B C Cs D E É F G Gy H I J K L M N O Ö P R S Sz T U V W Y


Adattranszformációk

Transzformációnak a számadatok olyan átalakítását nevezik, amelyik egyértelmű és visszafordítható: különböző adatokat egymástól különbözőkbe visz át, és minden transzformált adatról pontosan meg lehet mondani, hogy mi volt az „eredeti”.
Az adatok transzformációi mind a transzformáció célját, mind pedig annak hatását illetően két, egymástól jól elkülöníthető csoportba oszthatók. A lineáris transzformáció, amelyet lényegében kényelmi okokból vezetünk be, nem módosítja az eloszlás típusát, de könnyebben kezelhetővé teszi az adatokat (és az eloszlást). Általános alakja a következő: y = a + bx ahol x az „eredeti”, y a transzformált adatokat jelenti. Ez a formula mindig egy egyenes egyenletének felel meg; innen a transzformáció elnevezése.
Az A másik típusát az előzővel szembeállítva – jobb híján – görbevonalú transzformációknak nevezhetjük, mivel „képlete” mindig valamilyen görbe vonal egyenlete. A leggyakoribb görbevonalú transzformációk a logaritmus (y = log x) a reciprok (y = 1/x), a négyzet (y = x2) és a négyzetgyök (y = √x) Valamennyi csak pozitív adatok esetén alkalmazható.

Akkurátusság, megbízhatóság (accuracy)

A becslések “hűségé”-nek jellemzője abban az értelemben, hogy a becslés és az elméleti (valódi) érték közti távolságtól függ. Minél közelebb áll a becslés a “valóság”-hoz, minél kevésbé torzít, annál nagyobb a megbízhatósága. Nem azonos azzal a fogalommal, mely a mérések ismételhetőségére vonatkozik (reliability), és melynek magyar neve szintén megbízhatóság.


Általános lineáris modell (general linear model)

Az Á vagy lineáris modell közös megnevezése azoknak a módszereknek, amelyek egy folytonos függő változót vizsgálnak több független változó ( magyarázó változó) lineáris függvényében. Az Á speciális esetei a varianciaanalízis (ANOVA) modellek (melyekben egy folytonos függő változónak egy vagy több kategóriás változótól – faktor vagy szempont – való függését vizsgáljuk), a kovariancia analízis (ANCOVA) modellek (melyekben a magyarázó változók között kategóriás és folytonos változó is van) és a többszörös lineáris regresszió.
A lineáris modell általánosítása az általánosított lineáris modell (generalized linear model), amelyben nem magát a függő változót, hanem annak egy transzformált értékét (pl. logisztikus regresszió esetén logit p-t) becsüljük a magyarázó változók lineáris függvényével.

Álnegativitási arány (false negativee rate) diagnosztikus vizsgálatok

Álpozitivitási arány (false positive rate) diagnosztikus vizsgálatok

Általánosított lineáris modell (generalized linear model) általános lineáris modell

Áthúzódó hatás (carry over effect) kísérleti elrendezés

Átlag (mean) folytonos változókra vonatkozó jellemzők

Átlag szórása (standard error of the mean, SEM) minta

Bayes-módszer

A „klasszikus” statisztika az adatokból számolt gyakoriságokra, a gyakoriságokból becsült valószínűségekre építi azokat a modelleket, amelyekből következtetéseit (statistical inference, hipotézisvizsgálat) levonja. Ezeket a statisztikai módszereket a külföldi szakirodalom éppen ezért frekventista eljárásoknak nevezi (gyakoriság = frequency). A hazai szakirodalom csak elvétve él ezzel a megkülönböztetéssel.
A statisztikának egy ettől gyökeresen eltérő, újabban egyre inkább előtérbe kerülő felépítése a valószínűségszámítás egy régóta ismert tételére, a Bayes-tételre alapozza a következtetéseket. Ennek lényege, hogy valamilyen megfontolások alapján előzetes (a priori) valószínűségeket állapít meg, majd a minta – és Bayes tétele – segítségével jut újabb (a posteriori) valószínűségekhez, amelyek hozzásegítik a statisztikai következtetéshez. A módszernek számos előnye van, de a gyakorlatban ritkán fordul elő, hogy az a priori valószínűségeket egyértelmű, mások számára is elfogadható módon lehet meghatározni.

Becslés (estimate, point estimate) minta


Becslés pontossága minta

Beválasztás szerinti populáció (intention to treat population) vizsgálatba bevont populációk

Bináris adat (binary data) változó

Bináris változó változó

Binomiális eloszlás (binomial distribution) eloszlás

Bioekvivalencia-vizsgálat biológiai egyenértékűség

Biológiai egyenértékűség (bioequivalence)

Két gyógyszer közt akkor áll fenn B, ha biológiai hasznosíthatóságuk (a szervezetben való felszívódásuk) egyforma. A B bizonyítására rendszerint speciális, ún. bioekvivalencia-vizsgálatot végeznek (mely az ekvivalenciavizsgálatnak egy altípusa és általában keresztezett elrendezésű).

Bonferroni-módszer

Voltaképpen egy elv, amelynek célja, hogy a sorozatban vagy csoportosan végzett statisztikai próbák (hipotézisvizsgálat) esetén fölhalmozódó hiba-kockázatot leszorítsa. A módszer lényege, hogy az első fajta hibát (általában a szokásos 5%-ot) földarabolják, és próbánként csak annak töredékét használják a szignifikancia eldöntésére. Legfőbb alkalmazási területe a többszörös összehasonlítás.

Bootstrap mintából való mintavételen alapuló eljárások


Cenzorált adatok túlélési vizsgálat

Célváltozó (primary variable) fő hatásmutató

Cox-féle arányos hazárd modell (Cox’s proportional hazard model) túlélési vizsgálat

Cox-féle regressziószámítás (Cox regression) túlélési vizsgálat

Cramér-féle V kontingenciatáblázat


Csúcsosság (kurtosis) eloszlás


Dendrogram fürtelemzés

Determinációs együttható regressziószámítás, korrelációs együttható

Diagnosztikai vizsgálatok (diagnostic tests)

A diagnosztikai, osztályozási eljárások közös jellemzője, hogy valamely vizsgáló módszer, mérés (próba) alapján következtetnek egy betegség fennállására, adott osztályba tartozásra. Ha a diagnózist igen-nem eredményt adó próba alapján állapítják meg, az eredmény általában táblázatos formában foglalható össze, amelyből több mérőszám számítható a diagnosztikus próba hatékonyságára.
A próba érzékenysége vagy felismerési aránya egy adott kategóriába tartozókon belül a próba alapján is ebbe a kategóriába soroltaknak az aránya (általában százalékban kifejezve). A beteg-nem beteg osztályozás esetén a próba szenzitivitása (érzékenysége) az általa betegnek minősítetteknek a teljes betegszámhoz viszonyított aránya.. A próba specifikussága valamely kategóriába valóban nem tartozók között a próba alapján is az illető kategórián kívül soroltak aránya (általában százalékban kifejezve). A beteg-nem beteg osztályozás esetén a próba specifikussága az általa egészségesnek minősítetteknek a valóban egészségesekhez viszonyított aránya.
Az álpozitivitási arány a próba alapján valamely kategóriába tévesen soroltak és az illető kategóriába valójában nem tartozók aránya (általában százalékban kifejezve). A beteg-nem beteg kategorizálás esetén a próba álpozitivitási aránya az általa (tévesen) betegnek talált egészségesek részaránya a valóban egészségesek körében. Az álpozitivitási arány és a specifikusság összege mindig 1. Az álnegativitási arány a próba alapján tévesen valamely kategórián kívülre soroltak és a valójában azon a kategórián belül levők aránya (esetleg százalékos aránya). A beteg-nem beteg kategorizálás esetén a próba álnegativitási aránya a teszt által tévesen egészségeseknek minősítetteknek és a valóban beteg résztvevőknek az aránya. Az álnegativitási arány és a szenzitivitás összege mindig 1.
Azt is vizsgálhatjuk, hogy mi a valószínűsége annak, hogy a próba helyes diagnózist adott. A pozitív prediktív érték annak valószínűsége, hogy a próba helyesen ad pozitív diagnózist. A negatív prediktív érték annak valószínűsége, hogy a teszt helyesen ad negatív diagnózist. Ezt a két értéket a próba „jóságán” kívül a betegség prevalenciája is befolyásolja.
Ha a diagnosztikai próba kvantitatív eredményt szolgáltat, a diagnosztikai próba hatásosságát a hatásfokmérő karakterisztikával (ROC görbe) jellemezhetjük, amely a különböző álpozitivitási arányokhoz tartozó érzékenységeket ábrázolja. Mérési, diagnosztizálási vagy osztályozási módszerek teljesítményének összehasonlítására alkalmazható abban az esetben, ha a mérés (osztályozás, diagnózis) pontos eredménye vagy valamely elfogadott becslése ismert. Az (1–specifikusság, szenzitivitás) koordinátájú pontokat összekötve meghatározható a hatásfokmérő karakterisztika alatti területet. A görbe alatti terület maximális értéke 1; a nagyobb terület nagyobb prediktív erőt jelent különböző módszerek összehasonlítása esetén. A hatásfokmérő karakterisztika segíthet valamely diagnosztikai próba küszöbértékének kiválasztásában is.

Dichotóm változó változó

Diszkrét változó (discrete variable) változó

Diszkriminanciaanalízis

A D célja több folytonos változóval jellemzett, különböző csoportokba tartozó egyedek, objektumok szétválasztása (elkülönítése), valamint a csoportok szétválasztásában fontos szerepet játszó változók meghatározása. A D eredményeképpen besorolhatók azok az egyedek is, amelyeknek eredeti csoportját nem ismerjük. A D az orvosi diagnosztika egyik eszköze lehet: itt a feladat ismert betegségcsoportba tartozó személyek tünetei alapján a betegségek elkülönítése, illetve egy új beteg legvalószínűbb betegségének megállapítása.
Az elválasztáshoz a változók olyan, legtöbbször lineáris függvényét – diszkriminanciafüggvényt vagy kanonikus változót – keressük, mely a lehető legjobban szétválasztja a csoportokat (azaz, a függvény által új dimenzióba transzformált csoportok átfedése a lehető legkisebb). Kettőnél több csoport esetén ugyanazon változókból egy újabb diszkriminanciafüggvényt keresünk, amely tovább diszkriminál a csoportok között. A csoportok számánál 1-gyel kevesebb diszkriminanciafüggvény közül a szignifikánsakat, vagy az elsőket érdemes megtartani.
A szétválasztásban fontos szerepet játszó változók megtalálása történhet az együtthatók vizsgálatával (pl. a változó és a diszkriminanciafüggvény korrelációja alapján), de a többszörös regresszióhoz hasonlóan létezik a módszernek lépésenkénti változata is.

Dóziskereső vizsgálat (dose finding study) felfedező vizsgálat

Duncan-féle eljárás többszörös összehasonlítás

Dunnett-próba többszörös összehasonlítás


Egyetértés (agreement)

Ha két vagy több megfigyelő mond véleményt ugyanarról a dologról – például két orvos értelmezi ugyanazt a röntgenfelvételt, többen diagnosztizálják ugyanazt a beteget –, fontos, hogy E legyen köztük. Más, látszólag eltérő helyzetekben ugyanerről van szó. Ha például ugyanaz a vizsgáló többször mond véleményt ugyanarról a dologról (röntgenképről, betegről), akkor is fontos, hogy diagnózisai közt „E” legyen; ilyenkor azonban helyesebb a megegyezés szó használata. Lényegében ugyanezzel a problémával találkozunk akkor is, ha valamely vizsgálatot két (vagy több) különböző módszerrel végeznek el (pl. egy új eljárás bevezetésekor); E helyett ilyenkor is szívesebben használjuk a megegyezés szót.
A szituáció nagyon hasonlít a vizsgáló módszerek megbízhatóságának (reliabilitásának) vizsgálatához. Olyannyira, hogy sokan meg sem különböztetik a kettőt, és pl. a diagnoszták közti E-t a diagnózis reliabilitásának nevezik.
Az E (megegyezés) statisztikai módszerekkel mérhető. A sokféle mérőszám közül annak megfelelően szokás választani, hogy a megfigyelés (diagnózis) milyen típusú adatot eredményezett. Ha mindössze két érték lehetséges ( dichotóm változók) – bizonyos betegség megvan vagy nincs –, az úgynevezett kappa együttható (ϰ) a jó mérőszám. Ugyanennek különböző változatait használják olyankor is, ha kettőnél több kategória van (diagnózis megállapításakor általában ez a helyzet), sőt akkor is, ha ezeknek a kategóriáknak természetes sorrendjük van (például pontozzák a tünet súlyosságát valamilyen skálán). Ez utóbbi esetben gyakran alkalmazzák a folytonos változók (általában méréseredmények) esetére kidolgozott mérőszámot, az intraklassz korrelációs együtthatót. Egyik magyar elnevezése, az osztályon belüli korreláció, nem honosodott meg, másik elnevezése, az összetartozási együttható jobban tükrözi a fogalom jelentését.
Talán legegyszerűbb a helyzet olyankor, ha a diagnoszták feladata a betegek valamilyen szempont – például betegségük súlyossága – szerinti sorbaállítása. Ilyenkor a rangszámokból számolt közönséges korrelációs eljárások alkalmazhatók: két diagnoszta esetén a Spearman-féle rangkorrelációs együttható, több diagnoszta E-ének vizsgálatára a Kendall-féle egyetértési együttható.

Egyetértési együttható egyetértés

Egy- és többszempontos varianciaanalízis

Az egyszempontos varianciaanalízis (one-way ANOVA) több, általában párhuzamos elrendezésű csoport valamely folytonos, normális eloszlású jellemzőjének átlagát hasonlítja össze úgy, hogy a csoportok közt csak egyetlen szempont szerinti eltérést vesz figyelembe. Az összehasonlítás alapja az F-próba, mely az átlagok különbségeit jellemző „csoportok közötti” varianciát hasonlítja össze a véletlen ingadozást jellemző „csoportokon belüli” varianciával. Szignifikáns eredmény esetén annyit mondhatunk, hogy a populációk átlagai nem mind egyformák. A különbségek megtalálása további vizsgálattal, pl. többszörös összehasonlításokkal vagy kontrasztok vizsgálatával folytatható.
A kétszempontos varianciaanalízisben az összehasonlítandó csoportok két független szempontból is vizsgálhatók (pl. kezelés és nemek szerint). Ekkor a két szempont (pl. a kezelések közötti különbségek) hatásán kívül vizsgálható a kettő kölcsönhatása (interakció) is, vagyis az, hogy a két tényező együtt másképpen hat-e, mint külön-külön (pl. a kezelések közötti különbségek függnek-e a nemtől). A többszempontos V-ben többszörös kölcsönhatások is szerepelnek.

Egymintás t-próba t-próba

Egyoldalas próba hipotézisvizsgálat

Egyszerű vak vizsgálat (single blind study) kezelések titkosítása

Ekvivalencia-vizsgálat (equivalence trial) megerősítő jellegű vizsgálatok

Elfogadási tartomány (acceptance region) hipotézisvizsgálat

Ellenállóképes próba (robust test) hipotézisvizsgálat

Ellenhipotézis (alternatíva, alternative hypothesis, H1) hipotézisvizsgálat

Elméleti átlag (theoretical mean) folytonos változókra vonatkozó jellemzők

Eloszlás (distribution)

Valószínűségi változónak nevezünk egy olyan mérhető vagy megállapítható tulajdonságot, amelynek értékeihez valószínűségek kapcsolódnak. A változó eloszlásán általánosságban azt a szabályrendszert értjük, amely ezt a hozzárendelést meghatározza. Diszkrét változók esetén minden lehetséges értékhez konkrét valószínűség-érték tartozik. Folytonos változó eloszlásfüggvénye tetszőleges x0 érték esetén megadja, hogy mi annak a valószínűsége, hogy az x változó értéke kisebb x0-nál. A sűrűségfüggvény alatti terület értéke egy szakaszon egyenlő annak valószínűségével, hogy a valószínűségi változó értéke az adott szakaszra esik. Egy eloszlástípuson (-családon) belül az adott eloszlást jellemző (és általában meghatározó) konstansok (számok) a paraméterek.
A statisztikában központi szerepet játszik a normális eloszlás. Ennek fontosságát többek között az adja, hogy egyrészt a mérhető tulajdonságok eloszlása gyakran tekinthető normálisnak (vagy azzá transzformálható) másrészt a mintából számolt jellemzők eloszlása is gyakran közelíthető a normálissal. Egy adott normális eloszlás két paramétere, amely az eloszlást egyértelműen meghatározza, az elméleti átlag (várható érték) és az elméleti szórás. A standard normális eloszlás átlaga 0, szórása 1.
Az eloszlások jellemzői a ferdeség és a csúcsosság is. Szimmetrikus eloszlás ferdesége 0. Pozitív ferdeség jobbra elhúzódó eloszlást jelez. A csúcsosság értéke normális változó esetében 3, illetve módosított képlettel 0. Ezeknél nagyobb érték azt jelzi, hogy az azonos szórású, normális eloszlású változóhoz képest több érték tömörül a közép körül (és ennek megfelelően szélsőséges értékből is több van).
A leggyakoribb normálissá transzformálható eloszlás a lognormális, amelyből logaritmustranszformáció segítségével kapunk normális eloszlást. A t-, χ2-, illetve F-eloszlást elsősorban az azonos nevű statisztikai próbáknál alkalmazzák, illetve ez utóbbit ezen kívül a variancia-analízishez tartozó elfogadási tartományok meghatározására is használják.
A diszkrét eloszlások közül a gyakorlatban legtöbbször a binomiális és a Poisson-eloszlás fordul elő. Binomiális eloszlást kapunk, ha megszámoljuk, hogy n számú független kísérlet vagy megfigyelés során egy adott valószínűséggel bekövetkező esemény hányszor következik be. Poisson eloszlással általában jól közelíthető egy adott területen vagy időtartamban előforduló ritka események száma (például az egy naptári évben született hármas ikrek száma).

Eloszlásfüggetlen próba (distribution-free test)

Olyan statisztikai próba, ahol a nulleloszlás nem függ a minta eloszlásától ( rangsorolásos eljárások).

Eloszlásfüggvény (distribution function) eloszlás

Eloszlásmentes eljárások (distribution-free statistics) rangsorolásos eljárások

Előjelpróba (sign test)

Az egyik legegyszerűbb statisztikai próba. Két, páronként összetartozó elemekből ( illesztett párok, matched pairs) álló minta esetén alkalmazható. Ilyen mintát legtöbbször úgy kapunk, hogy ugyanazokon a személyeken végzünk két mérést: a beavatkozás (pl. a gyógyszer beadás