Mindmap-Galerie medizinische Statistiken
Dies ist eine Mindmap über medizinische Statistiken, einschließlich statistischer Beschreibungen quantitativer Daten, statistischer Beschreibungen qualitativer Daten usw.
Bearbeitet um 2023-11-20 10:40:27Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Projektmanagement ist der Prozess der Anwendung von Fachwissen, Fähigkeiten, Werkzeugen und Methoden auf die Projektaktivitäten, so dass das Projekt die festgelegten Anforderungen und Erwartungen im Rahmen der begrenzten Ressourcen erreichen oder übertreffen kann. Dieses Diagramm bietet einen umfassenden Überblick über die 8 Komponenten des Projektmanagementprozesses und kann als generische Vorlage verwendet werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Projektmanagement ist der Prozess der Anwendung von Fachwissen, Fähigkeiten, Werkzeugen und Methoden auf die Projektaktivitäten, so dass das Projekt die festgelegten Anforderungen und Erwartungen im Rahmen der begrenzten Ressourcen erreichen oder übertreffen kann. Dieses Diagramm bietet einen umfassenden Überblick über die 8 Komponenten des Projektmanagementprozesses und kann als generische Vorlage verwendet werden.
medizinische Statistiken
Einführung
1. Grundkonzepte:
Grundgesamtheit: Die Gesamtheit eines bestimmten variablen Werts von Forschungsobjekten mit gleichen oder ähnlichen Eigenschaften, die entsprechend dem Forschungszweck bestimmt werden.
Stichprobe: Eine Reihe variabler Werte einiger zufällig aus der Bevölkerung ausgewählter Personen.
Gesamtparameter: Indikatoren, die Gesamtmerkmale beschreiben, sogenannte Parameter. Es ist eine feste Konstante und im Allgemeinen unbekannt.
Statistik: Ein Indikator, der die Eigenschaften einer Stichprobe beschreibt. Er wird aus den Stichprobenbeobachtungswerten berechnet und enthält keine unbekannten Parameter.
Stichprobenfehler: Der Unterschied zwischen einer Stichprobenstatistik und dem entsprechenden Populationsparameter, der durch Zufallsstichproben verursacht wird.
Häufigkeit: Wenn Ereignis A in n unabhängigen wiederholten Versuchen m-mal auftritt, wird m als Häufigkeit bezeichnet. Nennen Sie m/n die Häufigkeit oder relative Häufigkeit von Ereignis A in n Versuchen.
Wahrscheinlichkeit: Die durch die Frequenz stabilisierte Konstante wird als Wahrscheinlichkeit bezeichnet.
Statistische Beschreibung: Verwenden Sie geeignete statistische Indikatoren (Stichprobenstatistiken), statistische Diagramme und statistische Tabellen, um die quantitativen Merkmale und Verteilungsmuster der Daten zu charakterisieren und zu beschreiben.
Statistische Inferenz: einschließlich Parameterschätzung und Hypothesentests. Die Verwendung statistischer Stichprobenindikatoren (Statistiken) zur Ableitung der entsprechenden Gesamtindikatoren (Parameter) wird als Parameterschätzung bezeichnet. Die Verwendung von Stichprobenunterschieden oder Unterschieden zwischen Stichproben und der Grundgesamtheit, um daraus abzuleiten, ob es möglicherweise Unterschiede zwischen Grundgesamtheiten gibt, wird als Hypothesentest bezeichnet.
2. Stichprobenmerkmale: ausreichender Stichprobeninhalt, Zuverlässigkeit und Repräsentativität.
3. Datentyp:
(1) Quantitative Daten: Messdaten
(2) Klassifizierungsinformationen:
① Zähldaten:
Zwei Klassifizierungen: Klassifizieren Sie Beobachtungsobjekte nach zwei gegensätzlichen Attributen. Die beiden Kategorien sind gegensätzlich und miteinander inkompatibel.
Mehrfachklassifizierung: Klassifizieren Sie Beobachtungsobjekte nach mehreren sich gegenseitig ausschließenden Attributen
②Noteninformationen:
Gruppendesign und Paardesign
Gepaartes Design
1. Zwei Probandenpaare erhielten zwei unterschiedliche Behandlungen.
2. Derselbe Proband erhält zwei unterschiedliche Behandlungen
3. Vergleichen Sie die Ergebnisse desselben Probanden vor und nach der Behandlung (d. h. Selbstpaarung).
4. Zwei Teile desselben Themas werden unterschiedlich behandelt
Gruppendesign
Die Probanden wurden zufällig in zwei Behandlungsgruppen eingeteilt, wobei jede Gruppe zufällig eine Behandlung erhielt.
Statistische Beschreibung quantitativer Daten
Die Rolle von Häufigkeitstabellen und Histogrammen: Sie werden zur Beobachtung der statistischen Beschreibung einer großen Anzahl von Daten verwendet und können eine intuitive Erinnerung an die Verteilungseigenschaften und den Verteilungstyp der Daten liefern.
Indikatoren und Anwendungsbereich der zentralen Tendenz und des diskreten Trends
zentrale Tendenz
zentrale Tendenz
Das arithmetische Mittel eignet sich für symmetrische Verteilungen – nicht geeignet für schiefe Verteilungen und Daten mit Extremwerten in den Daten.
Der geometrische Mittelwert G eignet sich für Daten mit einer Mehrfachbeziehung oder einer logarithmischen Normalverteilung, insbesondere für eine positiv schiefe Verteilung. Er eignet sich nicht für Daten mit 0 oder positiven und negativen Werten, die gleichzeitig im Beobachtungswert auftreten .
Median M eignet sich für eine verzerrte Verteilung großer Stichproben; Daten mit unsicheren Werten in den Daten
Perzentil Px Mehrere Perzentile werden in Kombination verwendet, um die Merkmale der Datenverteilung umfassend zu beschreiben – zur Bestimmung des Bereichs medizinischer Referenzwerte (verzerrte oder unbekannte Verteilungsdaten).
Modus M0 eignet sich für große Proben und ist rau
Ausbreitungstrend
Extrem schlechter R
Vorteile: Einfach, klar und leicht zu bedienen.
Mangel:
① Es spiegelt nur die Differenz zwischen dem Maximalwert und dem Minimalwert wider und kann nicht den Variationsgrad anderer beobachteter Werte widerspiegeln.
②Je größer die Stichprobengröße, desto größer kann der Bereich sein.
③ Der extrem schlechte Abtastfehler ist groß und instabil.
Der Interquartilabstand Q eignet sich zur Bestimmung der Bandbreite medizinischer Referenzwerte und beschreibt zusammen mit dem Median den Variationsgrad schiefer Verteilungsdaten.
Die Varianz und Standardabweichung S beschreiben zusammen mit dem Mittelwert die symmetrische Verteilung, insbesondere die Verteilungsmerkmale der Normalverteilung bzw
Variationskoeffizient CV ① Geeignet zum Vergleich der Variabilität verschiedener Daten in Maßeinheiten. ②Vergleichen Sie die Variabilität von Daten mit sehr unterschiedlichen Mitteln. ③ Häufig verwendete Indikatoren zur Messung der experimentellen Präzision und Stabilität.
Merkmale der Häufigkeitsverteilung
Der Peak liegt in der Mitte und links und rechts sind ungefähr symmetrisch, was als symmetrische Verteilung bezeichnet wird. Mittelwert = Median = Modus
Der Spitzenwert ist auf die Seite kleiner Werte verschoben (linke Seite), was als positiv schiefe Verteilung (auch als rechtsschiefe Verteilung bezeichnet) bezeichnet wird. Mittelwert > Median > Modus
Der Peak ist zur Seite großer Werte (linke Seite) verzerrt, was als negativ verzerrte Verteilung (auch linksverzerrt genannt) bezeichnet wird. Mittelwert<Median<Modus
Mittelwert und Standardabweichung ======== Normale oder annähernd normale Verteilung
Median- und Interquartilbereich === Schiefe Verteilung
Geometrisches Mittel und logarithmische Standardabweichung === Lognormalverteilung
Statistische Beschreibung qualitativer Daten
Häufig verwendete relative Zahlen
Rate: Beschreibt die Häufigkeit oder Intensität eines Phänomens. (Die Sterblichkeitsrate ist nicht gleich der Sterblichkeitsrate)
Komponentenverhältnis: beschreibt den Anteil oder die Verteilung der internen Komponenten eines Phänomens, oft ausgedrückt als Prozentsatz.
Relatives Verhältnis: Auch als Verhältnis bekannt. Es ist das Verhältnis zweier verwandter Indikatoren A und B und gibt an, wie oft oder in Prozent A zu B gehört. Zwei Indikatoren können gleicher oder unterschiedlicher Natur sein.
Normalisierte Rate
Vergleichen Sie Prävalenz, Inzidenz, Mortalität und andere Daten zweier verschiedener Gruppen, um den Einfluss ihrer internen Zusammensetzung (Alter, Geschlecht, Dienstzeit, Krankheitsdauer, Schwere der Krankheit) auf die Rate zu eliminieren
Einzige Funktion: Vergleich (kann nicht zur Wiedergabe tatsächlicher Werte verwendet werden)
Vorsichtsmaßnahmen:
1. Der Nenner zur Berechnung relativer Zahlen sollte nicht zu klein sein;
2. Das Zusammensetzungsverhältnis kann bei der Analyse nicht anstelle der Rate verwendet werden;
3. Für mehrere Sätze mit unterschiedlicher Anzahl an Beobachtungseinheiten kann der Durchschnittssatz nicht direkt durch Addition berechnet werden;
4. Beim Vergleich relativer Zahlen sollte auf deren Vergleichbarkeit geachtet werden;
5. Der Vergleich der Stichprobenraten (oder Zusammensetzungsverhältnisse) sollte auf Zufallsstichproben basieren und Hypothesentests durchführen.
Statistische Tabellen und Diagramme
Statistiktabelle
Struktur: Sie besteht aus Titeln, Überschriften, Zeilen und Nummern.
Voraussetzungen für die Erstellung statistischer Tabellen:
①Titel: Fassen Sie den Inhalt der Tabelle zusammen und listen Sie ihn in der Mitte über der Tabelle auf. Die Zeit und der Ort sollten angegeben werden.
②Überschrift: Subjekte und Prädikate werden in horizontalen bzw. vertikalen Überschriften aufgeführt. Der Text ist prägnant und die Ebene ist klar. Die horizontalen Überschriften sind auf der linken Seite der Tabelle aufgeführt und werden normalerweise untersucht. Die vertikalen Überschriften werden oben in der Tabelle aufgeführt und sind statistische Indikatoren, die die horizontalen Überschriften veranschaulichen.
③ Linien: Im Allgemeinen werden mit Ausnahme der oberen Linie, der unteren Linie, der vertikalen Linie unter der vertikalen Überschrift und der horizontalen Linie in der Summe alle anderen Linien weggelassen. Die obere und untere Linie sollten etwas dicker sein, diagonale Linien sollten dies nicht tun in der oberen linken Ecke der Tabelle verwendet werden.
④Zahlen: werden mit arabischen Ziffern ausgedrückt. Die Dezimalstellen desselben Indikators sollten konsistent und ausgerichtet sein. Wenn die Zahl fehlt oder keine Zahl hat, wird sie mit „…“ bzw. „-“ ausgedrückt 0, sollte es als „0“ aufgezeichnet werden und nicht leer sein. Elemente sollten summiert werden, um die Überprüfung und Analyse zu erleichtern.
⑤Bemerkungen: Im Allgemeinen nicht in der Tabelle enthalten. Bei Bedarf können sie mit „*“ markiert und unter der Tabelle aufgeführt werden.
zusammenfassendes Diagramm
Histogramm: stellt die Häufigkeitsverteilung kontinuierlicher Daten dar; die Fläche des geraden Rechtecks repräsentiert die Häufigkeit jeder Gruppe
Liniendiagramm: Wird für kontinuierliche Daten verwendet, um die Entwicklung und Veränderung von Dingen im Laufe der Zeit oder die Veränderung eines Phänomens durch ein anderes Phänomen zu veranschaulichen.
Halblogarithmisches Liniendiagramm: Untersuchen Sie die Geschwindigkeit von Indikatoränderungen
Box-Plot
Vergleichen Sie das durchschnittliche Niveau und den Variationsgrad von zwei oder mehr Datensätzen
Jeder Datensatz kann sein Durchschnittsniveau, seinen Interquartilbereich Q (Boxlänge), seinen Maximalwert, seinen Median (mittlere horizontale Linie) und P75\P25 (beide Enden) darstellen.
Je länger die Box ist, desto größer ist die Datenstreuung.
Hauptsächlich zur Beschreibung von Daten mit schiefer Verteilung geeignet
Fehlerbalkendiagramm: Daten, die für [gegenseitigen Vergleich] verwendet werden;
②Kreisdiagramm und prozentuales Balkendiagramm: geeignet für [Daten zum prozentualen Zusammensetzungsverhältnis], die den [Anteil oder die Zusammensetzung] jeder Komponente einer Sache angeben;
⑤Streudiagramm: Geeignet für die lineare Korrelationsanalyse, um die quantitative Beziehung und den sich ändernden Trend zwischen zwei Variablen zu veranschaulichen.
Numerische Schätzung und Hypothesentests
Parameter Schätzung
Standart Fehler
Zentraler Grenzwertsatz
t-Verteilung
grafische Funktionen
1. Eine Ansammlung von Kurven mit symmetrischer unimodaler Verteilung, zentriert auf 0
2. Seine morphologischen Veränderungen hängen mit der Größe von n (genauer gesagt dem Freiheitsgrad ν) zusammen.
Je kleiner der Freiheitsgrad ν ist, desto flacher ist die t-Verteilungskurve.
Je größer der Freiheitsgrad ν, desto näher liegt die t-Verteilungskurve an der Standardnormalverteilungskurve (u-Verteilung).
Der Freiheitsgrad ν ist unendlich und die t-Verteilung ist eine Standardnormalkurve.
{P230} – t-Verteilungsgrenzwerttabelle
Die Daten in der Tabelle stellen die Größe des t-Werts dar
Vergleich zwischen t-Verteilung und Normalverteilung
① Es handelt sich allesamt um unimodale und symmetrische Verteilungen
②Der Höhepunkt der t-Verteilung ist niedriger und der Schwanz ist höher
③Mit zunehmendem Freiheitsgrad nähert sich die t-Verteilung der Standardnormalverteilung; wenn ν gegen ∞ tendiert, ist die Grenzverteilung der t-Verteilung die Standardnormalverteilung.
Konfidenzintervall (glaubwürdiges Intervall) – Ermitteln Sie den Populationsmittelwert μ
zwei Elemente
Genauigkeit: Bestimmt durch 1-α. Je größer 1-α, desto höher die Genauigkeit.
Genauigkeit: Wird durch die Intervalllänge bestimmt.
Das 99 %-Konfidenzintervall ist genauer als das 95 %-Konfidenzintervall. Das 95 %-Konfidenzintervall ist genauer.
z.B. Referenzwertbereich und 95 %-Konfidenzintervall des Gesamtmittelwerts
[95 %-Konfidenzintervall der Schätzung des Populationsmittelwerts] Die Wahrscheinlichkeit, dass dieses Intervall den Populationsmittelwert μ einschließt, beträgt 95 %.
Führen Sie 100 Stichproben durch und berechnen Sie 100 glaubwürdige Intervalle. Im Durchschnitt umfassen 95 der glaubwürdigen Intervalle μ (d. h. die Schätzung ist korrekt) und 5 der glaubwürdigen Intervalle enthalten μ nicht (d. h. die Schätzung ist falsch).
95 % [Konfidenz] ist die Wahrscheinlichkeit, dass die Schätzung korrekt ist.
Intervallschätzung von [Bevölkerungsdurchschnitt] (Intervallschätzung eines einzelnen normalen Populationsmittelwerts μ)
Intervallschätzung von [Differenz zwischen zwei Populationsmittelwerten]
Wenn das Konfidenzintervall der erhaltenen Ergebnisse 0 umfasst, gibt es keinen signifikanten Unterschied.
Wird z. B. verwendet, um den Unterschied in der Wirksamkeit zweier Medikamente zu vergleichen
Intervallschätzung von [Wahrscheinlichkeitsunterschied zwischen zwei Populationen]
hypothetischer Test
(1) Grundidee
(2) Grundlegende Schritte
1. Stellen Sie Hypothesen auf und legen Sie Testniveaus fest
H0: Nullhypothese, der Unterschied existiert, ist aber nicht signifikant oder der Unterschied ist statistisch nicht signifikant
H1: Alternative Hypothese, der Unterschied ist signifikant oder der Unterschied ist statistisch signifikant
Bilateral: Kümmere dich nur um Gleichheit
Einseitig: Besorgt darüber, ob eine Partei größer ist als die andere
Vergleichen Sie den Stichprobenmittelwert mit dem bekannten Populationsmittelwert μ0
Vergleich des Stichprobenmittelwerts μ1 und des Stichprobenmittelwerts μ2
Testniveau/Signifikanzniveau α
2. Unter der Bedingung, dass die Nullhypothese aufgestellt ist, wählen Sie eine statistische Methode und berechnen Sie die Teststatistik. (Es wird davon ausgegangen, dass der Fehler durch die Probenahme verursacht wurde)
Die Testmethode bezieht sich hier auf die parametrische Testmethode, die u-Test, t-Test und Varianzanalyse umfasst und verschiedenen Testformeln entspricht.
Bei Daten aus zwei Stichproben sollte darauf geachtet werden, zwischen den Datentypen [Gruppendesign] und [gepaartes Design] zu unterscheiden.
3. Machen Sie statistische Schlussfolgerungen basierend auf P-Werten
P-Wert ermitteln: (Mit dem Grenzwert vergleichen, Grenzwerttabelle zur Ermittlung des Bereichs prüfen, Softwareberechnung)
Statistik: Der u-Test ermittelt die u-Statistik bzw. den u-Wert; der t-Test ermittelt die t-Statistik bzw. den t-Wert; die Varianzanalyse ermittelt die F-Statistik bzw. den F-Wert
Durch Vergleich des Absolutwerts der erhaltenen Statistik mit dem Grenzwert kann der P-Wert bestimmt werden.
Wenn P>a, akzeptiere H0 und lehne H1 ab; wenn P<a, lehne H1 ab und akzeptiere H0.
Wenn α=0,05,
Der u-Wert sollte mit dem u-Grenzwert von 1,96 verglichen werden, um den P-Wert zu bestimmen.
Wenn u<1,96, dann P>0,05.
Im Gegenteil, wenn u>1,96, dann P<0,05.
Der t-Wert wird mit dem t-Randwert eines bestimmten Freiheitsgrades verglichen, um den P-Wert zu bestimmen.
Wenn der t-Wert <t-Grenzwert ist, dann ist P>0,05.
Wenn P > 0,05, akzeptieren Sie die Nullhypothese und gehen davon aus, dass der Unterschied statistisch nicht signifikant ist oder dass es keinen qualitativen Unterschied zwischen den beiden gibt.
Im Gegenteil, wenn der Grenzwert t>t ist, dann ist P <0,05.
Wenn P < 0,05, wird die Nullhypothese abgelehnt, die Alternativhypothese akzeptiert und der Unterschied als statistisch signifikant angesehen, was auch als qualitativer Unterschied zwischen beiden verstanden werden kann.
Einseitige Tests fallen eher positiv aus
Das heißt, wenn ein einseitiger Test signifikant ist, ist ein zweiseitiger Test möglicherweise nicht signifikant. Wenn jedoch ein zweiseitiger Test signifikant ist, muss ein einseitiger Test signifikant sein.
Aber selbst wenn das Testergebnis P<0,01 oder sogar P<0,001 ist, bedeutet das nicht, dass der Unterschied sehr unterschiedlich ist, sondern nur, dass wir sicherer sind, dass es einen Unterschied zwischen den beiden gibt.
zwei Arten von Fehlern
[Testniveau] [Wahrscheinlichkeit eines Typ-I-Fehlers]
Dargestellt durch α
Es kann ein Einzelschwanz oder ein Doppelschwanz sein, normalerweise 0,05 oder 0,10
Die Teststufe beschreibt die Wahrscheinlichkeit, dass der Test einen Fehler vom Typ I macht.
[Fehlerwahrscheinlichkeit Typ II]
Dargestellt durch β
Mit nur einem Schwanz kann der β-Wert berechnet werden
【Testeffizienz】1-β
Warum P<α die Ablehnung von H0 bedeutet
Fehler vom Typ 1 ist die Ablehnung der korrekten Nullhypothese. Das Signifikanzniveau a ist das höchste Niveau, das für die Ablehnung der Nullhypothese toleriert werden kann, und es ist auch die maximal tolerierbare Wahrscheinlichkeit eines Fehlers vom Typ I. p ist die Mindestanforderung zur Ablehnung der Nullhypothese. Wenn p>a, d. h. die durch das Messtestergebnis festgelegte maximale Signifikanz muss unter dem Mindestniveau liegen, das zur Ablehnung der Nullhypothese erforderlich ist. Mit anderen Worten, das von mir benötigte Minimum ist größer als das maximale Set, daher kann die Nullhypothese nicht abgelehnt werden.