Lösung Übung 1 - Datentransformation für Überlebenszeitanalyse

Erstellt ein neues Objekt, welches ihr hnscc_survival nennt und nehmt in diesem folgende Änderungen vor:

  1. Nennt die Spalte days_to_death in OS um und stellt sicher, dass diese ein numerischer Vektor ist.
  2. Erstellt eine neue Spalte namens Censor, in der ihr die Spalte vital_status als Faktor speichert (as.factor()).
  3. Ändert die Level der neu erstellten Spalte Censor von “LIVING” und “DECEASED” in 0 und 1 um. Googled hierzu, wie man die Level eines Faktors ändern kann.
  4. Anschließend gilt es die Spalte Censor als “normalen” Vektor (as.vector()) zu speichern und dann in einen numerischen Vektor (as.numeric()) zu überführen.
hnscc_survival <- hnscc %>%
dplyr::rename(OS=days_to_death) %>% 
    mutate(Censor = as.factor(vital_status))

levels(hnscc_survival$Censor) <- c(1,0) 
hnscc_survival$Censor = as.numeric(as.vector(hnscc_survival$Censor))

Lösung Übung 2 - Erstellung eines “survival” Objektes

Die Erstellung des survival Objektes ist gleichzeitig die Kontrolle, ob die Datentransformation geklappt hat. Der Output sollte wie folgt ausschauen:

Surv(hnscc_survival$OS, hnscc_survival$Censor)
##   [1]  461   415  1134   276   248+  190+  845+ 1761   186+  179+  242+ 1635+
##  [13] 1747+  152+  244+  450    63+  395   113+  236+  186+ 2891+  275+  140+
##  [25]  557+  412+  310+  142   194+  325+  166+  343+  383+  522+  369+  395 
##  [37]  240+  436   348+  810+  875+  397   279+  289+  173+  377   866+  252 
##  [49]  493   351   360   352   380   259   413+  274+  207+  228+  143+  154+
##  [61]  201+  159+   45+  134+   97+  276   201+  188+  224+   42+  177+   83+
##  [73]  119+  112   100+   46+ 1465+ 1207+  654    89   841+  896+ 1028+  317 
##  [85]  128   870+  984  1000+ 1057+  984+  403   128   455   814+ 1006+  693+
##  [97] 2562+  358+ 1662+ 1152+  798+ 1777+ 1521+ 1202  1050+ 1125+  563   514+
## [109]  183   311+  345+  354+  233+  379+  350+  479+  282  1435+ 1190+ 1440+
## [121] 1244+ 1090   104+   93   759+  889+   30+  972+   NA+ 1036+  606   796+
## [133]  521   997+ 1430+  822   392+  907+  913+  946+  908+  898+  929+  216+
## [145]  156+  180+ 1077+  910+ 1471+ 4115+  522  3930+ 3314  2318   584   546 
## [157] 2732+ 2663+ 2326+ 2567+ 1969+  545   406   540+ 1736+ 1478+ 1007+  215 
## [169] 1315+ 1246+  405+  743+  291  2740    65   295   166   624   143   665 
## [181]  804   342  3835+  602   366  1288   458   914   185  1640  2002   334 
## [193]  217   255   861    76   126  1971  3836+ 3380+  572   385   243   274 
## [205]  159    56  1591   392   662  2166   327  3496+ 1724+  144  1444+ 1095+
## [217]  953+  797+  577   520  2900   151   361  1459    64  1099+  560  1748 
## [229] 1081  6416  2717   294    14   695   761   789     2  1037  3058   452 
## [241] 4760   106   495  2570   600   217  4334+  505   194   669   316+  321+
## [253]  236+  828+  403   325+  250+  238+   77+  152+  153+ 1149+ 1058+  516+
## [265]  477+  548   427   360+  299+   35+   30+    2+    5+   25+    0+    0+
## [277]  160+  122+  113+
  1. Erstellt mit Hilfe der survfit Funktion ein Objekt mit Namen fit für die Kaplan-Meier-Kurve, in der ihr das Geschlecht analysiert.
fit <- survfit(Surv(OS, Censor)~gender, data=hnscc_survival)

Lösung Übung 3 - Kaplan-Meier Kurve und univariate Überlebenszeitanalyse

  1. Erstellt die Kaplan-Meier-Kurve zum Objekt fit, welches ihr in Übung 2 erstellt habt.
ggsurvplot(fit, hnscc_survival)

  1. Findet heraus, wie man einen Risk-Table erstellen kann
ggsurvplot(fit, 
           hnscc_survival, 
           risk.table = TRUE)
## Warning: Vectorized input to `element_text()` is not officially supported.
## Results may be unexpected or may change in future versions of ggplot2.

Lösung Übung 4 - Multivariate Überlebenszeitanalyse

# Beispielmodel: Alter und Tabacco group
tidy(coxph(Surv(OS, Censor)~age + tabacco_group, data=hnscc_survival),
     exponentiate = TRUE)
## # A tibble: 4 x 5
##   term                                      estimate std.error statistic p.value
##   <chr>                                        <dbl>     <dbl>     <dbl>   <dbl>
## 1 age                                          1.02    0.00931     2.58  0.00986
## 2 tabacco_groupCurrent reformed smoker for~    0.520   0.292      -2.23  0.0255 
## 3 tabacco_groupCurrent smoker                  1.22    0.235       0.838 0.402  
## 4 tabacco_groupLifelong Non-smoker             0.553   0.309      -1.92  0.0552

Alter und Tabacco Group sind unabhängige prognostische Einflussgrößen.

Lösung Zugabe

Nein