-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy path_main.Rmd
2762 lines (1265 loc) · 131 KB
/
_main.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
---
knit: "bookdown::render_book"
title: "Applied Epi courses"
description: "Training materials for R courses in applied epidemiology and public health"
author: "Applied Epi"
date: "`r Sys.Date()`"
site: bookdown::bookdown_site
documentclass: book
editor_options:
markdown:
wrap: 72
---
# {.unnumbered}
```{r, out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(xfun::relative_path("images/index/applied_epi_banner.png"))
```
<meta name="description" content="Training materials for using R in applied epidemiology and public health">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
## Home page for Applied Epi R courses {.unnumbered}
**See the table of contents on the right to access the course materials**
*Access to exercises is only available to participants in Applied Epi courses.*
## About {.unnumbered}
:::: {style="display: flex;"}
::: {}
**[Applied Epi](https://appliedepi.org/) is a nonprofit organization that supports frontline public health practitioners through accessible tools, training, and support.**
We are a global team of 170 applied epidemiologists and public health practitioners with extensive ground-level experience.
Our free [Epidemiologist R Handbook](https://epiRhandbook.com) is a vital resource for over **450,000 people worldwide**.
:::
::: {}
```{r, out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(xfun::relative_path("images/AE_R_training_support_pyramid.png"))
```
:::
::::
</br>
</br>
We offer a comprehensive ecosystem of training, tools, and support:
:::: {style="display: flex;"}
::: {}
```{r, out.width = "55%", fig.align = "left", echo=F}
knitr::include_graphics("images/teaching_icon.png")
```
**Training:**
**[Live courses](https://appliedepi.org/live/)**
**[Tutorials](https://appliedepi.org/tutorial/)**
**[Case studies](https://appliedepi.org/case/)**
:::
::: {}
```{r, out.width = "55%", fig.align = "left", echo=F}
knitr::include_graphics("images/tools_icon.png")
```
**Tools:**
**[Epi R Handbook](https://epiRhandbook.com)**
**[R packages](https://appliedepi.org/tools/)**
**[Sitrep templates](https://appliedepi.org/tools/)**
:::
::: {}
```{r, out.width = "55%", fig.align = "left", echo=F}
knitr::include_graphics("images/QA_icon.png")
```
**Support:**
**[Community forum](https://community.appliedepi.org)**
**[R Help Desk](https://appliedepi.org/helpdesk/)**
**[Mentorship](https://appliedepi.org/join/)**
:::
::::
<form target="_blank" action="https://www.paypal.com/donate" method="post" target="_top">
<input type="hidden" name="hosted_button_id" value="YTEZELC8VBXV6" />
<input type="image" src="https://github.com/appliedepi/epiRhandbook_eng/raw/master/images/donate_button_long.png" border="0" name="submit" title="PayPal - The safer, easier way to pay online!" alt="Donate with PayPal button" />
<img alt="" border="0" src="https://www.paypal.com/en_US/i/scr/pixel.gif" />
</form>
- Email [**contact\@appliedepi.org**](mailto:[email protected]) or [**join our contact list**](https://forms.gle/9awNd8syypTSYUsn7)
<!-- ======================================================= -->
## Acknowledgements {.unnumbered}
Please note that all of our training materials use *fake example data* in which no person is identifiable and the actual values have been scrambled.
Authors and contributors to curricula from **Applied Epi** include:
* Neale Batra, Arran Hamlet, Adam Vaughan, Mathilde Mousset, Olivia Boyd, Alex Spina, Paula Blomquist, Amy Mikhail, and Mara Kont
* The {outbreaks} package formed the basis for the fake dataset in the Ebola case study.
* The Fulton County Board of Health provided example data (anonymized and scrambled) for a case study
* Illustrations are by Calder Fong or Canva
## Terms of Use {.unnumbered}
These materials are currently restricted to people enrolled in this live course. If you want to offer or use any of these materials in another training course, please contact us first to discuss.
<!--chapter:end:index.Rmd-->
# (PART) About our trainings {.unnumbered}
<!--chapter:end:pages/cat_about.Rmd-->
# Our educational approach {}
```{r, out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(xfun::relative_path("images/AE_R_training_support_pyramid.png"))
```
<!-- ======================================================= -->
## Our philosophy {.unnumbered}
Applied Epi training materials are constructed with the following principles:
### We are focused on frontline practitioners {.unnumbered}
Our efforts are focused on improving the lives of ground-level public health practitioners and applied epidemiologists - the vast workforce at local and national health agencies, NGOs, and healthcare systems.
We believe that most actionable public health intelligence derives from the frontline workforce. They have the most to benefit from R adoption, and their needs have historically been underserved by R developers.
Therefore, our course content focus on the tasks, visualizations, and analyses most common in practical, applied epidemiology and public health.
### We are curators on your behalf {.unnumbered}
We have leveraged our decades of experience using R and working in frontline epidemiology in order to *distill the vast universe of R packages and functions into the most easy and relevant approaches for beginners in public health practice*.
R is notorious for having many ways to do the same thing. We've reviewed the options, and have chosen the easiest and best ones for you.
### Thoughtful and deliberate curriculum {.unnumbered}
To facilitate learning and reduce mental load, we are intentional with our vocabulary, choice of terms, methodological consistency, and the progression of skills that we introduce.
### Building confidence to "tinker" {.unnumbered}
The best (perhaps only) way to learn a new language like R is to "tinker", or to experiment and learn via trial and error. We build this into our courses by progressively encouraging you to write original code and understand R documentation and error messages.
### Setting you up to actually use R {.unnumbered}
Some R courses have students work only in a virtual R environment (it is less hassle for instructors).
In our live courses, we embrace the challenges of setting up R on *your computer*. This means dedicating time to work through the complications posed by employer security restrictions, other software such as OneDrive, VPNs, package downloads, and previous R installations.
Our self-paced tutorials are intended for larger audiences and therefore cannot include the personal attention to troubleshoot R setup on your computer. Nevertheless, we focus on building coding skills within the tutorial, address R setup when possible, and offer "office hours" sessions for assistance.
<!--chapter:end:pages/approach.Rmd-->
# (PART) Intro course {.unnumbered}
<!--chapter:end:pages/cat_intro.Rmd-->
# Intro course (EN) {}
```{r, out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(xfun::relative_path("images/index/applied_epi_banner.png"))
```
<!-- ======================================================= -->
## Overview {.unnumbered}
```{r, out.width = "50%", fig.align = "center", echo=F}
knitr::include_graphics("images/support-help-moz.jpg")
```
[*Image: Neale Batra*]{style="float:right"}
## Course tutoring
As an enrolled participant, you can book 20-minute calls with an instructor (1-on-1) using **[this booking link](https://calendly.com/applied-epi/course-support-en)**. These calls are for questions about the course materials (not other personal/work projects). You may book these during your course period, and one week following.
<!-- ======================================================= -->
## Modules {.unnumbered}
Below is a list of each of the modules included in the course. Please work your way through them systemically - in accordance with the course timetable. Clicking on an exercise link will prompt a login, then launch a window with the interactive exercise.
::: {.tutorial}
**Pre-course preparation**
Follow these step-by-step instructions to intall software, download the course files, setup an RStudio project, and to download and begin the course's interactive exercises.
**Click on each of the steps below to expand the instructions**
<!--
NOTE: everything inside the details tag will be collapsed and effectively
hidden from the user
-->
<details markdown=1><summary markdown="span" style='text-decoration: underline'>Install software</summary>
Please have the following software installed on your computer **prior to the start of the course**.
See this [installation guide](https://fileserve.appliedepi.org/courses/install_guide.pdf) for tips.
1) [R](https://cran.r-project.org/bin/windows/base/) (most recent version)
2) [RStudio](https://www.rstudio.com/products/rstudio/download/#download) (most recent version)
3) [RTools](https://cran.r-project.org/bin/windows/Rtools/) (only needed for Windows machines)
</details>
<details markdown=1><summary markdown="span" style='text-decoration: underline'>Download course files</summary>
Download the zipped course folder at [**this link**](https://fileserve.appliedepi.org/courses/intro_course.zip).
**Unzip/extract the folder and save it on your computer's desktop (not on a shared drive).**
To "unzip" a folder once it is downloaded, right-click on the folder and select "Extract All". If offered a choice of location to save the unzipped folder, save it to your desktop.
On your desktop:
* `r emo::ji("folder")` Desktop
* `r emo::ji("folder")` intro_course
* `r emo::ji("folder")` module1
* `r emo::ji("folder")` ebola
* `r emo::ji("folder")` covid
* `r emo::ji("folder")` learning_materials
* `r emo::ji("document")` packages_to_install.R
<!-- `r emo::ji("warning")` You may also have some other files. Just leave them. -->
<!-- * `r emo::ji("folder")` intro_course -->
<!-- * `r emo::ji("folder")` data -->
<!-- * `r emo::ji("folder")` clean -->
<!-- * `r emo::ji("folder")` raw -->
<!-- * `r emo::ji("folder")` pop -->
<!-- * `r emo::ji("folder")` shp -->
<!-- * `r emo::ji("folder")` scripts -->
<!-- * `r emo::ji("folder")` outputs -->
<!-- * `r emo::ji("folder")` learning_materials -->
<!-- * `r emo::ji("folder")` covid_case_study -->
<!-- * `r emo::ji("folder")` backup_r_packages -->
<!-- * `r emo::ji("document")` surveillance_linelist_20141201.csv -->
<!-- `r emo::ji("warning")` You may also have some other files. Just leave them. -->
</details>
<details markdown=1><summary markdown="span" style='text-decoration: underline'>Install R packages</summary>
Now, go into the "intro_course" folder, and click the file named "packages_to_install.R". Double click, and if necessary select that you want to open the file using *RStudio*. The file should open in RStudio.
Read the instructions written at the top of the script. You should highlight ALL the text in the script and then press the "Run" button located near the top-center of RStudio. Alternatively, you can highlight all the text and then press the keys Ctrl and Enter.
This script will spend several minutes to install most of the R packages that you need for this course.
</details>
<details markdown=1><summary markdown="span" style='text-decoration: underline'>Access the course exercises online</summary>
Begin the course exercises using the links in the "Modules" section below. You will need an Applied Epi account (link provided by instructor in welcome email, or use [this link](community.appliedepi.org)).
* Turn off any VPN
* If you see "Error 403: Forbidden" notify your instructor to give you access to the exercises. After access is given, you will need to clear your cache, or re-open the exercise in a private/incognito window for today.
* If your internet connection is too weak, see the steps below to access the exercises offline.
</details>
<details markdown=1><summary markdown="span" style='text-decoration: underline'>Offline access to course exercises</summary>
If you require offline access, please contact your instructor.
<!-- A further backup method is described below, but will require permissions from an instructor: -->
<!-- **Copy and paste this command into your R Console as shown below, then press the "Enter" key to run the command:** -->
<!-- >`remotes::install_github("appliedepi/introexercises", dep = TRUE, force = TRUE)` -->
<!-- ```{r, eval = TRUE, echo = FALSE, out.width = "75%"} -->
<!-- knitr::include_graphics("images/intro_course_images/install_exercises.png") -->
<!-- ``` -->
<!-- Text will begin to appear in the Console, below the command. Do not worry, R is simply downloading the tutorials from the internet and printing updates. *Watch the print-out for any questions that R may ask you:* -->
<!-- * If you encounter an error referencing HTTP or "proxy", then downloading from Github may be blocked by your institution. Proceed to the backup steps below. -->
<!-- * If you see a printed warning about needing "RTools", do not worry. This is simply a warning message and the install should proceed without error. -->
<!-- * If prompted to update some R packages, select "All" to update all of the packages. If you continue to be prompted for package updates, you can select "None" and continue without further updates. -->
<!-- **Backup option:** -->
<!-- **Go to the "Tools" menu of RStudio, and select "Install packages".** -->
<!-- ```{r, eval = TRUE, echo = FALSE, out.width = "75%"} -->
<!-- knitr::include_graphics("images/intro_course_images/zip_tools_menu.png") -->
<!-- ``` -->
<!-- **In the pop-up window, select "zip" from the first drop-down menu.** -->
<!-- ```{r, eval = TRUE, echo = FALSE, out.width = "50%"} -->
<!-- knitr::include_graphics("images/intro_course_images/zip_drop_down.png") -->
<!-- ``` -->
<!-- **Another window should appear to select a file (if not, select "Browse"). Navigate to the folder "Desktop/intro_courses/learning_materials/backup_r_packages".** Note the 8 zipped folders here - each one is an R package. Select the first one "basket", press "Open", then click "Install". R will run a brief command to install this package. **Repeat this step to install each of the 8 zipped folders.** -->
<!-- ```{r, eval = TRUE, echo = FALSE, out.width = "75%"} -->
<!-- knitr::include_graphics("images/intro_course_images/zip_package_select.png") -->
<!-- ``` -->
<!-- If continuing to experience errors, you may need to restart R, and then run the following command: -->
<!-- >`install.packages(c("tibble", "cli", "magrittr", "tidyr", "cli", "rlang", "tibble", "dplyr", "cachem", "fastmap"))` -->
<!-- Your instructor can continue to troubleshoot with you. -->
<!-- Now, the course exercises will appear *within your RStudio* offline. Each course module has a corresponding exercise, which can be accessed through the "Tutorials" pane in RStudio (upper-left). The gif below introduces you to the exercise environment (you do not need to follow the steps shown right now). -->
<!-- ```{r, eval = TRUE, echo = FALSE, out.width = "100%"} -->
<!-- knitr::include_graphics("images/intro_course_images/exercise_demo_short_words.gif") -->
<!-- ``` -->
<!-- 1) Click on the "Tutorial" tab in the upper-right RStudio pane (which also contains a tab holding your "Environment"). -->
<!-- * Scroll down and review the listed exercises. If you do not see any "Applied Epi" exercises listed, close and re-open RStudio. They may take a minute to appear. -->
<!-- 2) Select the exercise, for example: "Applied Epi - R setup, syntax, data import" -->
<!-- * The exercise will load. Once you see the Applied Epi logo appear in the Tutorials pane, you can begin the exercise. -->
<!-- * To see the sidebar in the exercise, you may need to adjust the Tutorials pane to be wider. You can also adjust the zoom from the "View" menu. -->
<!-- * You can view the exercise in this pane, or click the small icon in the upper-left to pop-out into a separate window. -->
</details>
:::
::: {.tutorial}
**Module 1: Introduction to R Syntax**
We welcome you to the course, review course logistics, detail the support resources available to you.
Next, we dive into a coding demonstration to introduce you to R and RStudio. We cover the basics of how to interact with R and RStudio, R syntax and running commands, and we cover R functions and packages. Finally, we import a basic dataset into R and do some exploratory analysis.
- [Slides: Course logistics, RStudio, basic R syntax](https://appliedepi.github.io/slides/intro/intro01/intro01.html)
- [Exercise: R setup, basic syntax, functions, and packages](http://start-exercise.appliedepi.org/app/intro01)
- [Video: Module 1 Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod1)
- [Video: Data import and tidy data](https://files.appliedepi.org/media/mod2)
:::
::: {.tutorial}
**Module 2: Data cleaning - part 1**
We begin working on the Ebola case linelist, which we will use for the next 7 modules. We review which "data cleaning" steps might be necessary and how to execute these in R. Along the way, we introduce the core principles of "tidy data".
Through data cleaning, we teach you the core R functions for handling data, including for standardizing and editing column names, de-duplicating and filtering rows, selecting and modifying columns, re-coding values, and more.
Together, we write a sequence of "pipes" to clean the linelist step-by-step in a clear, reproducible manner... so that our dataset is ready for preliminary analysis!
- [Slides: Tidy data and data cleaning](https://appliedepi.github.io/slides/intro/intro02/intro02.html)
- [Exercise: Cleaning data - part 1](http://start-exercise.appliedepi.org/app/intro02)
- [Video: Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod3)
:::
::: {.tutorial}
**Module 3: Data cleaning - part 2**
We continue writing our data cleaning code, covering more advanced re-coding, filtering rows, exporting data, and some additional practice exercises.
- [Slides: Data cleaning part 2](https://appliedepi.github.io/slides/intro/intro03/intro03.html)
- [Exercise: Cleaning data part 2](http://start-exercise.appliedepi.org/app/intro03)
- [Video: Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod4)
:::
::: {.tutorial}
**Module 4: Grouping data and summary tables**
Informative tables are the bedrock of epidemiological and public health practice. In this module we introduce three tools to produce tables of summary statistics: {dplyr} for flexibility, {janitor} for speed, and {gtsummary} for beauty.
Finally, we explore {flextable}, which can be used to customize tables produced by any of the above approaches: adding colors and highlights, and saving tables to Word, PNG, HTML, etc.
- [Slides: Grouping and summarizing data](https://appliedepi.github.io/slides/intro/intro04/intro04.html)
- [Exercise: Grouping data and summary tables](http://start-exercise.appliedepi.org/app/intro04)
- [Video: Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod5)
:::
::: {.tutorial}
**Module 5: Data visualization with {ggplot2}**
Using the {ggplot2} package to maximum effect depends upon understanding how to apply its "grammar of graphics" to build a plot layer-by-layer. We tackle this by introducing the syntax logically and using public health examples - so that you build upon previous knowledge to construct informative and colorful bar plots, scatter plots, histograms, box/violin plots, and line plots.
We also teach you to write text labels that automatically update with refreshed data (very useful for epidemiological reports!), use colors that are colorblind-friendly, and more.
*Part 1:*
- [Slides: Data visualization with ggplot2](https://appliedepi.github.io/slides/intro/intro05-1/intro05-1.html)
- [Exercise: ggplot basics](http://start-exercise.appliedepi.org/app/intro05-1)
*Part 2:*
- [Slides: Scales, themes, and labels](https://appliedepi.github.io/slides/intro/intro05-2/intro05-2.html)
- [Exercise: Scales, themes, and lables](https://start-exercise.appliedepi.org/app/intro05-2)
- [Video: Lectures, Demos, Debrief](https://files.appliedepi.org/media/mod6)
:::
::: {.tutorial}
**Module 6: Troubleshooting Errors and Getting Help**
In this module, we teach you how to troubleshoot error messages, read function documentation, and how to effectively get help from online forums by creating a "minimal, reproducible example (reprex)" of a coding problem. You will post R code questions in our [Community Forum](http://community.appliedepi.org).
- [Slides](https://appliedepi.github.io/slides/intro/intro06/intro06.html)
- [Exercise: Reprex and next steps](http://start-exercise.appliedepi.org/app/intro06)
:::
::: {.tutorial}
**Module 7: Reports with R Markdown**
In this module, we take your R code and convert it into a reproducible, automated report (e.g. Word, PDF, HTML, etc.).
We teach you the tips and tricks to produce documents beautiful documents that update when incoming data are refreshed to inform public health partners and stakeholders.
- [Slides: R Markdown and routine reports](https://appliedepi.github.io/slides/intro/intro07/intro07.html)
- [Exercise: R Markdown](http://start-exercise.appliedepi.org/app/intro07)
- [Video: Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod9)
:::
::: {.tutorial}
**Module 8: Transforming data: joins, pivots, and factors**
Public health analytics rarely involves just one data set, so now we practice joining data by adding hospital, laboratory, and case investigation data to our surveillance linelist. We ingrain best practices for conducting joins, and prepare you for doing data transformations independently.
In the second part of this module, we address *pivoting*, which in R means transforming data between "long" and "wide" formats. This is particularly relevant in public health, where each format has distinct benefits.
Along the way, we introduce the uses of the "factor" class (R's version of ordered levels in a variable) by constructing a timeline visualization of some patients' pathways through the surveillance/medical system.
*Part 1:*
- [Slides: Joining data](https://appliedepi.github.io/slides/intro/intro08-1/intro08-1.html)
- [Exercise: Joining data](http://start-exercise.appliedepi.org/app/intro08-1)
*Part 2:*
- [Slides: Pivoting data](https://appliedepi.github.io/slides/intro/intro08-2/intro08-2.html)
- [Exercise: Pivoting data](http://start-exercise.appliedepi.org/app/intro08-2)
- [Video: Lectures, Demos, Debrief](https://files.appliedepi.org/media/mod7)
:::
::: {.tutorial}
**Module 9: Data visualization for public health**
In this second data visualization module we encourage you to practice learning R independently by reading function documentation. We still support you, and give live coding demonstrations for all the topics, as usual.
We cover the various ways to define "epiweeks" using R, and our recommended approach including a cheatsheet.
We then tackle visualizations that are central to descriptive epidemiology: the intricacies of crafting an accurate epidemic curve, conveying patterns across three variables using a heat plot, and creating age/sex pyramids to describe demographics. If there is time, we finish with a demonstration of R's GIS/geospatial capabilities.
- There are no slides for module 9
- [Exercise: Data visualization for public health](http://start-exercise.appliedepi.org/app/intro09)
- Your instructor will provide our "cheatsheet" on epidemic weeks and making epicurves
- [Video: Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod8)
:::
::: {.tutorial}
**Module 10: COVID-19 case study - skill application to a new outbreak**
In this final module, put your skills to the test by writing an R Markdown report using a new dataset - a COVID-19 case linelist.
Unlike with the Ebola case study, you will not have solution code available to you. Instead, you will be given a Word document to reproduce by writing an R Markdown script. This will require data cleaning, creating common epidemiological plots, joining datasets, and creating descriptive tables.
- [Slides: ](https://appliedepi.github.io/slides/intro/intro10/intro10.html)
- [Exercise: COVID-19 exercise](http://start-exercise.appliedepi.org/app/intro10)
- *Exercise materials*: See the folder "intro_course/covid/" for the Word document report to replicate and the datasets.
- [Video: Lecture, Demo, Debrief](https://files.appliedepi.org/media/mod10)
:::
<!--chapter:end:pages/intro_modules_en.Rmd-->
# Cours d'introduction (FR) {}
```{r, out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(xfun::relative_path("images/index/applied_epi_banner.png"))
```
<!-- ======================================================= -->
```{r, out.width = "50%", fig.align = "center", echo=F}
knitr::include_graphics("images/support-help-moz.jpg")
```
[*Image: Neale Batra*]{style="float:right"}
## Tutorat de cours
En tant que participant inscrit, vous pouvez réserver des appels de 20 minutes avec un instructeur (1 contre 1) en utilisant **[ce lien de réservation](https://calendly.com/applied-epi/soutien-pour-course)**. Ces appels sont destinés à répondre à des questions sur le matériel de cours (et non sur d'autres projets personnels/professionnels). Vous pouvez réserver ces appels pendant votre période de cours et une semaine après.
<!-- ======================================================= -->
## Les modules {.unnumbered}
Vous trouverez ci-dessous une liste de chacun des modules inclus dans le cours. Veuillez les parcourir de manière systématique, en suivant le calendrier du cours. En cliquant sur le lien d'un exercice, vous serez invité à vous connecter, puis à ouvrir une fenêtre avec l'exercice interactif.
::: {.tutorial}
**Préparation au cours**
Suivez ces instructions étape par étape pour installer le logiciel, télécharger les fichiers du cours, configurer un projet RStudio, et pour télécharger et commencer les exercices interactifs du cours.
**Cliquez sur chacune des étapes ci-dessous pour développer les instructions.**
<!--
NOTE : tout ce qui se trouve à l'intérieur de la balise details sera réduit et effectivement
caché à l'utilisateur
-->
<details markdown=1><summary markdown="span" style='text-decoration : underline'>Installation du logiciel</summary>
Veuillez avoir les logiciels suivants installés sur votre ordinateur **avant le début du cours**.
Consultez ce [guide d'installation](https://fileserve.appliedepi.org/courses/install_guide.pdf) pour obtenir des conseils.
1) [R](https://cran.r-project.org/bin/windows/base/) (version la plus récente)
2) [RStudio](https://www.rstudio.com/products/rstudio/download/#download) (version la plus récente)
3) [RTools](https://cran.r-project.org/bin/windows/Rtools/) (nécessaire uniquement pour les machines Windows)
</details>
<details markdown=1><summary markdown="span" style='text-decoration : underline'>Télécharger les fichiers du cours</summary>.
Téléchargez le dossier de cours zippé sur [**ce lien**](https://fileserve.appliedepi.org/courses/intro_course_fr.zip).
**Dézippez/extractez le dossier et enregistrez-le sur le bureau de votre ordinateur (pas sur un disque partagé).**
Pour "dézipper" un dossier une fois qu'il est téléchargé, cliquez avec le bouton droit de la souris sur le dossier et sélectionnez "Extraire tout". Si vous avez le choix de l'emplacement où enregistrer le dossier dézippé, enregistrez-le sur votre bureau.
Sur votre bureau :
* `r emo::ji("folder")` Bureau
* `r emo::ji("folder")` intro_course
* `r emo::ji("folder")` data
* `r emo::ji("folder")` scripts
* `r emo::ji("folder")` outputs
* `r emo::ji("folder")` learning_materials
* `r emo::ji("document")` surveillance_linelist_20141201.csv
</details>
<details markdown=1><summary markdown="span" style='text-decoration : underline'>Installer les paquets R</summary>
Maintenant, allez dans le dossier "intro_course", et cliquez dans les sous-dossiers "scripts" et "backup". Vous y trouverez un fichier nommé "packages_to_install.R". Double-cliquez, et si nécessaire, sélectionnez que vous voulez ouvrir le fichier en utilisant *RStudio*. Le fichier devrait s'ouvrir dans RStudio.
Lisez les instructions écrites en haut du script. Vous devez mettre en surbrillance TOUT le texte du script, puis appuyer sur le bouton "Run" situé près du centre supérieur de RStudio. Vous pouvez également mettre tout le texte en surbrillance, puis appuyer sur les touches Ctrl et Entrée.
Ce script prendra plusieurs minutes pour installer la plupart des paquets R dont vous avez besoin pour ce cours.
</details>
<details markdown=1><summary markdown="span" style='text-decoration : underline'>Créer un nouveau projet RStudio</summary>
1) Ouvrez RStudio (assurez-vous d'ouvrir *RStudio* et pas seulement *R*).
2) Dans RStudio, cliquez sur *File -> New Project*. Dans la fenêtre pop-up, sélectionnez **"Existing directory (Dossier existant) "**.
```{r, eval = TRUE, echo = FALSE, out.width = "50%"}
knitr::include_graphics("images/intro_course_images/create_project.png")
```
3) Cliquez sur "browse" et sélectionnez le dossier "intro_course" sur votre bureau, contenant le matériel de cours, que vous avez téléchargé plus tôt. Puis cliquez sur "Créer un projet".
Voilà ! Ce sera le projet pour tout votre travail dans ce cours.
</details>
<details markdown=1><summary markdown="span" style='text-decoration : underline'>Accéder aux exercices du cours en ligne</summary>.
Commencez les exercices du cours en utilisant les liens dans la section "Modules" ci-dessous. Vous aurez besoin d'un compte Applied Epi (lien fourni par l'instructeur dans le courriel de bienvenue, ou utilisez [ce lien] (community.appliedepi.org)).
* Désactivez tout "VPN"
* Si vous voyez "Error 403 : Forbidden", demandez à votre instructeur de vous donner accès aux exercices. Une fois l'accès accordé, vous devrez vider votre cache, ou rouvrir l'exercice dans une fenêtre privée/incognito pour aujourd'hui.
* Si votre connexion internet est trop faible, voir les étapes ci-dessous pour accéder aux exercices hors ligne.
</details>
:::
::: {.tutorial}
**Module 1 : Introduction à la syntaxe R**
Nous vous souhaitons la bienvenue au cours, passons en revue la logistique du cours et détaillons les ressources d'assistance mises à votre disposition.
Ensuite, nous nous plongeons dans une démonstration de codage pour vous présenter R et RStudio. Nous abordons les bases de l'interaction avec R et RStudio, la syntaxe R et l'exécution des commandes, ainsi que les fonctions et les packages R.
- [Diapositives: Bienvenue, logistique du cours, RStudio, et syntaxe R de base](https://appliedepi.github.io/slides/intro/fr/module_1/module_1.html)
- [Exercise: Configuration de R, syntaxe de base, fonctions et packages](http://start-exercise.appliedepi.org/app/basics_fr)
:::
::: {.tutorial}
**Module 2: Gestion des fichiers, importation de données et inspection d'un ensemble de données**
Nous couvrons les stratégies de gestion des fichiers, la façon de travailler au sein d'un projet RStudio, et nous présentons les fonctions de nos paquets recommandés utilisées pour importer et examiner les données. À l'aide de ces fonctions, nous importons la liste de surveillance Ebola de l'étude de cas et commençons à l'inspecter.
- [Diapositives : Projets RStudio, importation de données, chemins de fichiers](https://appliedepi.github.io/slides/intro/fr/module_2/module_2.html)
- [Exercice: Gestion des fichiers et importation de données](http://start-exercise.appliedepi.org/app/files_import_fr)
:::
::: {.tutorial}
**Module 3: Nettoyage des données - partie 1**
Maintenant que nous avons importé notre liste de lignes de surveillance, nous passons en revue les étapes de "nettoyage des données" qui peuvent s'avérer nécessaires et la manière de les exécuter dans R. En cours de route, nous introduisons les principes fondamentaux des "données ordonnées".
Grâce au nettoyage des données, nous vous apprenons les fonctions R de base pour le traitement des données, y compris la normalisation et la modification des noms de colonnes, la suppression des doublons et le filtrage des lignes, la sélection et la modification des colonnes, le recodage des valeurs, etc.
Ensemble, nous écrivons une séquence de "tuyaux" pour nettoyer la liste de lignes étape par étape d'une manière claire et reproductible... afin que notre ensemble de données soit prêt pour une analyse préliminaire !
- [Diapositives : Tidy data et nettoyage des données](https://appliedepi.github.io/slides/intro/fr/module_3/module_3.html)
- [Exercice : Nettoyage des données - partie 1](http://start-exercise.appliedepi.org/app/cleaning_fr)
:::
::: {.tutorial}
**Module 4: Nettoyage des données - partie 2**
Nous continuons à écrire notre code de nettoyage des données, en couvrant un recodage plus avancé, le filtrage des lignes, l'exportation des données, et quelques exercices pratiques supplémentaires.
- [Diapositives: Nettoyage des données - partie 2](https://appliedepi.github.io/slides/intro/fr/module_4/module_4.html)
- [Exercice: Nettoyage des données - partie 2](http://start-exercise.appliedepi.org/app/cleaning2_fr)
:::
::: {.tutorial}
**Module 5: Regroupement des données et tableaux de synthèse**
Les tableaux informatifs sont le fondement de la pratique de l'épidémiologie et de la santé publique. Dans ce module, nous présentons trois outils permettant de produire des tableaux de statistiques sommaires : {dplyr} pour la flexibilité, {janitor} pour la rapidité, et {gtsummary} pour la beauté.
Enfin, nous explorons {flextable}, qui peut être utilisé pour personnaliser les tableaux produits par l'une ou l'autre des approches ci-dessus : ajout de couleurs et de surbrillance, et sauvegarde des tableaux en Word, PNG, HTML, etc.
- [Diapositives: Regrouper et résumer les données](https://appliedepi.github.io/slides/intro/fr/module_5/module_5.html)
- [Exercice: Regrouper et résumer les données](http://start-exercise.appliedepi.org/app/grouping_summaries_fr)
:::
::: {.tutorial}
**Module 6: La visualisation de données avec {ggplot2}**
L'utilisation optimale du package {ggplot2} dépend de la compréhension de la manière d'appliquer sa "grammaire des graphiques" pour construire un graphique couche par couche. Nous abordons cette question en introduisant la syntaxe de manière logique et en utilisant des exemples de santé publique - de sorte que vous vous appuyiez sur vos connaissances antérieures pour construire des diagrammes à barres, des diagrammes de dispersion, des histogrammes, des diagrammes en boîte/violine et des diagrammes linéaires informatifs et colorés.
Nous vous apprenons également à écrire des étiquettes de texte qui se mettent automatiquement à jour lorsque les données sont actualisées (très utile pour les rapports épidémiologiques !), à utiliser des couleurs adaptées aux daltoniens, etc.
- [Diapositives: La visualisation de données avec {ggplot2}](https://appliedepi.github.io/slides/intro/fr/module_6-1/module_6-1.html)
- [Exercice: Les bases de ggplot2](http://start-exercise.appliedepi.org/app/ggplot_basics_fr)
- [Diapositives: Échelles, thèmes et étiquettes](https://appliedepi.github.io/slides/intro/fr/module_6-2/module_6-2.html)
- [Exercice: Échelles, thèmes et étiquettes](https://start-exercise.appliedepi.org/app/ggplot_scales_themes_fr)
:::
::: {.tutorial}
**Module 7: Transformation des données : jointures, pivots et facteurs**
L'analyse de la santé publique implique rarement un seul ensemble de données. Nous allons donc nous entraîner à joindre des données en ajoutant des données d'hôpitaux, de laboratoires et d'enquêtes sur les cas à notre liste de surveillance. Nous vous inculquons les meilleures pratiques pour effectuer des jointures et vous préparons à effectuer des transformations de données de manière indépendante.
Dans la deuxième partie de ce module, nous abordons le *pivotage*, ce qui, dans R, signifie transformer les données entre les formats "long" et "large". Ceci est particulièrement pertinent dans le domaine de la santé publique, où chaque format présente des avantages distincts.
En cours de route, nous présentons les utilisations de la classe "facteur" (la version de R des niveaux ordonnés d'une variable) en construisant une visualisation chronologique du parcours de certains patients dans le système de surveillance/médical.
- [Dispositives: Joindre des données](https://appliedepi.github.io/slides/intro/fr/module_7-1/module_7-1.html)
- [Exercice: Joindre des données](http://start-exercise.appliedepi.org/app/joining_fr)
- [Dispositives: Pivoter les données](https://appliedepi.github.io/slides/intro/fr/module_7-2/module_7-2.html)
- [Exercice: Pivoter les données](http://start-exercise.appliedepi.org/app/pivoting_fr)
:::
::: {.tutorial}
**Module 8: Visualisation de données pour la santé publique**
Dans ce deuxième module de visualisation de données, nous vous encourageons à vous entraîner à apprendre R de manière indépendante en lisant la documentation des fonctions (une compétence nécessaire une fois que vous aurez quitté le cours !). Nous continuons à vous soutenir et à faire des démonstrations de codage en direct pour tous les sujets, comme d'habitude.
Nous couvrons les différentes façons de définir les "épiweeks" à l'aide de R, et notre approche recommandée, y compris une feuille de route.
Nous abordons ensuite les visualisations qui sont essentielles à l'épidémiologie descriptive : les subtilités de l'élaboration d'une courbe épidémique précise, la transmission de modèles à travers trois variables à l'aide d'un diagramme de chaleur, et la création de pyramides d'âge/sexe pour décrire les données démographiques. S'il reste du temps, nous terminerons par une démonstration des capacités SIG/géospatiales de R.
- [Exercice: Visualisation de données pour la santé publique](http://start-exercise.appliedepi.org/app/ggplot_heat_epicurves_pyramids_fr)
- Le script R de démonstration du SIG se trouve dans le dossier de votre cours: *"intro_course/scripts/backup/5_gis_demo.R"*
- Votre instructeur vous fournira notre "cheatsheet" sur les semaines d'épidémie et la réalisation d'épicurves.
:::
::: {.tutorial}
**Module 9: Rapports avec R Markdown**
Dans ce module, nous prenons le code R sur l'étude de cas Ebola que vous avez rédigé tout au long du cours et le convertissons en un rapport automatisé reproductible (par exemple Word, PDF, HTML, etc.).
Nous vous enseignons les variations de syntaxe pour produire des documents qui se mettent à jour lorsque les données entrantes sont actualisées et qui peuvent être utilisés pour informer les partenaires de la santé publique et les parties prenantes.
- [Despositives: R Markdown et rapports de routine](https://appliedepi.github.io/slides/intro/fr/module_9/module_9.html)
- [Exercice: R Markdown](http://start-exercise.appliedepi.org/app/rmarkdown_fr)
:::
::: {.tutorial}
**Module 10: Exercice final, et examen du code par les pairs**
Dans ce dernier module, vous mettez vos compétences à l'épreuve en rédigeant un rapport R Markdown à l'aide d'un nouvel ensemble de données - une liste linéaire de cas COVID-19.
Contrairement à l'étude de cas Ebola, vous n'aurez pas de code de solution à votre disposition. Au lieu de cela, on vous donnera un document Word à reproduire en écrivant un script R Markdown. Il faudra nettoyer les données, créer des graphiques épidémiologiques communs, joindre des ensembles de données et créer des tableaux descriptifs.
S'il reste du temps, nous effectuons des "revues de code par les pairs" qui améliorent simultanément vos compétences en codage et vous apprennent à revoir le code des autres. Avant de conclure, nous expliquons comment trouver votre communauté d'utilisateurs de R et les ressources disponibles pour poursuivre votre apprentissage.
- *Matériel d'exercice*: Voir le dossier "intro_course/learning_materials/covid_case_study" pour le rapport du document Word à reproduire, les jeux de données et une fiche de conseils.
:::
<!--chapter:end:pages/intro_modules_fr.Rmd-->
# Вступний курс (UA) {}
```{r, out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(xfun::relative_path("images/index/applied_epi_banner.png"))
```
<!-- ======================================================= -->
## Огляд {.unnumbered}
```{r, out.width = "50%", fig.align = "center", echo=F}
knitr::include_graphics("images/support-help-moz.jpg")
```
[*Image: Neale Batra*]{style="float:right"}
<!-- ======================================================= -->