Metabolomics Data Analysis

# Metabolomics Data Analysis
## Demo
### Miao Yu
### 2018/07/13

---

ga('create', 'UA-43118729-1', 'auto');
  ga('send', 'pageview');

</script>

# Don't Panic

<div class="figure" style="text-align: center">
<img src="https://yufree.github.io/presentation/figure/onecode.gif" alt="When you change one parameter in your code..." width="72%" />
<p class="caption">When you change one parameter in your code...</p>
</div>

---

# Workflow

---

# Project Setup

## Data

- Different groups should assign different sub-folder

## Anno

- For annotation results

## Workflow.Rmd

- Templete script for reproducible research

---

# Data conversion

<div class="figure" style="text-align: center">
<img src="https://yufree.github.io/presentation/figure/MSconvert.png" alt="MSconvert" width="60%" />
<p class="caption">MSconvert</p>
</div>

.half[
Kessner, D., Chambers, M., Burke, R., Agus, D., & Mallick, P. (2008). ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics, 24(21), 2534–2536. doi:10.1093/bioinformatics/btn323
]

---

# Session Info

```r
# record the software version
sessionInfo()
```

```
R version 3.5.0 (2018-04-23)
Platform: x86_64-apple-darwin15.6.0 (64-bit)
Running under: macOS High Sierra 10.13.6

Matrix products: default
BLAS: /Library/Frameworks/R.framework/Versions/3.5/Resources/lib/libRblas.0.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/3.5/Resources/lib/libRlapack.dylib

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base

loaded via a namespace (and not attached):
 [1] Rcpp_0.12.18     plyr_1.8.4       compiler_3.5.0   pillar_1.3.0    
 [5] later_0.7.3      highr_0.7        bindr_0.1.1      tools_3.5.0     
 [9] digest_0.6.15    jsonlite_1.5     evaluate_0.11    tibble_1.4.2    
[13] rcrossref_0.8.4  pkgconfig_2.0.1  rlang_0.2.1      bibtex_0.4.2    
[17] shiny_1.1.0      curl_3.2         crul_0.6.0       yaml_2.2.0      
[21] xfun_0.3.5       bindrcpp_0.2.2   xml2_1.2.0       stringr_1.3.1   
[25] dplyr_0.7.6      knitr_1.20       htmlwidgets_1.2  triebeard_0.3.0 
[29] rprojroot_1.3-2  DT_0.4           tidyselect_0.2.4 httpcode_0.2.0  
[33] glue_1.3.0       R6_2.2.2         rmarkdown_1.10   xaringan_0.7    
[37] purrr_0.2.5      magrittr_1.5     urltools_1.7.1   backports_1.1.2 
[41] codetools_0.2-15 promises_1.0.1   htmltools_0.3.6  assertthat_0.2.0
[45] mime_0.5         xtable_1.8-2     httpuv_1.4.5     stringi_1.2.4   
[49] miniUI_0.1.1.1   crayon_1.3.4    
```

---

# Optimization

```r
library(IPO)
library(xcms)
# the path should be some pool QC samples
path <- list.files('D:/metademo/data/oq/',full.names = T,recursive = T)
# find the parameters for peak picking algorithm
peakpickingParameters <- getDefaultXcmsSetStartingParams('centWave')
# for obitrap, ppm should be 5
peakpickingParameters$ppm <- 15
resultPeakpicking <- 
  optimizeXcmsSet(files = path, 
                  params = peakpickingParameters,
                  nSlaves = 1,
                  subdir = NULL)
# find the parameters for retention time correction algorithm, obiwarp
optimizedXcmsSetObject <- resultPeakpicking$best_settings$xset
retcorGroupParameters <- getDefaultRetGroupStartingParams()
resultRetcorGroup <-
  optimizeRetGroup(xset = optimizedXcmsSetObject, 
                   params = retcorGroupParameters, 
                   subdir = NULL)
writeRScript(resultPeakpicking$best_settings$parameters, 
             resultRetcorGroup$best_settings)
```

---

### IPO package

`$$Peak\ Picking\ Score = \frac{reliable\ peaks^2}{all\ peaks - low\ intensity\ peaks}$$`

- RPs are defined as peaks that belong to an isotopologue.

- mass range
  
  - retention time
  
  - intensity

`$$retention\ time\ correction\ and\ grouping\ target\ value  = norm(RCS) + norm(GS)$$`

- Retention time correction could also be optimized

---

# Wrap function

```r
library(xcms)
getrtmz <- function(path,index = NULL) {
  path <- list.files(path, full.names = T, recursive = T)
  if(!is.null(index)){path <- path[index]}
  xset <- xcmsSet(
    files = path,
  method = "centWave",peakwidth = c(9.9264, 91.7),ppm = 15, 
  noise = 0, snthresh = 10, mzdiff = 0.0020888, 
  prefilter = c(3, 100), mzCenterFun = "wMean", integrate = 1,
  fitgauss = FALSE,verbose.columns = FALSE) # peak extraction
  xset <- retcor(
    xset,
    method = "obiwarp", plottype = "none", distFunc = "cor_opt",
    profStep = 1, center = 1, response = 1, gapInit = 0.928,
    gapExtend = 2.7, factorDiag = 2, factorGap = 1,
    localAlignment = 0) # retention time correction
  xset <- group(
    xset,
    method  = "density", bw = 0.879999999999999, 
    mzwid   = 0.01932, minfrac = 1, minsamp = 1, max = 50) # peak grouping
  xset <- fillPeaks(xset) # peak filling
  return(xset)
}
```

---

# Peaks list

```r
# get the xcmsset object
pos <- getrtmz('D:/metademo/data/')
# back up the xcmsset object
save(pos,file = 'pos.Rdata')
load('pos.Rdata')
# get the EIC, boxplot and diffreport, eixmax should be equal to the numbers of peaks groups in the pos objects

report <- annotateDiffreport(pos,filebase = 'peaklistpos',metlin = T, eicmax = 3094, classeic = xset@phenoData$class)
# save the report as a csv file
write.csv(report,file = 'all.csv')
# get the csv file for Metaboanalyst.ca
enviGCMS::getupload(pos,name = 'metabo')
```

---

# Peaks filtering

```r
# get the peak intensity, m/z, retention time and group information as list
mzrt <- enviGCMS::getmzrt(pos)

# get the mean and rsd for each group
mzrtm <- enviGCMS::getdoe(mzrt)
gm <- mzrtm$groupmean
gr <- mzrtm$grouprsd

# find the blank group and pool QC group
blk <- grepl('blk',colnames(gm)))
pqc <- grepl('qc',colnames(gm))

# filter by pool QC and blank's group mean intensity(pool QC should larger than three times of blank), return numbers and index
sum(indexmean <- apply(gm,1,function(x) all(x[pqc]>= 3*x[blk])))

# filt by pool qc rsd%, return numbers and index
rsdcf <- 30
sum(indexrsd <- apply(gm,1,function(x) ifelse(is.na(x[pqc]),T,x[pqc]<rsdcf)))

# overlap with rsd% and mean filter
sum(index <- indexmean&indexrsd)
```

---

# Peaks filtering

```r
# new list, update group and remove pool qc/blk
qcindex <- grepl('blk',mzrt$group$class) | grepl('qc',mzrt$group$class)
mzrtfilter <- list(data = mzrt$data[index,!qcindex],
                   mz = mzrt$mz[index],
                   rt = mzrt$rt[index],
                   group = mzrt$group)
mzrtfilter$group$class <- mzrt$group$class[!qcindex]
```

- The average intensities in pool QC for each peak should larger than three tims of the average intensities in blank sample

- RSD% less than 30% in Pooled QC to remove batch effects

---

# Normalization

```r
# visulize the batch effect
mzrtsim::rlaplot(mzrt$data,lv = mzrt$group$class)
mzrtsim::ridgesplot(mzrt$data,lv = mzrt$group$class)
# get the simulation data and test on NOREVA
sim <- mzrtsim::simmzrt(mzrt$data)
mzrtsim::simdata(sim)
# correct the batch effect by sva
mzrtcor <- mzrtsim::svacor(mzrt$data,lv = mzrt$group$class)
# visulize the batch effect correction
li <- mzrtsim::limmaplot(mzrtcor,lv = mzrt$group$class)
# return the corrected data
mzrt$data <- mzrtcor$dataCorrected
```

---

# Statistical analysis

## Exploratory data analysis

```r
# visulize the data
enviGCMS::plotmr(mzrtfilter)
# PCA
enviGCMS::plotpca(mzrtfilter$data,
                  as.character(mzrtfilter$group$class))
```

- Find the confonding factors or inner correlationship among variables/samples

- Correlationship/Cluster/Similarity/Dimension reducing analysis

---
# Statistical analysis

## Linear mixed model

- Fixed effects: Treatment/Control

- Random effects: individual variances

- `$$y = Fixed\ effects + (random\ slope\ variable|random \ baseline\ variable)$$`

- [More](https://web.stanford.edu/class/psych252/section/Mixed_models_tutorial.html#getting-p-values)
---

# Statistical analysis

## Split the data

```r
library(caret)
## Spliting data
trainIndex <- createDataPartition(variable, p = .8, 
                                  list = FALSE, 
                                  times = 1)
## Get the training and testing datasets
Train <- data[ trainIndex,]
Test  <- data[-trainIndex,]
```

- Variables should be larger than sample numbers
- Train datasets are used to build the model
- Test datasets are used to evaluate the final model
- [More](http://topepo.github.io/caret/)

---
# Statistical analysis

## Tune the model

```r
fitControl <- trainControl(## 10-fold CV
                           method = "repeatedcv",
                           number = 10,
                           ## repeated ten times
                           repeats = 10)
```

- General parameters training control

- Cross validation

- Performance Metrics(RMSE or ROC)

---
# Statistical analysis

## Tune the specific model

```r
# extra papameters for GBM 
gbmGrid <-  expand.grid(interaction.depth = c(1, 5, 9), 
                        n.trees = (1:30)*50, 
                        shrinkage = 0.1,
                        n.minobsinnode = 20)
```

- Different models have different parameters

- Use `expand.grid` to add the tuning for them

---
# Statistical analysis

## Train the model

```r
set.seed(825)
gbmFit <- train(Class ~ ., data = training, 
                 method = "gbm", 
                 trControl = fitControl, 
                 verbose = FALSE, 
                 ## Now specify the exact models 
                 ## to evaluate:
                 tuneGrid = gbmGrid)
# show the fitting process
plot(gbmFit)  
```

- Fit the model based on the tuning parameters

- Show the fitting results

---
# Statistical analysis

## Model selection

```r
# ANOVA analysis
anova(fit1,fit2)
```

- Check which model show improvements of the variances explained

---
# Statistical analysis

## Variable importance

```r
Imp <- varImp(fit)
plot(Imp)
```

- Not all models have the variable impartance evaluation

- `varImp` could be used to evaluate variable importance if possible

---

# Annotation

```r
library(xMSannotator)
num_nodes = 10
data("adduct_weights")
annolipid <- xsetplus::fanno(pos,outloc = 'D:/storage/data/anno', mode = 'pos', db_name = 'hmdb')
```

---

# Pathway Analysis

```r
# get the file
xsetplus::mumdata(pos,lv = mzrt$group$class)
# http://mummichog.org/index.html
mummichog1 -f 'test.txt' -o myResult
```

- [More](http://mummichog.org/index.html)

---

# XCMS online

https://xcmsonline.scripps.edu/

---

# Metaboanalyst

http://www.metaboanalyst.ca/

---

# NOREVA

http://idrb.zju.edu.cn/noreva/

---

# Reproducible research

- Report software version

- Avoid GUI

- Report script

- Share raw data

<a href="data:text/x-markdown;base64,LS0tDQp0aXRsZTogIk1ldGEtV29ya2Zsb3ciDQphdXRob3I6ICJNaWFvIFl1Ig0KZGF0ZTogIkF1Z3VzdCAxNiwgMjAxNiINCm91dHB1dDoNCiAgaHRtbF9kb2N1bWVudDoNCiAgICBkZl9wcmludDogcGFnZWQNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSxjYWNoZSA9IFQsbWVzc2FnZT1ULHdhcm5pbmc9RikNCnNlc3Npb25JbmZvKCkNCmBgYA0KDQojIE9wdGltaXphdGlvbg0KDQpgYGB7ciBJUE9wb3MsZXZhbD1GQUxTRX0NCmxpYnJhcnkoSVBPKQ0KbGlicmFyeSh4Y21zKQ0KcGVha3BpY2tpbmdQYXJhbWV0ZXJzIDwtIGdldERlZmF1bHRYY21zU2V0U3RhcnRpbmdQYXJhbXMoJ2NlbnRXYXZlJykNCnBhdGggPC0gbGlzdC5maWxlcygnRDovbWV0YWRlbW8vZGF0YS9vcS8nLGZ1bGwubmFtZXMgPSBULHJlY3Vyc2l2ZSA9IFQpDQoNCnBlYWtwaWNraW5nUGFyYW1ldGVycyRwcG0gPC0gMTUNCnJlc3VsdFBlYWtwaWNraW5nIDwtIA0KICBvcHRpbWl6ZVhjbXNTZXQoZmlsZXMgPSBwYXRoW2MoMSwyLDMpXSwgDQogICAgICAgICAgICAgICAgICBwYXJhbXMgPSBwZWFrcGlja2luZ1BhcmFtZXRlcnMsDQogICAgICAgICAgICAgICAgICBuU2xhdmVzID0gMSwNCiAgICAgICAgICAgICAgICAgIHN1YmRpciA9IE5VTEwpDQoNCm9wdGltaXplZFhjbXNTZXRPYmplY3QgPC0gcmVzdWx0UGVha3BpY2tpbmckYmVzdF9zZXR0aW5ncyR4c2V0DQpyZXRjb3JHcm91cFBhcmFtZXRlcnMgPC0gZ2V0RGVmYXVsdFJldEdyb3VwU3RhcnRpbmdQYXJhbXMoKQ0KcmVzdWx0UmV0Y29yR3JvdXAgPC0NCiAgb3B0aW1pemVSZXRHcm91cCh4c2V0ID0gb3B0aW1pemVkWGNtc1NldE9iamVjdCwgDQogICAgICAgICAgICAgICAgICAgcGFyYW1zID0gcmV0Y29yR3JvdXBQYXJhbWV0ZXJzLCANCiAgICAgICAgICAgICAgICAgICBzdWJkaXIgPSBOVUxMKQ0Kd3JpdGVSU2NyaXB0KHJlc3VsdFBlYWtwaWNraW5nJGJlc3Rfc2V0dGluZ3MkcGFyYW1ldGVycywgDQogICAgICAgICAgICAgcmVzdWx0UmV0Y29yR3JvdXAkYmVzdF9zZXR0aW5ncykNCnBhcmEgPC0gY2FwdHVyZS5vdXRwdXQod3JpdGVSU2NyaXB0KHJlc3VsdFBlYWtwaWNraW5nJGJlc3Rfc2V0dGluZ3MkcGFyYW1ldGVycywgcmVzdWx0UmV0Y29yR3JvdXAkYmVzdF9zZXR0aW5ncyksIHR5cGUgPSAibWVzc2FnZSIpDQpzYXZlKHBhcmEsZmlsZSA9ICdwYXJhLlJEYXRhJykNCnNlc3Npb25JbmZvKCkNCmBgYA0KDQojIFdyYXAgZnVuY3Rpb24NCg0KYGBge3IgZXZhbD1UfQ0KbGlicmFyeSh4Y21zKQ0KbGlicmFyeShSbXBpKQ0KbGlicmFyeShzdHJpbmdyKQ0KZ2V0cnRteiA8LSBmdW5jdGlvbihwYXRoLGluZGV4ID0gTlVMTCl7DQogIGxvYWQoJ3BhcmEuUkRhdGEnKQ0KcGVha3dpZHRoIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdwZWFrd2lkdGgnLHBhcmEpXSwnXFxkK1xcLipcXGQqJykpKQ0KcHBtIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdwcG0nLHBhcmEpXSwnXFxkKycpKSkNCm5vaXNlIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdub2lzZScscGFyYSldLCdcXGQrJykpKQ0Kc250aHJlc2ggPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ3NudGhyZXNoJyxwYXJhKV0sJ1xcZCsnKSkpDQptemRpZmYgPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ216ZGlmZicscGFyYSldLCdcXGQrXFwuKlxcZConKSkpDQpwcmVmaWx0ZXIgPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ3ByZWZpbHRlcicscGFyYSldLCdcXGQrXFwuKlxcZConKSkpDQppbnRlZ3JhdGUgPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ2ludGVncmF0ZScscGFyYSldLCdcXGQrJykpKQ0KcHJvZlN0ZXAgPC0gcm91bmQoYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ3Byb2ZTdGVwJyxwYXJhKV0sJ1xcZCtcXC4qXFxkKicpKSksMSkNCmNlbnRlciA8LSBhcy5udW1lcmljKHVubGlzdChzdHJfZXh0cmFjdF9hbGwocGFyYVtncmVwbCgnY2VudGVyJyxwYXJhKV0sJ1xcZCsnKSkpDQpyZXNwb25zZSA8LSBhcy5udW1lcmljKHVubGlzdChzdHJfZXh0cmFjdF9hbGwocGFyYVtncmVwbCgncmVzcG9uc2UnLHBhcmEpXSwnXFxkKycpKSkNCmdhcEluaXQgPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ2dhcEluaXQnLHBhcmEpXSwnXFxkK1xcLipcXGQqJykpKQ0KZ2FwRXh0ZW5kIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdnYXBFeHRlbmQnLHBhcmEpXSwnXFxkK1xcLipcXGQqJykpKQ0KZmFjdG9yRGlhZyA8LSBhcy5udW1lcmljKHVubGlzdChzdHJfZXh0cmFjdF9hbGwocGFyYVtncmVwbCgnZmFjdG9yRGlhZycscGFyYSldLCdcXGQrJykpKQ0KZmFjdG9yR2FwIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdmYWN0b3JHYXAnLHBhcmEpXSwnXFxkKycpKSkNCmxvY2FsQWxpZ25tZW50IDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdsb2NhbEFsaWdubWVudCcscGFyYSldLCdcXGQrJykpKQ0KYncgPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ2J3JyxwYXJhKV0sJ1xcZCtcXC4qXFxkKicpKSkNCm16d2lkIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdtendpZCcscGFyYSldLCdcXGQrXFwuKlxcZConKSkpDQptaW5mcmFjIDwtIGFzLm51bWVyaWModW5saXN0KHN0cl9leHRyYWN0X2FsbChwYXJhW2dyZXBsKCdtaW5mcmFjJyxwYXJhKV0sJ1xcZCtcXC4qXFxkKicpKSkNCm1pbnNhbXAgPC0gYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ21pbnNhbXAnLHBhcmEpXSwnXFxkKycpKSkNCm1heCA8LSAgYXMubnVtZXJpYyh1bmxpc3Qoc3RyX2V4dHJhY3RfYWxsKHBhcmFbZ3JlcGwoJ21heCcscGFyYSldLCdcXGQrJykpKQ0KICBmaWxlcyA8LSBsaXN0LmZpbGVzKHBhdGgsZnVsbC5uYW1lcyA9IFQscmVjdXJzaXZlID0gVCkNCiAgaWYoIWlzLm51bGwoaW5kZXgpKXsNCiAgICBmaWxlcyA8LSBmaWxlc1tpbmRleF0NCiAgfQ0KICB4c2V0IDwtIHhjbXNTZXQoZmlsZXMsDQogIG1ldGhvZCA9ICJjZW50V2F2ZSIsDQogIHBlYWt3aWR0aCAgICAgICA9IHBlYWt3aWR0aCwNCiAgcHBtICAgICAgICAgICAgID0gcHBtLA0KICBub2lzZSAgICAgICAgICAgPSBub2lzZSwNCiAgc250aHJlc2ggICAgICAgID0gc250aHJlc2gsDQogIG16ZGlmZiAgICAgICAgICA9IG16ZGlmZiwNCiAgcHJlZmlsdGVyICAgICAgID0gcHJlZmlsdGVyLA0KICBtekNlbnRlckZ1biAgICAgPSAid01lYW4iLA0KICBpbnRlZ3JhdGUgICAgICAgPSBpbnRlZ3JhdGUsDQogIGZpdGdhdXNzICAgICAgICA9IEZBTFNFLA0KICB2ZXJib3NlLmNvbHVtbnMgPSBGQUxTRSkNCnhzZXQgPC0gcmV0Y29yKCANCiAgeHNldCwNCiAgbWV0aG9kICAgICAgICAgPSAib2Jpd2FycCIsDQogIHBsb3R0eXBlICAgICAgID0gIm5vbmUiLA0KICBkaXN0RnVuYyAgICAgICA9ICJjb3Jfb3B0IiwNCiAgcHJvZlN0ZXAgICAgICAgPSBwcm9mU3RlcCwNCiAgY2VudGVyICAgICAgICAgPSBjZW50ZXIsDQogIHJlc3BvbnNlICAgICAgID0gcmVzcG9uc2UsDQogIGdhcEluaXQgICAgICAgID0gZ2FwSW5pdCwNCiAgZ2FwRXh0ZW5kICAgICAgPSBnYXBFeHRlbmQsDQogIGZhY3RvckRpYWcgICAgID0gZmFjdG9yRGlhZywNCiAgZmFjdG9yR2FwICAgICAgPSBmYWN0b3JHYXAsDQogIGxvY2FsQWxpZ25tZW50ID0gbG9jYWxBbGlnbm1lbnQpDQp4c2V0IDwtIGdyb3VwKCANCiAgeHNldCwNCiAgbWV0aG9kICA9ICJkZW5zaXR5IiwNCiAgYncgICAgICA9IGJ3LA0KICBtendpZCAgID0gbXp3aWQsDQogIG1pbmZyYWMgPSBtaW5mcmFjLA0KICBtaW5zYW1wID0gbWluc2FtcCwNCiAgbWF4ICAgICA9IG1heCkNCg0KeHNldCA8LSBmaWxsUGVha3MoeHNldCkNCnJldHVybih4c2V0KQ0KfQ0KYGBgDQoNCiMgUGVha3MgbGlzdA0KDQpgYGB7ciBldmFsPUZ9DQojIGdldCB0aGUgeGNtc3NldCBvYmplY3QNCm5lZyA8LSBnZXRydG16KCdEOi9tZXRhZGVtby9kYXRhLycpDQojIGJhY2sgdXAgdGhlIHhjbXNzZXQgb2JqZWN0DQpzYXZlKG5lZyxmaWxlID0gJ25lZy5SZGF0YScpDQojIGdldCB0aGUgbnVtYmVyDQpucGVha3MgPC0gbnJvdyhuZWdAZ3JvdXBzKQ0KIyBnZXQgdGhlIEVJQywgYm94cGxvdCBhbmQgZGlmZnJlcG9ydCwgZWl4bWF4IHNob3VsZCBiZSBlcXVhbCB0byB0aGUgbnVtYmVycyBvZiBwZWFrcyBncm91cHMgaW4gdGhlIHBvcyBvYmplY3RzIA0KcmVwb3J0IDwtIENBTUVSQTo6YW5ub3RhdGVEaWZmcmVwb3J0KG5lZyxmaWxlYmFzZSA9ICdwZWFrbGlzdG5lZycsbWV0bGluID0gVCwgZWljbWF4ID0gbnBlYWtzLCBjbGFzc2VpYyA9IG5lZ0BwaGVub0RhdGEkY2xhc3MpDQojIHNhdmUgdGhlIHJlcG9ydCBhcyBhIGNzdiBmaWxlDQp3cml0ZS5jc3YocmVwb3J0LGZpbGUgPSAnYWxsLmNzdicpDQojIGdldCB0aGUgY3N2IGZpbGUgZm9yIE1ldGFib2FuYWx5c3QuY2ENCmVudmlHQ01TOjpnZXR1cGxvYWQobmVnLG5hbWUgPSAnbWV0YWJvJykNCmBgYA0KDQojIFBlYWtzIGZpbHRlcmluZw0KDQpgYGB7cn0NCmxvYWQoJ25lZy5SZGF0YScpDQojIGdldCB0aGUgcGVhayBpbnRlbnNpdHksIG0veiwgcmV0ZW50aW9uIHRpbWUgYW5kIGdyb3VwIGluZm9ybWF0aW9uIGFzIGxpc3QNCm16cnQgPC0gZW52aUdDTVM6OmdldG16cnQobmVnKQ0KIyBnZXQgdGhlIG1lYW4gYW5kIHJzZCBmb3IgZWFjaCBncm91cA0KbXpydG0gPC0gZW52aUdDTVM6OmdldGRvZShtenJ0KQ0KZ20gPC0gbXpydG0kZ3JvdXBtZWFuDQpnciA8LSBtenJ0bSRncm91cHJzZA0KIyBmaW5kIHRoZSBibGFuayBncm91cCBhbmQgcG9vbCBRQyBncm91cA0KYmxrIDwtIGdyZXBsKCdrJyxjb2xuYW1lcyhnbSkpDQpwcWMgPC0gZ3JlcGwoJ3EnLGNvbG5hbWVzKGdtKSkNCiMgZmlsdGVyIGJ5IHBvb2wgUUMgYW5kIGJsYW5rJ3MgZ3JvdXAgbWVhbiBpbnRlbnNpdHkocG9vbCBRQyBzaG91bGQgbGFyZ2VyIHRoYW4gdGhyZWUgdGltZXMgb2YgYmxhbmspLCByZXR1cm4gbnVtYmVycyBhbmQgaW5kZXgNCnN1bShpbmRleG1lYW4gPC0gYXBwbHkoZ20sMSxmdW5jdGlvbih4KSBhbGwoeFtwcWNdPj0gMyp4W2Jsa10pKSkNCiMgZmlsdCBieSBwb29sIHFjIHJzZCUsIHJldHVybiBudW1iZXJzIGFuZCBpbmRleA0KcnNkY2YgPC0gMzANCnN1bShpbmRleHJzZCA8LSBhcHBseShnciwxLGZ1bmN0aW9uKHgpIGlmZWxzZShpcy5uYSh4W3BxY10pLFQseFtwcWNdPHJzZGNmKSkpDQojIG92ZXJsYXAgd2l0aCByc2QlIGFuZCBtZWFuIGZpbHRlcg0Kc3VtKGluZGV4IDwtIGluZGV4bWVhbiZpbmRleHJzZCkNCg0KIyBuZXcgbGlzdCwgdXBkYXRlIGdyb3VwIGFuZCByZW1vdmUgcG9vbCBxYy9ibGsNCnFjaW5kZXggPC0gZ3JlcGwoJ2snLG16cnQkZ3JvdXAkY2xhc3MpIHwgZ3JlcGwoJ3EnLG16cnQkZ3JvdXAkY2xhc3MpDQptenJ0ZmlsdGVyIDwtIGxpc3QoZGF0YSA9IG16cnQkZGF0YVtpbmRleCwhcWNpbmRleF0sDQogICAgICAgICAgICAgICAgICAgbXogPSBtenJ0JG16W2luZGV4XSwNCiAgICAgICAgICAgICAgICAgICBydCA9IG16cnQkcnRbaW5kZXhdLA0KICAgICAgICAgICAgICAgICAgIGdyb3VwID0gZHJvcGxldmVscyhtenJ0JGdyb3VwJGNsYXNzWyFxY2luZGV4LGRyb3AgPVRdKSkNCiMgZ2V0IHRoZSBmaWx0ZXJlZCBjc3YNCmVudmlHQ01TOjpnZXR1cGxvYWQobXpydGZpbHRlcixuYW1lID0gJ3BlYWtmaWx0ZXInKQ0KDQpgYGANCg0KIyBOb3JtYWxpemF0aW9uIChPcHRpb25hbCkNCg0KYGBge3J9DQojIHZpc3VsaXplIHRoZSBiYXRjaCBlZmZlY3QNCm16cnRzaW06OnJsYXBsb3QobXpydCRkYXRhLGx2ID0gbXpydCRncm91cCRjbGFzcykNCm16cnRzaW06OnJpZGdlc3Bsb3QobXpydCRkYXRhLGx2ID0gbXpydCRncm91cCRjbGFzcykNCiMgZ2V0IHRoZSBzaW11bGF0aW9uIGRhdGEgYW5kIHRlc3Qgb24gTk9SRVZBDQpzaW0gPC0gbXpydHNpbTo6c2ltbXpydChtenJ0JGRhdGEpDQptenJ0c2ltOjpzaW1kYXRhKHNpbSkNCiMgY29ycmVjdCB0aGUgYmF0Y2ggZWZmZWN0IGJ5IHN2YQ0KbXpydGNvciA8LSBtenJ0c2ltOjpzdmFjb3IobXpydCRkYXRhLGx2ID0gbXpydCRncm91cCRjbGFzcykNCiMgdmlzdWxpemUgdGhlIGJhdGNoIGVmZmVjdCBjb3JyZWN0aW9uDQpsaSA8LSBtenJ0c2ltOjpsaW1tYXBsb3QobXpydGNvcixsdiA9IG16cnQkZ3JvdXAkY2xhc3MpDQojIHJldHVybiB0aGUgY29ycmVjdGVkIGRhdGENCm16cnQkZGF0YSA8LSBtenJ0Y29yJGRhdGFDb3JyZWN0ZWQNCmBgYA0KDQojIFN0YXRpc3RpY2FsIGFuYWx5c2lzDQoNCmBgYHtyfQ0KIyB2aXN1bGl6ZSB0aGUgZGF0YQ0KZW52aUdDTVM6OnBsb3RtcihtenJ0ZmlsdGVyLGluc2NmID0gNCxyc2RjZiA9IDUwKQ0KIyBQQ0ENCiNlbnZpR0NNUzo6cGxvdHBjYShtenJ0ZmlsdGVyJGRhdGEsDQojICAgICAgICAgICAgICAgICAgYXMuY2hhcmFjdGVyKG16cnRmaWx0ZXIkZ3JvdXApKQ0KZW52aUdDTVM6OnBsb3RwY2EobXpydGZpbHRlciRkYXRhLGMoJ2InLCdiJywnYicsJ00nLCdNJywnTScsJ0gnLCdIJywnSCcsJ0wnLCdMJywnTCcpKQ0KYGBgDQoNCiMgQW5ub3RhdGlvbg0KDQpgYGB7ciBldmFsPUZBTFNFfQ0KbGlicmFyeSh4TVNhbm5vdGF0b3IpDQpudW1fbm9kZXMgPSAxMA0KZGF0YSgiYWRkdWN0X3dlaWdodHMiKQ0KbmVnc3ViIDwtIGdldHJ0bXooJ0Q6L21ldGFkZW1vL2RhdGEvb3EvJykNCmFubm8gPC0geHNldHBsdXM6OmZhbm5vKG5lZ3N1YixvdXRsb2MgPSAnRDovbWV0YWRlbW8vYW5ubycsbW9kZSA9ICduZWcnKQ0KIyBhbm5vbGlwaWQgPC0geHNldHBsdXM6OmZhbm5vKG5lZyxvdXRsb2MgPSAnRDovc3RvcmFnZS9kYXRhL2Fubm8nLA0KIyAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGRiX25hbWUgPSAnTGlwaWRNYXBzJykNCmBgYA0KDQojIFBhdGh3YXkgQW5hbHlzaXMNCg0KYGBge3IgcGF0aHdheX0NCiMgZ2V0IHRoZSBmaWxlDQp4c2V0cGx1czo6bXVtZGF0YShuZWcsbHYgPSBtenJ0JGdyb3VwJGNsYXNzKQ0KIyBodHRwOi8vbXVtbWljaG9nLm9yZy9pbmRleC5odG1sDQojIG11bW1pY2hvZzEgLWYgJ3Rlc3QudHh0JyAtbyBteVJlc3VsdA0KYGBgDQoNCiMgUE1EIGFuYWx5c2lzDQoNCmBgYHtyIHBtZH0NCmxvYWQoJ25lZy5SZGF0YScpDQplbnZpR0NNUzo6Z2V0bXpydChuZWcsbmFtZSA9ICdwbWQnKQ0Kb3B0aW9ucyhzaGlueS5tYXhSZXF1ZXN0U2l6ZSA9IDEwMCoxMDI0XjIpDQpwbWQ6OnJ1blBNRCgpDQpgYGANCg0K" download="workflow.Rmd">Download workflow.Rmd</a>

---

# Q&A

## yufreecas@gmail.com

## https://yufree.cn/metaworkflow/