Data dapat diperoleh dari sumber manapun, baik yang bersifat terstruktur maupun yang tidak terstruktur. Namun, data yang diperoleh tersebut tidak selalu memenuhi kebutuhan, maka perlu dilakukan eksplorasi lebih lanjut untuk bisa mendapatkan data yang diharapkan. Beberapa teknik yang dilakukan diantaranya adalah scraping dan crawling, yaitu mengeksplorasi data yang terdapat di media sosial atau website. Selain itu, eksplorasi data juga dapat dilakukan dengan proses query untuk mendapatkan data dari data warehouse atau storage. Proses eksplorasi data ini dapat disebut juga dengan penambangan data (data mining). Package R untuk data science adalah:

  1. Machine learning

1.1 Library Caret

1.2 Library mlr

1.3 Library Random Forest

1.4 Library vcd

1.5 Library glmnet

  1. Data visualization

2.1 Library ggvis

2.2 Library ggplot2

2.3 Library widget html

2.4 Library rgl

  1. Data manipulation

3.1 Library data table

3.2 Library readr

3.3 Library Tidyr

3.4 Library Lubridate

3.5 Library stringr.