Kemunculan big data menjadikan kebutuhan sumber daya untuk menganalisis data tersebut semakin meningkat. Tak heran jika permintaan akan pekerjaan data scientist juga mengalami lonjakan tinggi. Menurut Thomas Davenport dan DJ Patil dalam Harvard Business Reviewdata scientist menjadi salah satu karir terpanas bidang teknologi di abad 21 ini.

Data scientist adalah seorang profesional yang bertugas menangani big data, mengumpulkan, dan menganalisis kumpulan data besar, baik data terstruktur maupun tidak terstruktur. Pekerjaan data scientist menggabungkan ilmu komputer, statistik, dan matematika. Sebagai data scientist, kamu adalah pakar analitik yang memiliki keterampilan teknologi dan ilmu sosial untuk menemukan tren sekaligus mengelola data. Kamu juga menggunakan pemahaman kontekstual dan pengetahuan industri guna memberikan solusi atas tantangan bisnis. Tugas data scientist biasanya berkaitan dengan memahami data yang berantakan dan tidak terstruktur dari berbagai sumber, seperti smartphonefeedback media sosial, dan e-mail yang belum memiliki database.

Bootcamp data science layak untuk dicoba jika menginginkan pengalaman langsung dalam pembuatan project data science. Startup Campus Data Science Track adalah Bootcamp Studi Independen Bersertifikat Data Science yang berkerja sama dengan Kemendikbud. Startup Campus Batch 4 akan dilaksanakan dari bulan Februari hingga Juni 2023. Pembelajaran dilaksanakan secara asinkronus dan sinkronus. Pembelajaran asinkronus dilaksanakan melalui pembelajaran secara mandiri melalui video pembelajaran dan referensi belajar lainnya. Sementara itu, pembelajaran sinkronus dilaksanakan melalui live session yang difasilitasi expert speaker. Di akhir program, peserta akan menjalankan final project dan showcase. Selama program, masing-masing tim akan didampingi oleh mentor profesional yang akan mengadakan mentoring selama 10-15 jam per minggu.

Modul yang akan dipelajari mencakup: Introduction Data Science and Getting Data Ready: Pengenalan data science, pengenalan teori yang ada pada data science, kaidah dasar pada data science, pengenalan pentingnya data science di industri, definisi data discovery, jenis pendekatan data discovery, urgensi mempelajari data discovery. Data Storytelling: Pengenalan SQL, pelatihan menggunakan SQL (dasar), definisi dan hal umum mengenai visualisasi data, bentuk-bentuk visualisasi data, cara menyusun/membentuk visualisasi data, urgensi mempelajari visualisasi data. Reproducible Research (Insights-as-a-Code): Pengenalan Python, pelatihan menggunakan Python (dasar), definisi dan tujuan transforming data, cara melakukan transforming data, definisi dan tujuan merging data, cara melakukan merging data. Understanding Data: Jenis-jenis data, mean, median dan modus, variasi dan standar deviasi, distribusi data, kovarian dan korelasi, A/B Test Statistical Analysis vs Pre-Post Observational Study. Machine Learning Techniques: Intro to Causal Inference (e.g. Diff-in-Diff, etc), Konsep Machine Learning (e.g. Train/Test), Performance (Naive Bayes), Regression (Linear, Logistic), Classification (Entropy, Decision Tree, Random Forest), Gradient Boosting (xgboost dkk), Unsupervised Learning (Clustering, k-NN, Hierarchical, etc), Popular Frameworks (scikit-learn, tensorflow, keras), Hyperparameter tuning (etc additional practical stuff to sharpen the saw).  Final Project & Showcase: Collaboration with other tracks — analyze and find insights the results based on the case. Design experimentation to evaluate the model on various hypotheses with real data to predict churn probability of the datasets.

Benefit yang akan didapatkan peserta dari program ini adalah: • Kurikulum dan silabus pembelajaran dari praktisi di bidang Data Science; • Jejaring ke dalam ekosistem Data Science; • Mentorship intensif dengani praktisi di bidang Data Science; • Kesempatan pitching langsung kepada investor; • Sertifikat Kompetensi Data Science; • Buku dan referensi belajar Data Science.