Sains data adalah satu bidang pengajian multidisiplin yang melibatkan kaedah saintifik, proses dan sistem dalam mengekstrak maklumat tersurat dan tersirat dalam pelbagai struktur data. Ia menggabungkan pengetahuan matematik dan statistik, pengaturcaraan dan analitik data. Program Sarjana Sains (Sains Data Analitik) menawarkan pelbagai kursus dalam bidang ini dengan penekanan kepada analitik data. Tiga modul pembelajaran ditawarkan: Pengkomputeran Data, Analitik Data serta Kewangan & Analitik Perniagaan. Matlamat program Sains Data dan Analitik adalah untuk melahirkan siswazah berilmu, beretika, berdaya saing, terkehadapan dan memberi sumbangan kepada bangsa dan negara.
Kerja kursus & Sepenuh masa
Minimum 3 semester (1½ tahun)
Maksimum 4 semester (2 tahun)
Kemasukan – setiap bulan Oktober
*tertakluk kepada kalendar akademik UKM
Bahasa Inggeris
MODUL PENGKOMPUTERAN DATA
Semester | Kursus Wajib | Kursus Pilihan |
I | STQD6014 Sains Data STQD6214 Matematik Statistik dengan Pengkomputeran STQD6414 Perlombongan Data | Pilih empat:
STQD6124 Pengvisualan dan Komunikasi Data STQD6324 Pengurusan Data STQD6114 Analitik Data Tak Berstruktur STQS6444 Pemodelan Siri Masa & Peramalan STQM6154 Sains Rangkaian STQD6334 Pembuatan Keputusan Multi-Kriterium STQD6524 Kaedah Statistik untuk Pengkomputeran Biologi |
II | STQD6024 Pembelajaran Mesin STQP6014 Kaedah Penyelidikan dan Seminar Industri | |
III | STQD6889 Projek Mercu | |
Jumlah Kredit | 29 | 16 |
MODUL ANALITIK DATA
Semester | Kursus Wajib | Kursus Pilihan |
I | STQD6014 Sains Data STQD6214 Matematik Statistik dengan Pengkomputeran STQD6414 Perlombongan Data | Pilih empat:
STQD6124 Pengvisualan dan Komunikasi Data STQS6284 Analisis Multivariat STQD6114 Analitik Data Tak Berstruktur STQD6134 Analitik Perniagaan STQS6444 Pemodelan Siri Masa & Peramalan STQS6234 Pentaabiran Bayesan STQM6154 Sains Rangkaian STQD6334 Pembuatan Keputusan Multi-Kriterium STQD6524 Kaedah Statistik untuk Pengkomputeran Biologi |
II | STQD6024 Pembelajaran Mesin STQP6014 Kaedah Penyelidikan dan Seminar Industri | |
III | STQD6889 Projek Mercu | |
Jumlah Kredit | 29 | 16 |
MODUL KEWANGAN DAN ANALITIK PERNIAGAAN
Semester | Kursus Wajib | Kursus Pilihan |
I | STQD6014 Sains Data STQD6214 Matematik Statistik dengan Pengkomputeran STQD6414 Perlombongan Data | Pilih empat:
STQD6114 Pengvisualan dan Komunikasi Data STQD6134 Analitik Perniagaan STQD6114 Analitik Data Tak Berstruktur STQS6444 Pemodelan Siri Masa & Peramalan STQD6334 Pembuatan Keputusan Multi-Kriterium STQA6014 Analisis Pelaburan dan Pengurusan Portfolio STQA6034 Isu-isu dalam Pengurusan Risiko dan Insurans |
II | STQD6024 Pembelajaran Mesin STQP6014 Kaedah Penyelidikan dan Seminar Industri | |
III | STQD6889 Projek Mercu | |
Jumlah Kredit | 29 | 16 |
STQA6014 Analisis Pelaburan dan Pengurusan Portfolio
Kursus ini memfokus kepada proses membuat keputusan pelaburan. Ia mendalami aplikasi pelbagai instrumen pelaburan dan peranannya dalam pengurusan risiko. Konsep risiko dan pulangan dihuraikan secara terperinci dan menyeluruh. Pempelbagaian cekap dibincang dengan fokus ke atas penjanaan portfolio cekap. Pelbagai bentuk instrumen berbeza dinilai dan diberi kewajaran. Kaedah penilaian saham dan teori portfolio seperti teori Markowitz, Model Indeks Tunggal, Model Perletakan Harga Aset Modal akan dibincang. Analisis fundamental dan teknikal turut dihuraikan. Teori gelagat kewangan merangkumi Hipotesis Pasaran Cekap turut dibincang. Pelajar akan terlibat dalam aktiviti pembelajaran termasuk perbincangan artikel jurnal dan pelaksanaan projek.
STQA6034 Isu-isu dalam Pengurusan Risiko dan Insurans
Kursus ini mempunyai dua objektif utama, iaitu untuk memberi pelajar perspektif yang luas tentang pengurusan risiko yang menekankan pengurusan risiko tradisional dan insurans di samping memperkenalkan jenis-jenis pengurusan risiko yang lain; dan untuk melengkapkan pelajar dengan kaedah yang diperlukan untuk analisis model matematik yang menerangkan proses kerugian. Topik-topik utama yang akan dibincangkan adalah pengurusan risiko (objektif, pengukuran, kepelbagaian dan bendungan), lindung nilai, pengurusan risiko korporat, pengurusan risiko organisasi, kaedah penganggaran (untuk data lengkap dan tidak lengkap) dan pemilihan model. Pelajar juga dilatih untuk menggunakan perisian R dan Excel untuk analisis matematik yang berkaitan. Pada akhir semester, pelajar dikehendaki membuat persembahan berdasarkan satu artikel dari jurnal supaya mereka dapat menghargai kesesuaian konsep dan metodologi yang diliputi dalam kursus ini.
STQD6014 Sains Data
Kursus ini bertujuan untuk mendedahkan prinsip asas sains data dan pengaturcaraan Python kepada para pelajar. Konsep dan jenis-jenis data yang berkaitan dengannya turut diperkenalkan kepada para pelajar. Kursus ini juga merangkumi al-Khwarizmi, proses, kaedah dan analisis yang digunakan dalam bidang sains data dengan contoh dan perbincangan menggunakan Python. Topik-topik lain yang dibincangkan termasuklah teknologi data yang terkini untuk penyimpanan dan pengarkiban data.
STQD6024 Pembelajaran Mesin
Kursus ini bertujuan memberi pendedahan awal kepada pelajar tentang konsep, teknik dan al-Khwarizmi dalam pembelajaran mesin. Pembelajaran mesin adalah berkisar tentang pembinaan sistem komputer yang mampu untuk belajar sendiri dan menambah baik pencapaiannya melalui pengalaman yang dikumpul daripada data yang dicerap. Kursus ini memberikan teknologi utama dalam Data Raya dan aplikasinya dalam pelbagai bidang. Antara topik yang akan dipelajari adalah rangkaian neural, pokok keputusan dan mesin vektor sokongan. Topik terkini dalam pembelajaran mesin turut dibincangkan seperti pembelajaran sedondon dan tidak terselia serta pembelajaran berevolusi dan pengukuhan.
STQD6114 Analitik Data Tak Berstruktur
Kursus ini bertujuan untuk memperkenalkan kepada pelajar kaedah-kaedah asas dan terkini untuk menyusun, merumus dan menganalisis data tak berstruktur dan sedikit berstruktur. Data tak berstruktur termasuklah data teks, data imej dan data audio. Fokus adalah kepada algoritma dan teknik melombong, menjelajah dan menganalisis data tak berstruktur dengan menggunakan perisian-perisian yang berkaitan. Pelajar turut didedahkan kepada sumber-sumber data tak berstruktur. Aplikasi yang berkenaan data tak berstruktur seperti analisis sentimen, pengelasan dokumen dan pengekstrakan maklumat turut dibincangkan.
STQD6124 Pengvisualan dan Komunikasi Data
Kursus ini memperkenalkan pelajar kepada prinsip asas pengvisualan data dan komunikasi dengan data. Pelajar didedahkan kepada prinsip-prinsip rekabentuk pengvisualan, persepsi manusia, teori warna dan penceritaan berkesan bagi pengvisualan data. Kemahiran menyampaikan maklumat dengan jelas dan berkesan melalui statistik bergraf, plot, grafik bermaklumat, jadual, dan carta yang bersesuaian turut dipelajari. Seterusnya, pelajar dilatih menggunakan beberapa perisian pengvisualan seperti pengaturcaraan R, ggplot, MatplotLib, D3 dan alat-alat pengvisualan lain. Beberapa teknik grafik khusus akan diperkenalkan seperti pengvisualan multivariat, siri masa, reruang, teks, data berhirarki, dan data berasaskan rangkaian/graf.
STQD6134 Analitik Perniagaan
Kursus ini bertujuan memberi pendedahan kepada teknik dan perkakasan dalam menterjemahkan data mentah kepada maklumat yang berguna dan bermakna untuk tujuan analisis perniagaan. Kursus ini dibahagikan kepada analitik pelanggan, operasi dan perniagaan. Analitik pelanggan memfokuskan kepada bagaimana data digunakan untuk menggambarkan, menjelaskan dan meramal kelakuan pelanggan. Manakala analitik operasi pula memfokuskan kepada bagaimana data dapat digunakan untuk memadankan pengeluaran dan permintaan agar keuntungan diperoleh dalam pelbagai senario perniagaan. Ini turut meliputi pemodelan ketakpastian permintaan pada masa hadapan, peramalan akibat dari persaingan polisi dan pembuatan keputusan/tindakan terbaik ketika berhadapan dengan risiko. Analitik manusia merupakan pendekatan berasaskan data dalam pengurusan sumber manusia di tempat kerja.
STQD6214 Matematik Statistik dengan Pengkomputeran
Kursus ini bertujuan mendedahkan asas dalam matematik statistik termasuk perihalan statistik, paparan grafik, taburan pensampelan, ujian hipotesis dan kaedah lain dalam analisis data. Kursus ini mengetengahkan peranan R dalam masalah penghitungan berstatistik. Konsep asas simulasi turut dibincangkan dengan contoh. Pelajar akan mempelajari cara untuk menjana data, menganalisis data menggunakan kaedah statistik dan mentafsirkan keputusan yang diperoleh.
STQD6324 Pengurusan Data
Kursus ini bertujuan untuk menyediakan asas dan teknologi terkini yang digunakan dalam pengurusan data dan penyelesaian data raya. Pelajar akan diperkenalkan kepada model data, pangkalan data, pertanyaan dan pemprosesan data raya. Ia meliputi keselamatan data, pusat data dan pembangunan penyelesaian data raya seperti ekosistem Hadoop, termasuk MapReduce dan HDFS. Apache Spark juga akan diperkenalkan, termasuk seni bina Spark, pengagihan data dan pemprosesan selari tugas. Pelajar akan mempunyai pemahaman yang lebih baik tentang bagaimana untuk mengoptimumkan maklumat dalam data raya menggunakan ingatan para serta operasi lanjutan dalam Spark.
STQD6334 Pembuatan Keputusan Multi-Kriterium
Kursus ini bertujuan memperkenalkan pelajar kepada konsep dan teknik menyelesaikan masalah dalam Pembuatan Keputusan Multi-Kriterium. Kaedah-kaedah yang digunakan untuk menyelesaikan masalah bergantung kepada jenis masalah tersebut. Topik yang akan dipelajari oleh pelajar adalah pembuatan keputusan tanpa kebarangkalian, pembuatan keputusan dengan kebarangkalian, pembuatan keputusan dengan maklumat sampel, pembuatan keputusan di bawah ketidakpastian, Proses Hierarki Analitik, TOPSIS, VIKOR, PROMETHEE dan ELECTRE.
STQD6414 Perlombongan Data
Kursus ini menerangkan dengan terperinci, proses penerokaan pengetahuan dalam pangkalan data (KDD) dan perlombongan data. Kursus ini membincangkan proses penyediaan data yang merangkumi pembersihan data, penyepaduan, penjelmaan, pengurangan dan pendiskretan. Kursus ini meliputi proses perlombongan data yang lazim ke atas pelbagai jenis strim data, jujukan, siri masa, teks, ruang dan data sesawang.
STQD6524 Kaedah Statistik untuk Pengkomputeran Biologi
Kursus ini bertujuan memberi pendedahan kepada kaedah-kaedah statistik dan penghitungan dalam biologi dan bioinformatik. Penekanan diberikan terhadap pemahaman konsep asas statistik dan pentaabiran statistik serta kegunaaannya dalam menyelesaikan masalah biologi. Kursus ini meliputi topik pengenalan kepada data genetik, data pengekspresan gen, data jujukan DNA, Protein dan RNA, analisis jujukan, analisis filogenetik, analisis pengekspresan gen dan analisis data mikro tatasusunan. Kaedah-kaedah statistik meliputi kaedah pentaabiran statistik, pengujian hipotesis, multivariat, pemodelan statistik, reka bentuk uji kaji, teknik statistik teguh, Bayesan dan Rantaian Markov Monte Carlo.
STQD6889 Projek Mercu
Projek mercu menyediakan peluang pembelajaran pengalaman (experiential learning) dan memberi ruang kepada pelajar untuk menghasilkan satu produk data yang dinilai oleh bakal majikan. Projek diperoleh daripada masalah dunia nyata dan dilaksanakan bersama dengan pihak industri, agensi kerajaan atau swasta, atau rakan akademik. Pelajar akan menggunakan pengetahuan dan kemahiran yang telah diperoleh di sepanjang pengajian untuk membantu menyelesaikan masalah nyata. Sepanjang pelaksanaan projek, pelajar terlibat dengan keseluruhan proses mengenal pasti dan mentakrifkan masalah, mencadangkan penyelesaian dan hambatan, melaksanakan analisis, seterusnya melapor dan membentangkan dapatan dan cadangan penyelesaian.
STQM6154 Sains Rangkaian
Kursus ini memperkenalkan teori matematik dalam sains rangkaian. Sains Rangkaian merupakan suatu bidang multidisiplin yang mengkaji masalah-masalah yang dapat difahami dengan pendekatan rangkaian. Antara tujuan sains rangkaian adalah bagi mencari persamaan rentas rangkaian dan meningkatkan pemahaman tentang sistem yang diwakili oleh setiap rangkaian melalui analisis data. Kegunaan sains rangkaian merentas bidang termasuk matematik, rangkaian sosial, sistem biologi dan pengangkutan.
STQP6014 Kaedah Penyelidikan dan Seminar Industri
Kursus ini bertujuan memberikan latar belakang dan kaedah menjalankan sesebuah penyelidikan saintifik dalam bidang Sains Data. Etika penyelidikan, prinsip penyelidikan, reka bentuk penyelidikan dan peranan penyelidik dibincangkan. Kaedah-kaedah penyelidikan, pensampelan dan pengumpulan data serta ulasan kritis terhadap kajian kesusasteraan didedahkan kepada pelajar. Seterusnya, pelajar didedahkan kepada isu-isu semasa dan penyelidikan terkini dalam bidang Sains Data melalui siri Seminar Sains Data dengan menjemput penyelidik dan pengamal utama industri dalam bidang ini.
STQS6234 Pentaabiran Bayesan
Kursus ini bertujuan untuk memperkenalkan pelajar tentang teori Bayesan. Pentaabiran Bayesan untuk taburan normal dibincangkan. Selain daripada itu, pentaabiran Bayesan untuk taburan selain normal juga dikaji – Binomial, Poisson, dll. Tajuk-tajuk lain termasuklah model Bayesan berhirarki, Bayes empirik, pengujian hipotesis, korelasi dan regresi.
STQS6284 Analisis Multivariat
Kursus ini bertujuan untuk memperkenalkan pelajar kepada kaedah statistik untuk data multivariat. Pelajar diberi kefahaman konsep dan teori bagi analisis multivariat. Antara topik yang dicakupi dalam kursus ini adalah aljabar matriks, taburan multivariat normal, pengujian hipotesis bagi data multivariat, analisis komponen utama, analisis faktor, analisis pembeza layan dan analisis kelompok.
STQS6444 Pemodelan Siri Masa dan Peramalan
Kursus ini bertujuan untuk menganggar model regresi mudah, menerangkan teknik memodel trend dan kemeruapan data siri masa, menerangkan tentang hubungan kointegrasi antara satu siri masa dengan satu atau beberapa siri masa lain, dan mengenengahkan isu-isu yang penting dalam menganalisis data siri masa. Bagi pemodelan trend dan kemeruapan, tumpuan diberikan kepada model ARCH dan GARCH. Hubungan kointegrasi pula membincangkan pendekatan pembetulan ralat dan pendekatan Johansen. Pada akhir semester, pelajar akan menyediakan satu laporan pendek yang menekankan kepada penggunaan teknik-teknik pengujian dan analisis model yang disentuh dalam kursus ini.
Head of Data Science and Engineering
Google Developer Expert (GDE) in Machine Learning Infinai Tech