QUIZ DATA
DATA MINING : QUIZ
A. Objek
Analisis
Obyek data yang dianalisis merupakan data mahasiswa Universitas Buana Perjuangan Pahlawan berupa data transkip nilai dan data lulusan dari Universitas melalui API. Data transkip nilai mencakup detail nilai yang diperoleh mahasiswa untuk mata kuliah yang diambil. Data lulusan memberikan informasi demografis dan akademik mahasiswa, termasuk tanggal masuk dan lulus, serta predikat kelulusan.
B. Peralatan
1.
Perangkat Lunak
Perangkat lunak yang digunakan meliputi :
A.
Windows
11
Windows 11 berfungsi sebagai system operasi untuk computer dan laptop.
B.
Microsoft
Office Excel 2019
Digunakan untuk pengolahan data berupa teks dan angka.
C.
Microsoft
Office Word 2019
Digunakan untuk pengolahan dan penyimpanan data.
D.
Python
Digunakan sebagai Bahasa pemrograman dalam penelitian ini.
2.
Perangkat Keras
Analisis ini menggunakan perangkat keras dengan spesifikasi RAM 8 GB,
Processor AMD Ryzen 5 5500U with Radeon Graphics 2.10 GHz, 64-bit operating
system, x64-based processor.
C. Identifikasi
Masalah
- Analisis apakah ada hubungan antara nilai rata-rata mata kuliah / IPS dengan lulusan tepat waktu.
- Analisis apakah ada kolerasi positif antara predikat kelulusan "Pujian" dengan lulusan tepat waktu.
- Analisis untuk melihat apakah durasi studi lebih pendek berkolerasi dengan predikat kelulusan yang lebih baik.
- Hitung rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan jenis kelamin.
- atau gabungan dari beberapa variabel yang mempengaruhi lulusan tepat waktu.
D.
Prepare / Collect Data
Tahap
awal dalam proses analisis data di mana data yang diperlukan untuk analisis
diperoleh dan disiapkan agar sesuai untuk proses analisis data. Berikut adalah
adalah tahapan yang Prepare data pada Google Colabs.
#
URL dan headers untuk data transkip nilai
transkip_nilai_url
= "http://103.82.92.37/DM20232/getdata.php?table=transkip_nilai"
headers
= {'api-key': "DM20232UBP"}
response_transkip_nilai
= requests.get(transkip_nilai_url, headers=headers)
#
URL dan headers untuk data lulusan
ms_lulusan_url
= "http://103.82.92.37/DM20232/getdata.php?table=ms_lulusan"
response_ms_lulusan
= requests.get(ms_lulusan_url, headers=headers)
#
Memeriksa status permintaan
if
response_transkip_nilai.status_code == 200
and
response_ms_lulusan.status_code ==200:
# Mengambil data JSON dari respons dan membuat
DataFrame
data_transkip_nilai = response_transkip_nilai.json()['data']
df_transkip_nilai = pd.DataFrame(data_transkip_nilai)
jml_transkip_nilai = len(df_transkip_nilai)
data_ms_lulusan = response_ms_lulusan.json()['data']
df_ms_lulusan = pd.DataFrame(data_ms_lulusan)
jml_ms_lulusan = len(df_ms_lulusan)
# Menampilkan data frame
print("Jumlah data diterima : ",jml_transkip_nilai)
print("DataFrame Transkip Nilai : ")
print(df_transkip_nilai.head(5))
print("\nJumlah data diterima : ",jml_ms_lulusan)
print("DataFrame Ms Lulusan : ")
print(df_ms_lulusan.head(5))
else:
print("Gagal mengambil data.")
Output
:
E. Preprocessing
Data
Preprocessing data adalah salah satu tahap penting dalam data mining yang mencakup sejumlah langkah untuk mempersiapkan data sebelum dilakukan analisis lebih lanjut. Berikut adalah implementasi pada Google Colab :
Integrasi Data :
F. Analisis
Data
A. Analisis apakah ada hubungan antara nilai rata-rata mata kuliah / IPS dengan lulusan tepat waktu
Output :
Padap analisi pertama yaitu menganalisis hubungan
antara nilai IPS setiap semester dengan kelulusan tepat waktu. Pada gambar di
atas dapat dianalisis bahwa nilai IPS setiap semester yang memiliki warna biru
muda menunjukan korelasi positif antara nilai IPS dan lulusan tepat waktu,
sebaliknya jika memiliki biru tua hingga melebihi 0,2 menunjukan korelasi
negatif. Jika korelasi yang didapat semakin mendekati 1, itu menunjukan adanya
hubungan positif yang kuat antara dua variable. Berdasarkan data di atas, nilai
korelasi yang di dapat kisaran 0,11 hingga 0,24, meskipun tidak mendekati 1,
masih dapat dikatakan bahwa terdapat korelasi positif antara nilai IPS setiap
semester denagn kelulusan tepat waktu. Sehingga dapat di simpulkan bahwa nilai
IPS setiap semester mempengaruhi kelulusan tepat waktu. Hal itu dapat
diinterprestasikan bahwa mahasiswa yang mendapatkan nilai IPS yang tinggi
cenderung lebih mungkin lulus tepat waktu, sementara mahasiswa yang nilai IPS
nya cenderung lebih rendah mungkin lulus tidak tepat waktu.
Selain itu dapat di lihat diatas ini, hasil dari uji t-test menunjukan nilai t-statistik yang dihasilkan 16,40 dan p-value sebesar 9,36 nilai yang sangat kecil (mendekati nol). Ini menunjukan bahwa terdapat perbedaan yang signifikan antara IPS lulus tepat waktu dan tidak tepat waktu. Jika di lihat pada grafik, bahwa mahasiswa yang lulus tepat waktu memiliki rata-rata IPS yang berbeda secara signifikan dari mahasiswa yang tidak tepat waktu serta memiliki IPS rata-rata yang lebih tinggi.
B. Analisis
apakah ada korelasi positif antara predikat kelulusan 'Pujian' dengan lulusan
tepat waktu
Output :
Uji
chi-square adalah suatu metode statistic yang digunakan untuk menguji apakah
terdapat hubungan antara dua variable kategorikal dalam suatu populasi. Pada
kontek ini, uji ch—square antara predikat kelulusan dan kelulusan tepat waktu
yaitu untuk melihat apakah ada korelasi antara predikat kelulusan dengan
kemungkinan seseorang lulus tepat waktu. Hasil uji chi-square di atas
menunjukan bahwa terdapat korelasi yang signifikan antara predikat kelulusan
dan kelulusan tepat waktu, dengan chi-square sebesar 751.95 dan p-vlaue sangat
rendah yaitu 5,19. Semakin rendah nilai p-value yang diperoleh dari uji
chi-square, semakin kuat bukti yang menunjukan bahwa terdapat hubungan yang
signifikan. Selain itu dapat dilihat distribusi data pada diagram diatas, predikat pujian memiliki
distribusi data paling tinggi tepat waktu di bandingkan predikat lainnya yaitu
memuaskan dan sangat memuaskan. Untuk distribusi data lulusan tidak tepat waktu
paling sedikit yaitu predikat lulusan yang memuaskan dan paling tinggi adalah
sangat memuaskan.
C.
Analisis untuk melihat apakah durasi studi lebih
pendek berkorelasi dengan predikat kelulusan yang lebih baik
Output :
Dari hasil uji t-test yang dilakukan, dapat dilihat bahwa nilai p-value untuk semua pasangan kelompok predikat sangat rendah. Hal ini menunjukan bahwa ada perbedaan signifikan dalam durasi studi antara setiap pasangan kelompok predikat. Dari bar plot yang menampilkan rata-rata durasi untuk setiap kelompok predikat, kita dapat melihat bahwa semakin tinggi predikat kelulusan (Pujian), rata-rata durasi studi semakin singkat. Untuk durasi studi yang lebih lama cenderung mendapat predikat memuaskan, dan dibawahnya ada sangat memuaskan. Hal ini menunjukan bahwa terdapat hubungan invers antara predikat kelulusan dan durasi studi, dimana mahasiswa dengan predikat lebih tinggi (Pujian) cenderung menyelesaikan studi mereka dalam waktu yang lebih singkat.
D. Hitung
rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk
melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan
jenis kelamin
Output :
Dari hasil
uji t-test, nilai p-value yang sangat rendah 2,46 menunjukan bahwa terdapat
perbedaan signifikan dalam prestasi akademik antara jenis kelamin laki-laki dan
Perempuan berdasarkan rata-rata total nilai IPS. Rata-rata total nilai yang di
dapat untuk jenis kelamin laki-laki adalah 28,722 sedikit lebig tinggi dari
pada Perempuan yaitu 28,022. Namun perbedaan ini tidak mencerminkan secara
langsung nilai t-statistic yang cukup tinggi yaitu 13,778, yang menunjukan
bahwa perbedaan tersebut tidak mungkin terjadi secara kebetulan.
Pada
visualisasi boxplot menunjukan distribusi total nilai antara laki-laki dan
Perempuan, serta memperlihatkan perbedaan yang signifikan di antara keduanya.
Total nilai yang didapatkan laki-laki lebih tinggi dari pada total nilai yang
di dapatkan Perempuan. Hal ini juga diperkuat dengan visualisasi data
menggunakan histogram yang menunjukan distribusi frekuensi total nilai untuk
setiap jenis kelamin. Frekuensi total nilai yang di dapatkan jenis kelamin
laki-laki jauh lebih tinggi di bandingkan dengan Perempuan.
Dengan
demikian dapat disimpulkan bahwa jenis kelamin juga mempengaruhi prestasi
akademik mahasiswa, dengan rata-rata total nilai yang berbeda cukup signifikan.
E. atau
gabungan dari beberapa variabel yang mempengaruhi lulusatepat waktu
Output :
Bedasarkan
Analisa korelasi yang ditunjukkan dalam heatmap diatas :
1. Variabel
IPS Setiap Semester, yaitu IPS_Semester_1 hingga IPS_Semester_8 terdapat
korelasi positif yang lemah hingga sedang, antara nilai IPS dengan kemungkinan
lulus tepat waktu. Hal ini menunjukan bahwa mahasiswa dengan nilai IPS yang
lebih tinggi cenderung memiliki kemungkinan yang lebih tinggi lulus tepat
waktu. Namun, korelasi ini tidak terlalu kuat, sehingga ada banyak factor lain
yang juga mempengaruhi kelulusan tepat waktu.
2. Variabel
Predikat, memiliki korelasi negative yang cukup kuat antara predikat kelulusan
dengan kemungkinan lulus tepat waktu. Artinya semakin tinggi predikat kelulusan
seseorang, semakin rendah kemungkinan mereka untuk lulus tepat waktu. Hasil ini
berbeda jauh dengan analisis pada point masalah ke dua yang menggunakan metode
uji Chi-Square. Perbedaan hasil korelasi ini dapat diesebabkan oleh perbedaan
dalam cara kedua metode tersebut mengukur korelasi. Heatmap Korelasi mengukur
korelasi dua variable secara langsung dengan menggunakan koefisien korelasi
Pearson atau metode korelasi lainnya. Sedangkan Uji Chi-Square digunakan untuk
menguji keterkaitan atau asosiasi atara dua variable kategori. Dalam hal ini,
kedua hasil tersebut sebenarnya saling
melengkapi, menunjukan bahwa terdapat hubungan yang signifikan antara predikat
dengan lulus tepat waktu dari dua sudut pandang yang berbeda.
3. Variabel
Jenis Kelamin, memiliki korelasi negative yang cukup kuat, hal ini menunjukan
bahwa ada perbedaan dalam kemungkinan lulus tepat waktu antara jenis kelamin
tertentu. Diperlukan analisis lebih lanjut untuk memahami factor yang
menyebabkan perbedaan ini.
4. Variabel
Durasi Kuliah, memiliki korelasi negative yang kuat diantara durasi kuliah
dengan kemungkinan lulus tepat waktu. Hal ini menunjukan bahwa semakin lama
durasi kuliah, semakin rendah juga kemungkinan mereka untuk lulus tepat waktu..
Dengan
demikian dapat disimpulkan bahawa factor-faktor seperti prestasi akademik,
predikat, jenis kelamin, durasi kuliah memiliki pengaruh atau hubungan yang
signifikan terhadap kemungkinan lulus tepat waktu.
Link Google Colab : Link Source code
Laporan Quiz : Laporan Quiz Data Mining
Komentar
Posting Komentar