QUIZ DATA



DATA MINING : QUIZ

A.    Objek Analisis

            Obyek data yang dianalisis merupakan data mahasiswa Universitas Buana Perjuangan Pahlawan berupa data transkip nilai dan data lulusan dari Universitas melalui API. Data transkip nilai mencakup detail nilai yang diperoleh mahasiswa untuk mata kuliah yang diambil. Data lulusan memberikan informasi demografis dan akademik mahasiswa, termasuk tanggal masuk dan lulus, serta predikat kelulusan.

B.     Peralatan

1.      Perangkat Lunak

Perangkat lunak yang digunakan meliputi :

A.           Windows 11

Windows 11 berfungsi sebagai system operasi untuk computer dan laptop.

B.            Microsoft Office Excel 2019

Digunakan untuk pengolahan data berupa teks dan angka.

C.            Microsoft Office Word 2019

Digunakan untuk pengolahan dan penyimpanan data.

D.           Python

Digunakan sebagai Bahasa pemrograman dalam penelitian ini.

2.      Perangkat Keras

Analisis ini menggunakan perangkat keras dengan spesifikasi RAM 8 GB, Processor AMD Ryzen 5 5500U with Radeon Graphics 2.10 GHz, 64-bit operating system, x64-based processor.

 

C.    Identifikasi Masalah

  1. Analisis apakah ada hubungan antara nilai rata-rata mata kuliah / IPS dengan lulusan tepat waktu.
  2. Analisis apakah ada kolerasi positif antara predikat kelulusan "Pujian" dengan lulusan tepat waktu.
  3. Analisis untuk melihat apakah durasi studi lebih pendek berkolerasi dengan predikat kelulusan yang lebih baik.
  4. Hitung rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan jenis kelamin.
  5. atau gabungan dari beberapa variabel yang mempengaruhi lulusan tepat waktu.

D.    Prepare / Collect Data

Tahap awal dalam proses analisis data di mana data yang diperlukan untuk analisis diperoleh dan disiapkan agar sesuai untuk proses analisis data. Berikut adalah adalah tahapan yang Prepare data pada Google Colabs.

 

# URL dan headers untuk data transkip nilai

transkip_nilai_url = "http://103.82.92.37/DM20232/getdata.php?table=transkip_nilai"

headers = {'api-key': "DM20232UBP"}

response_transkip_nilai = requests.get(transkip_nilai_url, headers=headers)

 

# URL dan headers untuk data lulusan

ms_lulusan_url = "http://103.82.92.37/DM20232/getdata.php?table=ms_lulusan"

response_ms_lulusan = requests.get(ms_lulusan_url, headers=headers)

 

# Memeriksa status permintaan

if response_transkip_nilai.status_code == 200 and response_ms_lulusan.status_code ==200:

  # Mengambil data JSON dari respons dan membuat DataFrame

  data_transkip_nilai = response_transkip_nilai.json()['data']

  df_transkip_nilai = pd.DataFrame(data_transkip_nilai)

  jml_transkip_nilai = len(df_transkip_nilai)

 

  data_ms_lulusan = response_ms_lulusan.json()['data']

  df_ms_lulusan = pd.DataFrame(data_ms_lulusan)

  jml_ms_lulusan = len(df_ms_lulusan)

 

  # Menampilkan data frame

  print("Jumlah data diterima : ",jml_transkip_nilai)

  print("DataFrame Transkip Nilai : ")

  print(df_transkip_nilai.head(5))

 

  print("\nJumlah data diterima : ",jml_ms_lulusan)

  print("DataFrame Ms Lulusan : ")

  print(df_ms_lulusan.head(5))

 

else:

  print("Gagal mengambil data.")

Output :


E.     Preprocessing Data

       Preprocessing data adalah salah satu tahap penting dalam data mining yang mencakup sejumlah langkah untuk mempersiapkan data sebelum dilakukan analisis lebih lanjut. Berikut adalah implementasi pada Google Colab :

Integrasi Data :





     Cleaning Data :



    
      Normalisasi Data :




F.     Analisis Data

      A.  Analisis apakah ada hubungan antara nilai rata-rata mata kuliah / IPS dengan lulusan tepat waktu 

Output :


Padap analisi pertama yaitu menganalisis hubungan antara nilai IPS setiap semester dengan kelulusan tepat waktu. Pada gambar di atas dapat dianalisis bahwa nilai IPS setiap semester yang memiliki warna biru muda menunjukan korelasi positif antara nilai IPS dan lulusan tepat waktu, sebaliknya jika memiliki biru tua hingga melebihi 0,2 menunjukan korelasi negatif. Jika korelasi yang didapat semakin mendekati 1, itu menunjukan adanya hubungan positif yang kuat antara dua variable. Berdasarkan data di atas, nilai korelasi yang di dapat kisaran 0,11 hingga 0,24, meskipun tidak mendekati 1, masih dapat dikatakan bahwa terdapat korelasi positif antara nilai IPS setiap semester denagn kelulusan tepat waktu. Sehingga dapat di simpulkan bahwa nilai IPS setiap semester mempengaruhi kelulusan tepat waktu. Hal itu dapat diinterprestasikan bahwa mahasiswa yang mendapatkan nilai IPS yang tinggi cenderung lebih mungkin lulus tepat waktu, sementara mahasiswa yang nilai IPS nya cenderung lebih rendah mungkin lulus tidak tepat waktu.


Selain itu dapat di lihat diatas ini, hasil dari uji t-test menunjukan nilai t-statistik yang dihasilkan 16,40 dan p-value sebesar 9,36 nilai yang sangat kecil (mendekati nol). Ini menunjukan bahwa terdapat perbedaan yang signifikan antara IPS lulus tepat waktu dan tidak tepat waktu. Jika di lihat pada grafik, bahwa mahasiswa yang lulus tepat waktu memiliki rata-rata IPS yang berbeda secara signifikan dari mahasiswa yang tidak tepat waktu serta memiliki IPS rata-rata yang lebih tinggi.

B.     Analisis apakah ada korelasi positif antara predikat kelulusan 'Pujian' dengan lulusan tepat waktu


Output :


Uji chi-square adalah suatu metode statistic yang digunakan untuk menguji apakah terdapat hubungan antara dua variable kategorikal dalam suatu populasi. Pada kontek ini, uji ch—square antara predikat kelulusan dan kelulusan tepat waktu yaitu untuk melihat apakah ada korelasi antara predikat kelulusan dengan kemungkinan seseorang lulus tepat waktu. Hasil uji chi-square di atas menunjukan bahwa terdapat korelasi yang signifikan antara predikat kelulusan dan kelulusan tepat waktu, dengan chi-square sebesar 751.95 dan p-vlaue sangat rendah yaitu 5,19. Semakin rendah nilai p-value yang diperoleh dari uji chi-square, semakin kuat bukti yang menunjukan bahwa terdapat hubungan yang signifikan. Selain itu dapat dilihat distribusi data  pada diagram diatas, predikat pujian memiliki distribusi data paling tinggi tepat waktu di bandingkan predikat lainnya yaitu memuaskan dan sangat memuaskan. Untuk distribusi data lulusan tidak tepat waktu paling sedikit yaitu predikat lulusan yang memuaskan dan paling tinggi adalah sangat memuaskan.

C.    Analisis untuk melihat apakah durasi studi lebih pendek berkorelasi dengan predikat kelulusan yang lebih baik

Output :


Dari hasil uji t-test yang dilakukan, dapat dilihat bahwa nilai p-value untuk semua pasangan kelompok predikat sangat rendah. Hal ini menunjukan bahwa ada perbedaan signifikan dalam durasi studi antara setiap pasangan kelompok predikat. Dari bar plot yang menampilkan rata-rata durasi untuk setiap kelompok predikat, kita dapat melihat bahwa semakin tinggi predikat kelulusan (Pujian), rata-rata durasi studi semakin singkat. Untuk durasi studi yang lebih lama cenderung mendapat predikat memuaskan, dan dibawahnya ada sangat memuaskan. Hal ini menunjukan bahwa terdapat hubungan invers antara predikat kelulusan dan durasi studi, dimana mahasiswa dengan predikat lebih tinggi (Pujian) cenderung menyelesaikan studi mereka dalam waktu yang lebih singkat.

D.    Hitung rata-rata nilai total untuk masing-masing jenis kelamin dan bandingkan untuk melihat apakah ada perbedaan signifikan dalam prestasi akademik berdasarkan jenis kelamin

Output :



Dari hasil uji t-test, nilai p-value yang sangat rendah 2,46 menunjukan bahwa terdapat perbedaan signifikan dalam prestasi akademik antara jenis kelamin laki-laki dan Perempuan berdasarkan rata-rata total nilai IPS. Rata-rata total nilai yang di dapat untuk jenis kelamin laki-laki adalah 28,722 sedikit lebig tinggi dari pada Perempuan yaitu 28,022. Namun perbedaan ini tidak mencerminkan secara langsung nilai t-statistic yang cukup tinggi yaitu 13,778, yang menunjukan bahwa perbedaan tersebut tidak mungkin terjadi secara kebetulan.

Pada visualisasi boxplot menunjukan distribusi total nilai antara laki-laki dan Perempuan, serta memperlihatkan perbedaan yang signifikan di antara keduanya. Total nilai yang didapatkan laki-laki lebih tinggi dari pada total nilai yang di dapatkan Perempuan. Hal ini juga diperkuat dengan visualisasi data menggunakan histogram yang menunjukan distribusi frekuensi total nilai untuk setiap jenis kelamin. Frekuensi total nilai yang di dapatkan jenis kelamin laki-laki jauh lebih tinggi di bandingkan dengan Perempuan.

Dengan demikian dapat disimpulkan bahwa jenis kelamin juga mempengaruhi prestasi akademik mahasiswa, dengan rata-rata total nilai yang berbeda cukup signifikan.

E.     atau gabungan dari beberapa variabel yang mempengaruhi lulusatepat waktu

Output :


Bedasarkan Analisa korelasi yang ditunjukkan dalam heatmap diatas :

1.      Variabel IPS Setiap Semester, yaitu IPS_Semester_1 hingga IPS_Semester_8 terdapat korelasi positif yang lemah hingga sedang, antara nilai IPS dengan kemungkinan lulus tepat waktu. Hal ini menunjukan bahwa mahasiswa dengan nilai IPS yang lebih tinggi cenderung memiliki kemungkinan yang lebih tinggi lulus tepat waktu. Namun, korelasi ini tidak terlalu kuat, sehingga ada banyak factor lain yang juga mempengaruhi kelulusan tepat waktu.

2.      Variabel Predikat, memiliki korelasi negative yang cukup kuat antara predikat kelulusan dengan kemungkinan lulus tepat waktu. Artinya semakin tinggi predikat kelulusan seseorang, semakin rendah kemungkinan mereka untuk lulus tepat waktu. Hasil ini berbeda jauh dengan analisis pada point masalah ke dua yang menggunakan metode uji Chi-Square. Perbedaan hasil korelasi ini dapat diesebabkan oleh perbedaan dalam cara kedua metode tersebut mengukur korelasi. Heatmap Korelasi mengukur korelasi dua variable secara langsung dengan menggunakan koefisien korelasi Pearson atau metode korelasi lainnya. Sedangkan Uji Chi-Square digunakan untuk menguji keterkaitan atau asosiasi atara dua variable kategori. Dalam hal ini, kedua hasil tersebut  sebenarnya saling melengkapi, menunjukan bahwa terdapat hubungan yang signifikan antara predikat dengan lulus tepat waktu dari dua sudut pandang yang berbeda.

3.      Variabel Jenis Kelamin, memiliki korelasi negative yang cukup kuat, hal ini menunjukan bahwa ada perbedaan dalam kemungkinan lulus tepat waktu antara jenis kelamin tertentu. Diperlukan analisis lebih lanjut untuk memahami factor yang menyebabkan perbedaan ini.

4.      Variabel Durasi Kuliah, memiliki korelasi negative yang kuat diantara durasi kuliah dengan kemungkinan lulus tepat waktu. Hal ini menunjukan bahwa semakin lama durasi kuliah, semakin rendah juga kemungkinan mereka untuk lulus tepat waktu..

Dengan demikian dapat disimpulkan bahawa factor-faktor seperti prestasi akademik, predikat, jenis kelamin, durasi kuliah memiliki pengaruh atau hubungan yang signifikan terhadap kemungkinan lulus tepat waktu.

Link Google Colab : Link Source code

Laporan Quiz : Laporan Quiz Data Mining




Komentar

Postingan Populer