Kamis, 09 Januari 2014

Review Jurnal "PENGEMBANGAN DECISION TREE J48 UNTUK DIAGNOSIS PENYAKIT DIABETES MELLITUS"

Banyak penyandang DM yang terdiagnosis setelah mengalami komplikasi. Padahal, apabila dilakukan diagnosis secara dini, maka penanganan bisa dilakukan lebih cepat dan komplikasi yang membahayakan dapat dihindari.
Dalam perkembangan di dunia kedokteran saat ini, para peneliti dan praktisi memusatkan perhatiannya untuk mendeteksi kondisi DM dan mencegah atau menghambat berkembangnya komplikasi. Untuk mendukung hal ini dapat digunakan teknik data mining untuk menggali informasi yang berharga dari kumpulan informasi diabetes. Dalam penelitian ini dilakukan data mining dari dataset DM kelompok suku Pima Indians, Amerika Serikat, dimana berdasarkan penelitian yang dilakukan oleh National Institute of Diabetes and Digestive and Kidney Diseases (NIDDK) sejak tahun 1965 lebih dari 50% populasinya
Penelitian ini terbagi menjadi dua tahap yaitu pertama, tahap pre-processing data dan kedua, tahap penyusunan decision tree J48.

Tahap Pre-Processing Data
Identifikasi dan Pemilihan Atribut
Dataset dalam penelitian ini diambil dari repositori database Pima Indians, UCI. Table 1 menjelaskan atribut dataset diabetes Pima Indians. Dataset Pima ini terdiri dari 768 data klinis yang semuanya berasal dari jenis kelamin wanita dengan umur sekurang – kurangnya 21 tahun.
Penanganan Nilai Yang Tidak Lengkap
Dari hasil analisa dataset Pima Indians dapat diketahui bahwa tidak semua atribut memiliki nilai yang lengkap, dimana kelengkapan atribut ini akan menentukan seberapa baik hasil dari pengklasifikasi.
Untuk mengatasi nilai yang tidak lengkap pada masing – masing data atribut dapat dilakukan menggunakan empat cara.
  1. cara termudah dengan menghapus data yang tidak memiliki nilai, tetapi hal ini menyebabkan hilangnya informasi penting pada beberapa atribut yang lain.
  2. mengganti nilai yang hilang dengan menggunakan nilai rata-rata (mean), tetapi cara ini tidak sesuai jika jumlah nilai yang hilang sangat banyak karena akan menyebkan dataset tidak sesuai dengan kondisi sebenarnya.
  3. mengganti semua nilai yang tidak ada dengan nilai nol, tetapi hal ini akan menyebabkan hasil klasifikasi yang tidak baik.
  4. dengan mengganti nilai yang tidak ada dengan nilai yang dari tetangga sekelilingnya yang memiliki jarak atau kemiripan terdekat (eucledian distance).

Diskritisasi atribut bertujuan untuk mempermudah pengelompokan nilai berdasarkan kriteria yang telah ditetapkan. Hal ini juga bertujuan untuk menyederhanakan permasalahan dan meningkatkan akurasi dalam proses pembelajaran.

Tahap Penyusunan Decision Tree J48
Decision tree merupakan salah satu algoritma klasifikasi dalam data mining. Algoritma klasifikasi merupakan algoritma yang secara induktif dalam pembelajaran dalam mengkonstruksikan sebuah model dari dataset yang belum diklasifikasikan (pre classified dataset). Decision tree mengklasifikasikan data yang diberikan menggunakan nilai dari atribut.

Evaluasi Pengklasifikasi Decision Tree J48 Menggunakan K-Fold Cross-Validation
Dalam k-fold cross-validation, data pengujian dipisah secara acak ke dalam k himpunan bagian yang mutually exclusive atau “folds (lipatan)”, D1, D2,..., Dk, yang masing – masing kurang lebih berukuran sama. Pelatihan dan pengujian dilakukan sebanyak k kali. Pada iterasi ke-i, partisi Di digunakan sebagai data tes, dan partisi sisanya digunakan bersama untuk melatih model. Dalam iterasi pertama, yaitu himpunan bagian D2, ..., Dk secara bersama bertindak sebagai data pelatihan untuk memperoleh model pertama, yang diuji pada D1; iterasi kedua dilatih pada himpunan bagian D1, D3, ..., Dk dan diuji pada D2; dan. Dalam penelitian ini digunakan 10-fold crossvalidation. 

Dari hasil pengolahan dan uji coba menggunakan decision tree J48 pada dataset dihasilkan penyusunan informasi dalam bentuk tree. Ekstraksi informasi menggunakan data mining dari dataset kesehatan sangat efektif sebagai sistem pendukung kesehatan bagi praktisi kesehatan, dimana tujuan dari data mining adalah untuk mendapatkan pola informasi yang tersimpan dalam suatu basis data yang dapat digunakan untuk pengolahan selanjutnya dan sebagai bahan pendukung keputusan dalam diagnosis penyakit.

Sumber: http://eprints.dinus.ac.id/85/1/INFRM_30_-124_PENGEMBANGAN_DECISION_TREE_J48.pdf

Review Jurnal "STRUKTUR BASIS DATA UNTUK PELAYANAN TERPADU JASA PELABUHAN"

Peranan pelabuhan sebagai salah satu sentra perekonomian bagi suatu wilayah, setiap saat selalu mengalami peningkatan dan kemajuan dalam semua sektor. Perkembangan ini perlu dicermati dan senantiasa dioptimalkan dengan melakukan berbagai pembenahan, khususnya dari segi pelayanan terhadap pelanggan atau pengguna jasa pelabuhan.
Ada banyak pilihan solusi yang bisa dipilih, salah satunya adalah model pelayanan terpadu. Model pelayanan terpadu ini juga perlu harus didukung oleh sistem basis data yang baik agar pelayanan yang optimal dapat disajikan.
Penelitian ini meneliti struktur database untuk layanan terpadu pelabuhan, khususnya dalam layanan kargo umum di Pelabuhan Teluk Bayur Padang. Hasil penelitian menunjukkan bahwa tidak ada struktur database yang dapat digunakan untuk mendukung layanan tersebut. Model data yang digunakan adalah model data relasional yang normal dan dioptimalkan dengan bantuan skema kanonik. Akhir pandang user adalah produk akhir dari struktur database yang diinginkan dengan menggunakan Borland Delhi 3.0 sebagai program.
Berdasarkan data yang didapat dari penelitian di lapangan kendala utama dari sejumlah pelayanan jasa yang diberikan sejauh ini adalah, ketiadaan sistem basis data yang mendukung agar semua proses bisa berlangsung dengan cepat dan handal. Struktur basis data yang dikemukakan disini adalah struktur basis data relasional, yang dilakukan melalui sejumlah relasi atau tabel dua dimensi.
Normalisasi terhadap aspek-aspek pelayanan jasa yang terkait dengan kapal dan kargo tersebut dilakukan dengan menggunakan skema canonical. Proses normalisasi dengan skema canonical tersebut dilakukan secara bertahap dengan mengeliminasi aspek-aspek redundansi, aspek ketergantungan (transitif maupun fungsi) dan interseksi antar atribut pada setiap penggabungan sudut pandang. 
Beberapa diagram yang diperoleh berdasarkan sejumlah sudut pandang tersebut, selanjutnya dilakukan penggabungan secara bertahap.

1. Sudut Pandang Pertama dari Pengguna
Sudut pandang terhadap kapal, merupakan inspirasi dasar terhadap semua hal yang terkait dengan kargo, tepatnya rinci tentang kargo dan daya muat kapal terhadap kargo.

2. Sudut Pandang Kedua dari Pengguna
Pelayaran dan sandar kapal dalam rangka proses bongkar/muat dilakukan pada beberapa pelabuhan. Minimal akan melibatkan dua pelabuhan yaitu pelabuhan asal.

3. Sudut Pandang Ketiga dari Pengguna
Setiap satu kapal dalam melakukan satu pelayaran hanya dilengkapi dengan satu surat jalan (sebagai ilustrasi dalam penelitian ini nomor surat tersebut direpresentasikan melalui Kode Surat Muatan), yang mana surat ini dikeluarkan/diberikan oleh pihak pelabuhan tempat kapal sandar pada saat kapal memuat dan membongkar kargo.

4. Sudut Pandang Keempat dari Pengguna
kargo-kargo tersebut juga dilengkapi dengan kode kargo yang mana kode ini terutama sekali sangat dibutuhkan oleh agen untuk melacak kepemilikan, dimensi atau tonase serta tanggal pengiriman kargo tersebut.

5. Sudut Pandang Kelima dari Pengguna
kode kargo juga diharapkan dapat memberikan rinci lebih lanjut dari kargo. Untuk itu maka elemen yang ditampilkan pada sudut pandang keempat dari pengguna perlu dirinci lebih lanjut.

6. Sudut Pandang Keenam dari Pengguna
Merupakan bentuk final dari struktur basis data yang diperoleh dari pandangan terakhir.

Perancangan dengan menggunakan model skema canonical, merupakan metoda yang bertitik tolak dari sudut pandang pengguna, sehingga dengan demikian seorang perancang model dapat mengimplementasikan pokok fikirannya melalui bahasa gambar yang relatif lebih komunikatif. Dalam penerapan skema canonical sudut pandang yang diimplementasikan harus dalam bentuk normal ketiga, namun demikian dalam setiap langkah penggabunagn sudut pandang terjadi proses penajaman dan eliminasi terhadap berbagai aspek ketergantungan dan redundansi, sehingga menghasilkan struktur yang optimal.

Sumber: http://jurnal-tip.net/jurnal-resource/file/8.pdf