1
11. Tujuan
utama dari data mining adalah...
a.
Pencarian data
b.
Pencarian
pola
c.
Pencarian database
d.
Pencarian relationship
e.
Pengeditan data
22. Masalah
yang dapat diselesaikan dengan metode data mining adalah sebagai berikut
kecuali...
a.
Estimasi
b.
Prediksi
c.
Klasifikasi
d.
Relationship
e.
Asosiasi
33. Banyaknya
jumlah atribut dalam data yang akan diproses pada data mining disebut...
a.
Scalability
b.
Dimensionality
c.
Data quality
d.
Streaming data
e.
Privacy preservation
44. Data
mining digunakan untuk melakukan information discovery yang ditujukan untuk...
a.
Data
analyst
b.
Programmer
c.
Network engineer
d.
Database administrator
e.
Operator komputer
55. Membagi
pasar ke dalam sub-set pelanggan yang berbeda dimana suatu sub-set mungkin
dapat dipilih sebagai target pasar yang dicapai dengan satu kombinasi pemasaran
yang berbeda, maka teknik data mining yang digunakan adalah...
a.
Klasterisasi
b.
Asosiasi
c.
Klasifikasi
d.
Regresi
e.
Prediksi
66. Untuk
memprediksi kaus-kaus transaksi curang dengan menggunakan kartu kredit (fraud
detection) digunakan teknik data mining...
a.
Klasterisasi
b.
Asosiasi
c.
Klasifikasi
d.
Regresi
e.
Prediksi
77. Teknik
data mining yang digunkan untuk prediksi adalah...
a.
Klasifikasi
dan regresi
b.
Klastering dan association rule discovery
c.
Klasifikasi dan klastering
d.
Regresi dan sequential pattern discovery
e.
Regresi dan klastering
88. Untuk
mengetahui kelompok pengguna kartu kredit yang bermasalah, maka atribut-atribut
akan diperlukan dalam proses knowledge discovery in databases, kecuali...
a.
Nama
bank pemberi kartu kredit
b.
Tanggal pelunasan kredit
c.
Produk yang dibeli
d.
Tanggal pembelian
e.
Nama pemegang kartu
99. Data
diatur oleh subyek yang hanya mengandung informasi yang diperlukan untuk
pengolahan pendukung keputusan, adalah karakteristik data warehouse dari
sisi...
a.
Subject
oriented
b.
Integrated
c.
Time variant
d.
Non volatile
e.
Volatile
110. Jika
ingin mengetahui pola belanja konsumen di toko, dengan tujuan menentukan
penempatan barang di toko, maka digunakan teknik data mining...
a.
Klasterisasi
b.
Asosiasi
c.
Klasifikasi
d.
Regresi
e.
Prediksi
111. Kumpulan
dari objek dan atributnya disebut dengan...
a.
Data
b.
Himpunan
c.
Himpunan
data
d.
Atribut data
e.
Objek data
112. Kode
pos, dan atribut yang memiliki himpunan nilai yang berhingga maupun yang tak
berhingga tetapi bisa dihitung termasuk dalam kelompok atribut...
a.
Diskrit
b.
Kontinyu
c.
Interval
d.
Nominal
e.
Biner
113. Angka
0,75 atau ¾,
berdasarkan jumlah nilainya dapat dikelompokan ke dalam atribut...
a.
Diskrit
b.
Biner
c.
Interval
d.
Nominal
e.
Kontinyu
114. Tipe dari
suatu atribut tergantung pada sifat yang dimiliki berikut ini, kecuali...
a.
Pembeda
b.
Urutan
c.
Penjumlahan
d.
Pengurangan
e.
Perkalian
115. Pengukuran
dilakukan dengan menggunakan standar deviasi, adalah jenis kesalahan
pengukuran...
a.
Noise
b.
Bias
c.
Presisi
d.
Akurasi
e.
Prediksi
116. Penanganan
missing value dapat dilakukan dengan cara sebagai berikut, kecuali...
a.
Menambah
objek data
b.
Mengurangi objek data
c.
Memperkirakan missing value
d.
Mengabaikan missing value pada saat analisis
e.
Mengganti dengan semua nilai yang mungkin
117. Proses
mengkombinasikan dua atau lebih atribut-atribut atau objek-objek ke dalam satu
atribut tunggal adalah...
a.
Sampling
b.
Dimensionality reduction
c.
Feature subset selection
d.
Agregation
e.
Discretization and binerization
118. Membagi
kelompok umur dengan range [11-20],[21-30],[31-40] adalah contoh discretization
dengan pendekatan...
a.
Equal frequency
b.
Equal
width
c.
Unsupervised
d.
Supervised
e.
Binarization
119. Objek
data dengan sifat yang berbeda sekali dari kebanyakan objek data dalam data-set
disebut...
a.
Noise
b.
Missing value
c.
Outliers
d.
Precision
e.
Duplicate data
220. Diketahui
vektor data biner dari dua objek x,y adalah x={1,0,1,1,1,1} dan y={0,0,1,1,0,0}
maka similaritas dari dua objek tersebut jika diukur dengan koefisien jaccard
adalah...
a.
1/6
b.
3/6
c.
2/6
d.
¼
e.
2/5
221. Untuk
soal di atas jika similaritas dari dua objek tersebut diukur dengan simple
matching maka hasilnya adalah...
a.
1/6
b.
2/6
c.
¼
d.
2/5
e.
3/6
222. Range
nilai similaritas adalah...
a.
[0]
b.
[1]
c.
[0,1]
d.
[1,0]
e.
[10]
223. Model
klasifikasi yang dapat berfungsi sebagai suatu alat penjelasan untuk membedakan
objek-objek dalam kelas-kelas yang berbeda disebut...
a.
Pemodelan
deskriptif
b.
Pemodelan prediktif
c.
Pemodelan naratif
d.
Pemodelan klasifikasi
e.
Pemodelan regresi
224. Dalam
decision tree, struktur datanya terdiri dari...
a.
Simpul
dan rusuk
b.
Simpul akar dan cabang
c.
Simpul cabang dan daun
d.
Akar, cabang dan daun
e.
Simpul, rusuk dan akar
225.
Id_trans
|
Roti
|
Keju
|
Susu
|
Jus
|
Air
|
111
|
1
|
1
|
0
|
0
|
0
|
112
|
1
|
0
|
1
|
0
|
0
|
113
|
1
|
1
|
1
|
0
|
0
|
114
|
1
|
1
|
1
|
1
|
1
|
Dari tabel diatas, support count
untuk [roti, keju, susu] adalah ...
a. 0%
b. 25%
c. 50%
d. 75%
e. 100%
226. Dari
tabel di atas, support count untuk itemset [roti, keju] adalah...
a.
0%
b.
25%
c.
50%
d.
75%
e.
100%
227. Gambar
di bawah merupakan clustering dengan tipe...
a.
Partition
b.
Hierarhical
c.
Exclusive
d.
Fuzzy
e.
Partial
228. Tidak
ada titik dalam sebuah cluster yang lebih mirip, hal ini dapat dikategorikan
dalam tipe cluster...
a.
Shared property
b.
Density based
c.
Contigious cluster
d.
Center based
e.
Well-separated
cluster
.
229. Ketika
terdapat noise dan outlier, tipe dari cluster berupa...
a.
Shared prperty
b.
Density
based
c.
Contigious cluster
d.
Center based
e.
Well-separated cluster