BÀI TẬP VÀ ĐỀ THI MÔN KHAI PHÁ DỮ LIỆU DATA MINING – Tài liệu text

BÀI TẬP VÀ ĐỀ THI MÔN KHAI PHÁ DỮ LIỆU DATA MINING

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.67 MB, 104 trang )

BÀI TẬP VÀ ĐỀ THI
MÔN KHAI PHÁ DỮ
LIỆU

1

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Contents
ĐỀ 1 ——————————————————————————————————————— 2
ĐỀ 2 ——————————————————————————————————————- 15
ĐỀ 3 ——————————————————————————————————————- 18
LUẬT KẾT HỢP ——————————————————————————————————- 23
TẬP PHỔ BIẾN ——————————————————————————————————- 28
TẬP THÔ VÀ CÂY QUYẾT ĐỊNH ———————————————————————————– 32
GÔM CỤM K MEANS ———————————————————————————————– 35
——————————————————————————————————- 38
ÁP SUẤT ————————————————————————————————————– 67
HÌNH ẢNH KIỂU DỮ LIỆU LIÊN TỤC VÀ RỜI RẠC ——————————————— 76
PHÂN LỚP (CLASSFICATION) ————————————————————————— 78
Dùng thuật tóan ID3 và Naïve Bayes để tìm luật phân lớp ———————————————————– 83

KẾT HỢP (ASSOCIATION RULES) ——————————————————————— 89
Thuật toán Apriori khai phá luật kết hợp ————————————————————————– 89

HỒI QUI (REGRESSION) ———————————————————————————— 96
Phương trình hồi qui tuyến tính một chiều ———————————————————————————– 96
Hồi qui nhiều chiều: (Multiple Regression) ———————————————————————————– 98

PHÂN CỤM (CLUSTERING) ——————————————————————————– 99

1

2

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

ĐỀ 1
ĐỀ THI MÔN DATAMINING
Thời gian: 120 phút (Được phép sử dụng tài liệu)

1. Cho bối cảnh khai thác dữ liệu như sau (4 điểm)

o1
o2
o3
o4
o5
o6

i1
1
1
0
1
0
1

i2

0
0
0
1
1
1

i3
1
1
1
0
0
0

i4
1
0
0
1
1
1

i5
0
0
1
1
0
1

1.1 Tìm các tập phổ biến tối đại theo ngưỡng minsupp=0.3
1.2 Tìm các luật kết hợp từ tập phổ biến tối đại với ngưỡng minconf=1.0
2. Cho bảng quyết định sau (4 điểm)

O1
O2
O3
O4
O5
O6
O7
O8

Vóc dáng
Nhỏ
Lớn
Lớn
Nhỏ
Lớn
Lớn
Lớn
Nhỏ

Quốc tịch
Đức
Pháp
Đức
Ý
Đức

Ý
Ý
Đức

Gia cảnh
Độc thân
Độc thân
Độc thân
Độc thân
Có gia đình
Độc thân
Có gia đình
Có gia đình

Nhóm
A
A
A
B
B
B
B
B

2.1 Tìm các luật phân lớp của bảng quyết định trên với
 Tập thuộc tính điều kiện là {Vóc dáng, Quốc tịch, Gia cảnh}
 Thuộc tính phân lớp là {Nhóm}
2.2 Tìm các reducts bảng quyết định trên và liệt kê các luật phân lớp có số thuộc tính vế trái nhỏ
nhất
3. Trình bày một ứng dụng cụ thể của CSDL dạng khối 3 chiều và nêu lên một số thao tác trên CSDL

dạng khối mà CSDL quan hệ khó thực hiện (2 điểm)

2

3

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

ĐỀ THI MÔN DATAMINING
Thời gian: 120 phút (Được phép sử dụng tài liệu)

4. Cho bối cảnh khai thác dữ liệu như sau (4 điểm)

o1
o2
o3
o4
o5
o6

i1
1
1
0
1
0
1

i2

0
0
0
1
1
1

i3
1
1
1
0
0
0

i4
1
0
0
1
1
1

i5
0
0
1
1
0
1

4.1 Tìm các tập phổ biến tối đại theo ngưỡng minsupp=0.3
4.2 Tìm các luật kết hợp từ tập phổ biến tối đại với ngưỡng minconf=1.0
5. Cho bảng quyết định sau (4 điểm)

O1
O2
O3
O4
O5
O6
O7
O8

Vóc dáng
Nhỏ
Lớn
Lớn
Nhỏ
Lớn
Lớn
Lớn
Nhỏ

Quốc tịch
Đức
Pháp
Đức
Ý
Đức

Ý
Ý
Đức

Gia cảnh
Độc thân
Độc thân
Độc thân
Độc thân
Có gia đình
Độc thân
Có gia đình
Có gia đình

Nhóm
A
A
A
B
B
B
B
B

5.1 Tìm các luật phân lớp của bảng quyết định trên với
 Tập thuộc tính điều kiện là {Vóc dáng, Quốc tịch, Gia cảnh}
 Thuộc tính phân lớp là {Nhóm}
5.2 Tìm các reducts bảng quyết định trên và liệt kê các luật phân lớp có số thuộc tính vế trái nhỏ
nhất
6. Trình bày một ứng dụng cụ thể của CSDL dạng khối 3 chiều và nêu lên một số thao tác trên CSDL

dạng khối mà CSDL quan hệ khó thực hiện (2 điểm)
BÀI GIẢI

Câu 1:
1.1 Tìm các tập phổ biến tối đại theo ngưỡng minsupp=0.3

3

4

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Tính F1:
Supp({i1}) = 4/6 = 0.66
Supp({i2}) = 3/6 = 0.5
Supp({i3}) = 3/6 =0.5
Supp({i4}) = 4/6 = 0.66
Supp({i5}) = 3/6 =0.5
Vậy: F1 = {{i1},{i2},{i3},{i4},{i5}}

Tính C2 từ F1:

i1
i2
i3
i4
i5

i1

i2

i3

i4

i1,i2
i1,i3
i1,i4
i1,i5

i2,i3
i2,i4
i2,i5

i3,i4
i3,i5

i4,i5

i5

C2 = {{i1,i2},{i1,i3},{i1,i4},{i1,i5},{i2,i3},{i2,i4},{i2,i5},{i3,i4},{i3,i5},{i4,i5}}

Từ C2 tính F2:

Supp({i1,i2}) = 2/6 = 0.3
Supp({i1,i3}) = 2/6 = 0.3
Supp({i1,i4}) = 3/6 = 0.5

Supp({i1,i5}) = 2/6 = 0.3
Supp({i2,i3}) = 0/6 = 0 < minsupp : loại
Supp({i2,i4}) = 3/6 = 0.5
Supp({i2,i5}) = 2/6 = 0.3
Supp({i3,i4}) = 1/6 = 0.17 < minsupp: loại
Supp({i3,i5}) = 1/6 = 0.17 < minsupp: loại
Supp({i4,i5}) = 2/6 = 0.3

4

5

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Vậy: F2 = { {i1,i2},{i1,i3},{i1,i4},{i1,i5},{i2,i4},{i2,i5},{i4,i5}}

Tính C3 từ F2:

{i1,i2}
{i1,i3}
{i1,i4}
{i1,i5}
{i2,i4}
{i2,i5}
{i4,i5}

{i1,i2}

{i1,i3}

{i1,i4}

{i1,i5}

{i2,i4}

{i2,i5}

{i1,i2,i3}
{i1,i2,i4}
{i1,i2,i5}
{i1,i2,i4}
{i1,i2,i5}
{i1,i2,i4,i5}

{i1,i3,i4}
{i1,i3,i5}
{i1,i2,i3,i4}
{i1,i2,i3,i5}
{i1,i3,i4,i5}

{i1,i4,i5}
{i1,i2,i4}
{i1,i2,i4.i5}
{i1,i4,i5}

{i1,i2,i4,i5}
{i1,i2,i5}
{i1,i4,i5}

{i2,i4,i5}
{i2,i4,i5}

{i2,i4,i5}

{i4,i5}

C3 = {{i1,i2,i3},{i1,i2,i4},{i1,i2,i5},{i1,i3,i4},{i1,i3,i5},{i1,i4,i5},{i2,i4,i5}}

Từ C3 tính F3:
Theo nguyên lý Apriori, ta loại các tập sau:
Loại {i1,i2,i3} vì {i2,i3} không có trong F2
Loại {i1,i3,i4} vì {i3,i4} không có trong F2
Loại {i1,i3,i5} vì {i3,i5} không có trong F2

Supp({i1,i2,i4}} = 2/6 = 0.3
Supp({i1,i2,i5}} = 2/6 = 0.3
Supp({i1,i4,i5}} = 2/6 = 0.3
Supp({i2,i4,i5}} = 2/6 = 0.3

Vậy: F3 = {{i1,i2,i4},{i1,i2,i5},{i1,i4,i5},{i2,i4,i5}}

Tính C4 từ F3:

{i1,i2,i4}

{i1,i2,i5}

{i1,i4,i5}

{i2,i4,i5}

{i1,i2,i4}

5

6

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

{i1,i2,i5}
{i1,i4,i5}
{i2,i4,i5}

{i1,i2,i4,i5}
{i1,i2,i4,i5}
{i1,i2,i4,i5}

{i1,i2,i4,i5}
{i1,i2,i4,i5}

{i1,i2,i4,i5}

C4 = {{i1,i2,i4,i5}}

Tính F4:
Supp({i1,i2,i4,i5}) = 2/6 =0.3

Vậy: F4 = {{i1,i2,i4,i5}}

Tập phổ biến tối đại: {i1,i3}, {i1,i2,i4,i5}

{i1,i2,i4,i5}

{i1,i2,i4} {i1,i2,i5}

{i1,i2}

{i1}

{i1,i3}

{i2}

{i2,i4}

{i3}

{i1,i4}

{i2,i4,i5}

{i1,i4,i5}

{i2,i5} {i1,i5}

{i4}

{i4,i5}

{i5}

1.2 Tìm các luật kết hợp từ tập phổ biến tối đại với ngưỡng minconf=1.0
Định nghĩa : cho I: tập các item, O: tập các giao tác. Ta định nghĩa ánh xạ : I  O, khi đó S  I thì: (S) =
{o | i  S, (i) = o}, ie. tập các giao tác có chứa S.
Cho luật kết hợp S1=>S2. Conf(S1=>S2) = | (S1) (S2)|/| (S1)|.

6

7

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Conf(S1=>S2) = 1.0 khi và chỉ khi (S1) (S2) vì (S1) (S2)= (S1).

– Xét tập phổ biến tối đại{i1,i3}, các luật kết hợp khả dĩ là : i1=>i2 và i2=>i1.
Ta có: (i1) = {o1,o2,o4,o6}, (i2) = {o4,o5,o6}, nên: (i1) (i2) và (i2) (i1)
Do đó i1=>i2 và i2=>i1 không là luật kết hợp.

– Xét tập phổ biến tối đại{i1,i2,i4,i5}:
Luật : S1=>S2
{i1}=>{i2,i4,i5}
{i2,i4,i5}=>{i1}
{i1,i2} => {i4,i5}
{i4,i5}=>{i1,i2}
{i1,i4}=> {i2,i5}
{i2,i5}=>{i1,i4}

{i1,i5}=>{i2,i4}
{i2,i4}=>{i1,i5}
{i1,i2,i4}=>{i5}
{i5}=>{i1,i2,i4}
{i1,i2,i5}=>{i4}
{i4}=>{i1,i2,i5}
{i1,i4,i5}=>{i2}
{i2}=>{i1,i4,i5}

(S1)
{o1,o2,o4,o6}
{o4,o6}
{o4,o6)}
{o4,o6}
{o1,o4,o6}
{o4,o5,o6}
{o4,o6}
{o4,o5,o6}
{o4,o6}
{o3,o4,o6}
{o4,o6}
{o1,o4,o5,o6}
{o4,o6}
{o4,o5,o6}

(S2)
{o4,o6}
{o1,o2,o4,o6}
{o4,o6}
{o4,o6}

{o4,o5,o6}
{o1,o4,o6}
{o4,o5,o6}
{o4,o6}
{o3,o4,o6}
{o4,o6}
{o1,o4,o5,o6}
{o4,o6}
{o4,o5,o6}
{o4,o6}

(S1) (S2)
x
x
x

x
x
x
x

Ta có các luật kết hợp:
L1: {i2,i4,i5}=>{i1}
L2: {i1,i2} => {i4,i5}
L3: {i4,i5}=>{i1,i2}
L4: {i1,i5}=>{i2,i4}
L5: {i1,i2,i4}=>{i5}
L6: {i1,i2,i5}=>{i4}
L7: {i1,i4,i5}=>{i2}

Câu 2:

2.1 Tìm các luật phân lớp của bảng quyết định :

7

8

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

O1
O2
O3
O4
O5
O6
O7
O8

Vóc dáng
Nhỏ
Lớn
Lớn
Nhỏ
Lớn
Lớn
Lớn
Nhỏ

Quốc tịch
Đức
Pháp
Đức
Ý
Đức
Ý
Ý
Đức

Gia cảnh
Độc thân
Độc thân
Độc thân
Độc thân
Có gia đình
Độc thân
Có gia đình
Có gia đình

Nhóm
A
A
A
B
B
B
B
B

Đặt :
P=A, N= B;
p: số phần tử thuộc lớp P, p = 3;
n: số phần tử thuộc lớp N, n = 5;
Ta có: I(p,n) = I(3,5) = -3/8*log23/8-5/8*log25/8 = 0.954

Tính độ lợi thông tin cho các thuộc tính điều kiện:

Vóc dáng
Nhỏ
Lớn

pi
1
2

ni
2
3

I(pi,ni)
0.92
0.97

E(Vóc dáng) = 3/8*I(1,2)+5/8*I(2,3) = 3/8*0.92+5/8*0.97 = 0.951
G(Vóc dáng) = I(p,n) – E(Vóc dáng) = 0.954 – 0.951 = 0.003

Quốc tịch
Đức
Pháp

Ý

pi
2
1
0

ni
2
0
3

I(pi,ni)
1
0
0

E(Quốc tịch) = 4/8*I(2,2)+1/8*I(1,0)+3/8*I(0,3) = 4/8*1 = 0.5
G(Quốc tịch) = I(p,n) – E(Quốc tịch) = 0.954 – 0.5 = 0.454

8

9

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Gia cảnh
Độc thân
Có gia đình

pi
3
0

ni
2
3

I(pi,ni)
0.97
0

E(Gia cảnh) = 5/8*I(3,2)+3/8*I(0,3) = 5/8*0.97 = 0.606
G(Gia cảnh) = I(p,n) – E(Gia cảnh) = 0.954-0.606 = 0.348

Thuộc tính Quốc tịch có độ lợi thông tin lớn nhất, nên được chọn để phân lớp:

Quốc tịch
Đức

Ý

Pháp

O1,O3,O5,O8
O2

O4,O6,O7

(Gạch duới: thuộc lớp A,
Không gạch dưới: thuộc lớp B)

Phân lớp nhóm Quốc tịch – Đức:

Bảng dữ liệu còn lại:
O1
O3
O5
O8

Vóc dáng
Nhỏ
Lớn
Lớn
Nhỏ

Gia cảnh
Độc thân
Độc thân
Có gia đình
Có gia đình

Nhóm
A
A
B
B

Ta có: I(p,n) = -2/4*log22/4-2/4*log22/4 =1

9

10

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Vóc dáng
Nhỏ
Lớn

pi
1
1

ni
1
1

I(pi,ni)
1
1

E(Vóc dáng) = 2/4*I(1,1)+2/4*I(1,1) = 2/4*1+2/4*1 = 1
G(Vóc dáng) = I(p,n) – E(Vóc dáng) = 1 -1 = 0

Gia cảnh
Độc thân
Có gia đình

pi
2
0

ni
0
2

I(pi,ni)
0
0

E(Gia cảnh) = 0
G(Gia cảnh) = 1

Thuộc tính Gia cảnh được chọn để phân lớp:

Quốc tịch
Đức

O1,O3,O5,O8

Độc thân
O1,O3

Ý

Pháp

Gia cảnh

O2

O4,O6,O7

Có gia đình
O5,O8

10

11

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Cây quyết định:

Quốc tịch
Đức

Gia cảnh
Độc thân

Ý

Pháp

A

B

Có gia đình

A

B

Các luật phân lớp:
L1: Nếu có Quốc tịch Đức và Gia cảnh Độc thân thì thuộc về nhóm A
L2: Nếu có Quốc tịch Đức và Gia cảnh Có gia đình thì thuộc về nhóm B
L3: Nếu có Quốc tịch Pháp thì thuộc về nhóm A
L4: Nếu có Quốc tịch Ý thì thuộc về nhóm B

11

12

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Rút gọn luật:
Các luật trên đều không dư thừa.

2.2 Tìm các reducts bảng quyết định trên và liệt kê các luật phân lớp có số thuộc tính vế trái nhỏ nhất

Quốc tịch
Đức
Pháp
Đức

Ý
Đức
Ý
Ý
Đức

Vóc dáng
Nhỏ
Lớn
Lớn
Nhỏ
Lớn
Lớn
Lớn
Nhỏ

O1
O2
O3
O4
O5
O6
O7
O8

Gia cảnh
Độc thân
Độc thân
Độc thân
Độc thân

Có gia đình
Độc thân
Có gia đình
Có gia đình

Nhóm
A
A
A
B
B
B
B
B

Ký hiệu : Q: Quốc tịch, V: Vóc dáng, G: Gia cảnh

Ma trận phân biệt:

O1
O2
O3
O4
O5
O6
O7
O8

O1

O2

O3

O4

O5

O6

O7



Q
V,G
V,Q
V,Q,G
G


V,Q
Q,G
Q
Q,G
V,Q,G

V,Q
G
Q

Q,G
V,G







O8

Từ ma trận phân biệt, ta có hàm phân biệt:
F(V,Q,G) = Q(VG) (VQ) (VQG) G(QG)
Sử dụng luật hút: p(pq) = p, ta có:

12

13

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Q(VQ) = Q
Q(VQG) = Q
G(VG) = G
G(QG) = G
Vậy: F(V,Q,G) = QG

Reduct: {Q,G}

Tìm luật từ reduct: {Q,G}

Đặt: O = {O1,O2,…,O8}
X1 = {Oi : Nhóm = A, i=1..8} = {O1,O2,O3}
X2 = {Oi : Nhóm = B, i=1..8} = {O4,O5,O6,O7,O8}

Xét phân họach O/Q = { {O1,O3,O5,O8},{O2},{O4,O6,O7}}
Lower(X1,Q) = {O2}
Lower(X2,Q) ={O4,O6,O7}
k= (|Lower(X1,Q)| + |Lower(X2,Q)|)/|O| = 4/8 < 1
Nên ta có luật phân lớp không đúng chính xác 100%: Q=>D (với D ={Nhóm})

Xét phân hoạch O/G = {{O1,O2,O3,O4,O6},{O5,O7,O8}}:
Lower(X1,G) = {O2}= {}
Lower(X2,G) ={O5,O7,O8}
k= (|Lower(X1,G)| + |Lower(X2,G)|)/|O| = 3/8 < 1
Nên ta có luật phân lớp không đúng chính xác 100%: G =>D

Xét phân hoạch O/QG = {{O1,O3},{O5,O8},{O2},{O4,O6},{O7}}: {O4,O5,O6,O7,O8}
Lower(X1,QG) = {O1,O2,O3}
Lower(X2,QG) = {O4,O5,O6,O7,O8}

13

14

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

k= (|Lower(X1,QG)| + |Lower(X2,QG)|)/|O| = 8/8 = 1
Nên ta có luật phân lớp đúng chính xác 100%: QG =>D

Các luật phân lớp có số thuộc tính vế trái nhỏ nhất:

Từ Q=>D, ta có các luật phân lớp:
L1: Nếu có Quốc tịch Pháp thì thuộc về nhóm A ({O2})
L2: Nếu có Quốc tịch Ý thì thuộc về nhóm B ({O4,O6,O7})

Từ G=>D, ta có các luật phân lớp:
L3: Nếu Có gia đình thì thuộc nhóm B ({O5,O7,O8})

14

15

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

ĐỀ 2
ĐỀ THI DATA MINING KHÓA 2
Câu 1:
1

2
3
4
5
6
7

Kích thước
Vừa
Nhỏ
Nhỏ
Lớn
Lớn
Lớn
Lớn

Màu sắc
Xanh
Đỏ
Đỏ
Đỏ
Lục
Đỏ
Lục

Hình dạng
Viên gạch
Hình nêm
Hình cầu
Hình nêm

Hình trụ
Hình trụ
Hình cầu

Lớp
A
B
A
B
A
B
A

a) Tính các reduce tương đối của bảng quyết định trên.
b) Tìm các luật phân lớp được tạo lập dựa trên các reduce tương đối tìm được trong câu a)

Câu 2:
Bài tập về tập mặt hàng và tập giao tác I = {i1,…….i8}, O = {o1,…..o6}

o1={i1,i7,8}
o2={i1,i2,i6,i7,i8}
o3={i1,i2,i6,i7}
o4={i1,i7,i8}
o5={i3,i4,i5,i6,i8}
o6={i1,i4,i5}
Tìm ngữ cảnh khai thác dữ liệu được tạo từ I, O.
Tìm tất cả các tập phổ biến theo ngưỡng minsupp=0,3
Tìm tất cả các tập phổ biến tối đại theo ngưỡng minsupp=0,3
Tìm tất cả các luật kết hợp hợp lệ theo ngưỡng minsupp=0,3 và ngưỡng minconf=1 được
tạo từ các tập phổ biến tối đại của câu 2c.

e. Anh chị có suy nghĩ gì về một thuật toán tìm tập phổ biến tối đại.
a.
b.
c.
d.

GIẢI ĐỀ THI KHOA 2
CÂU 1:
a).Tính các Reduct tương đối của bảng quyết định trên
Ký hiệu:
a: kích thước

15

16

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

b: màu sắc
c: hình dáng
Ta được ma trận phân biệt như sau:

1
2
3
4
5
6
7

1

2

3

4

5

6

7

abc

abc

abc

c

abc

abc

ac

ac

bc

bc

b

bc

Từ ma trận phan biệt ta có hàm phân:
F(a,b,c) = (abc)c(ac)(bc)b
Sử dụng luật hút : (ab)a = a
(abc)c = c
Ta được:
F(a,b,c) = (b  c)
Vậy Reduct: {b, c} hay {Màu sắc, Hình dạng}
b).Tìm các luật phân lớp được tạo lập dựa trên Reduct tương đối tìm được trong câu a.
1 Tính R dương của D
o Tính U/D
U/D = {X1, X2} với X1={1, 3, 5, 7}; X2={2, 4, 6}
o Tính U/R
U/R={{1}, {2, 4, 6}, {3}, {5}, {7}}
o Tính R dương của D
R duơng của D = RX1  RX2 = {1, 3, 5, 7}  {2, 4, 6} = U
1 Lấy một phần tử A của U/R ghép với 1 phần tử B thuộc U/D

1

2
3
4
5
6
7
8

A, B
{1}, {1, 3, 5, 7}
{1}, {2, 4, 6}
{2, 4, 6}, {1,3,5,7}
{2,4,6}, {2,4,6}
{3}, {1,3,5,7}
{3}, {2,4,6}
{5}, {1,3,5,7}
{5}, {2,4,6}

AB
{1}
{}
{}
{2,4,6}
{3}
{}
{5}
{}

AB<>
yes

no
no
yes
yes
no
yes
no

AB
yes
no
no
yes
yes
no
yes
no

Kết quả
có luật conf=1
không có luật
không có luật
có luật conf=1
có luật conf=1
không có luật
có luật conf=1
không có luật

16

17

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

9
10

{7}, {1,3,5,7}
{7}, {2,4,6}

{7}
{}

yes
no

yes
no

có luật cong=1
không có luật

2 Vậy ta có các luật phân lớp như sau:
1.Nếu Màu sắc = Xanh và Hình dạng = Viên gạch  Lớp A
2.Nếu Màu sắc = Đỏ và Hình dạng = Hình nêm  Lớp B
3.Nếu Màu sắc = Đỏ và Hình dạng = Hình cầu  Lớp A
4.Nếu Màu sắc = Lục và Hình dạng = Trụ  Lớp A
5.Nếu Màu sắc = Lục và Hình dạng = Hình cầu  Lớp B
CÂU 2:

a.Tìm ngữ cảnh khai thác dữ liệu được tạo từ I, O
Ta có bối cảnh nhị phân
i1
1
1
1
1
0
1

O1
O2
O3
O4
O5
O6

i2
0
1
1
0
0
0

i3
0
0
0
0

1
0

i4
0
0
0
0
1
1

i5
0
0
0
0
1
1

i6
0
1
1
0
1
0

i7
1
1

1
1
0
0

i8
1
1
0
1
1
0

b.Tìm các tập phổ biến theo ngưỡng minsupp=0.3
Với minsupp=0.3 số dòng là 6*0.3=1.8 hay 2 dòng
Suy ra F1 = {{i1}, {i2}, {i4}, {i5}, {i6}, {i7}, {i8}}
Tính C1

i1
i2
i4
i5
i6
i7
i8

i1

i2

i4

i5

i6

i7

i1,i2
i1,i4
i1,i5
i1,i6
i1.i7
i1,i8

i2,i4
i2,i5
i2,i6
i2,i7
i2,i8

i4,i5
i4,i6
i4,i7
i4,i8

i5,i6
i5,i7
i5,i8

i6,i7
i6,i8

i7,i8

i8

Tu C1 tinh F2
C1 = {{i1,i2}, {i1,i4}, {i1,i5}, {i1,i6}, {i1,i7}, {i1,8}, {i2,i4}, {i2,i5}, {i2,i6}, {i2, i7}, {i2,i8},
{i4,i5}, {i4,i6}, {i4,i7}, {i4,i8}, {i5,i6}, {i5,i7}, {i5,i8}, {i6,i7}, {i6,i8}, {i7,i8}}
F2 = {{i1,i2}, {i1,i6}, {i1,i7}, {i1,i8}, {i2,i6}, {i2,i7}, {i4,i5}, {i6,i7}, {i6,i8}, {i7,i8}}

17

18

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

{i1,i2}
{i1,i6}
{i1,i7}
{i1,i8}
{i2,i6}
{i2,i7}
{i4,i5}
{i6,i7}
{i6,i8}
{i7,i8}

{i1,i2}

{i1,i6}

{i1,i7}

{i1,i8}

{i2,i6}

{i2,i7}

{i4,i5}

{i6,i7}

{i6,i8}

{i1,i2,i6}
{i1,i2,i7}
{i1,i2,i8}
{i1,i2,i6}
{i1.i2,i7}
{i1,i2,i4,i5}
{i1,i2,i6,i7}
{i1,i2,i6,i8}
{i1,i2,i7,i8}

{i1,i6,i7}
{i1,i6,i8}

{i1,i2,i6}
{i1,i2,i6,i7}
{i1,i4,i5,i6}
{i1,i6,i7}
{i1,i6,i8}
{i1,i6,i7,i8}

{i1,i7,i8}
{i1,i2,i6,i7}
{i1,i2,i7}
{i1,i4,i5,i7}
{i1,i6,i7}
{i1,i6,i7,i8}
{i1,i7,i8}

{i1,i2,i6,i8}
{i1,i2,i7,i8}
{i1,i4,i5,i8}
{i1,i6,i7,i8}
{i1,i6,i8}
{i1,i7,i8}

{i2,i6,i7}
{i2,i4,i5,i6}
{i2,i6,i7}
{i2,i6,i8}
{i2,i6,i7,i8}

{i2,i4,i5,i7}
{i2,i6,i7}

{i2,i6,i7,i8}
{i2,i7,i8}

{i4,i5,i6,i7}
{i4,i5,i6,i8}
{i4,i5,i7,i8}

{i6,i7,i8}
{i6,i7,i8}

{i6,i7,i8}

{i7,i8}

Tinh F3 tu C2
C2 = {{nguyen ban tren}}
F3 = {{i1,i2,i6}, {i1,i2,i7}, {i1,i6,i7}, {i1,i2,i6,i7}, {i2,i6,i7}}
c.Tìm tất cả tập phổ biến tối đại theo ngưỡng minsupp=0.3
Ta nhận thấy tập phổ cực đại chính là F3={i1,i2,i6,i7}
d.(Đến đây các bạn làm giống bài mẫu)

ĐỀ 3
Câu 1: Cho tập mặt hàng : {i1,i2,i3,i4,i5,i6} và 6 giao tác
T1={i1,i2} ; T2={i1,i2,i3}, T3={i1,i2,i5} ;
T4={t1,t2,t5,t6} ; T5 = {i3,i4,i5,i6}
1.1 Tìm tất cả các tập phổ biến có minsupp=0.3
1.2 Tìm tất cả các tập phổ biến tối đại có minsupp=0.3
1.3 Tìm tất cả các lụât kết hợp có mincof-=1.0 từ các tập phổ biến tối đại ở câu 1.2
Giải:
1.1 Tìm tất cả các tập phổ biến có minsupp=0.3

Bối cảnh nhị phân

T1
T2
T3
T4
T5

i1
1
1
1
1
0

i2
1
1
1
1
0

i3
0
1
0
0
1

i4

0
0
0
0
1

i5
0
0
1
1
1

i6
0
0
0
1
1

18

19

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

T6 1

1

1

0

0

0

Với minsupp =0,3, số dòng là 6*0,3 =1,8 hay 2 dòng
F1={{i1},{i2},{i3},{d5},{d6}}
Tính C1
i1
i1
i2
i3
i5
i6

i2

i3

i5

i6

i1,i2
i1,i3 i2,i3
i1,i5 i2,i5 i3,i5

i1,i6 i2,i6 i3,i6 i5,i6

Từ C1 tính F2:
C1={{ i1,i2}, {i1,i3}, {i1,i5},{i1,i6},{i2,i3},{i2,i5},{i2,i6},{i3,i5},{i3,i6},{i5,i6}}
F2={ {i1,i2}, {i1,i3}, {i2,i3},{i1,i5},{i2,i5},{i5,i6} }

19

20

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Tính C2
i1i2
i1i3
i2i3
i1i5
i2i5
i5i6

i1i2

i1i3

i2i3

i1i5

i2i5

i1,i2,i3
i1,i2,i3
i1,i2,i5
i1,i2,i5
i1,i2,i5,i6

i1,i2,i3
i1,i3,i5
i1,i2,i3,i5
i1,i2,i3,i5 i2,i3,i5
i1,i2,i5
i1,i3,i5,i6 i2,i3,i5,i6 i1,i5,i6 i2,i5,i6

i5i6

C2={{i1,i2,i3} ,{i1,i2,i5}, { i1,i3,i5 },{ i2,i3,i5 }{ i1,i5,i6 }{ i2,i5,i6 }}
F3={{i1,i2,i3}, {i1,i2,i5}}

Tính C3
i1i2i3

i1i2i5

i1i2i3
i1i2i5 i1,i2,i3,i5
C3={{i1,i2,i3,i5}}
F4={}
Tập phổ biến là F1, F2, F3

1.2 Tìm tất cả các tập phổ biến tối đại có minsupp=0.3
Tập phổ biến tối đại: {i1,i2,i3}, {i1,i2,i5},{i5,i6}

{i1,i2,i3}

{i1,i2}

{i1,i2,i5}

{i1,i3} {i2,i3} {i1,i5} {i2,i5} {i5,i6}

20

21

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

{i1}

{i2}

{i3}

{i4}

{i5}

{i6}

1.3 Tìm tất cả các lụât kết hợp có mincof-=1.0 từ các tập phổ biến tối đại ở câu 1.2
Tạo luật kết hợp từ các tập tối đại:
Định nghĩa  : I  O với I : tập mặt hàng và O tập giao tác
Cho S  O, (S)= { o O |  i  S, giao tác o có mặt hàng i }
Ý nghĩa (S) là tập các giao tác có chứa tất cả các mặt hàng trong S.
Cho luật kết hợp S1  S2 ,
CF(S1  S2 ) = | (S1) (S2)| / |(S1)|

Ta nhận thấy CF(S1 S2) = 1.0 khi và chỉ khi (S1)  (S2)
Lúc đó (S1) (S2) =(S1)

 Với tập phổ biến tối đại : {i1,i2,i3}
Các luật khả dĩ:
{i1} {i2,i3}
{i2} {i1,i3}
{i3} {i1,i2}
{i2,i3} {i1}
{i1,i3}  {i2}
{i1,i2}  {i3}

({i1}) = {T1,T2,T3,T4,T6}
({i2}) = {T1,T2,T3,T4,T6}

21

22

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

({i3}) = {T2,T5,T6}
({i1,i2}) = {T1,T2,T3,T4,T6}
({i1,i3}) = {T2,T6}
({i2,i3}) = {T2,T6}

Vậy ta có 2 luật thoả:
{i2,i3} {i1}
{i1,i3}  {i2}

 Với tập phổ biến tối đại : {i1,i2,i5}
Các luật khả dĩ:
{i1} {i2,i5}
{i2} {i1,i5}
{i5} {i1,i2}
{i2,i5} {i1}
{i1,i5}  {i2}
{i1,i2}  {i5}
({i5}) = {T3,T4,T5}
({i1,i5}) = {T3,T4}
({i2,i5}) = {T3,T4}

Vậy ta có 2 luật thoả:
{i2,i5} {i1}
{i1,i5}  {i2}

 Với tập phổ biến tối đại : {i5,i6}
Các luật khả dĩ:

22

23

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

{i5} {i6}
{i6} {i5}

({i6}) = {T4,T5}
Vậy ta có 1 luật thoả: {i6} {i5}
Tóm lại, có 5 luật:
{i2,i3} {i1}
{i1,i3}  {i2}
{i2,i5} {i1}
{i1,i5}  {i2}
{i6} {i5}

LUẬT KẾT HỢP
Bài 2
Cho tập các hoá đơn O={o1, o2, o3, o4, o5}, mỗi hóa đơn chứa các mặt hàng như sau:
o1={i1,i3,i4} ; o2={i1,i3,i4} ; o3={i3,i5} ; o4={i4,i5} ; o5={i2,i3,i5}
Cho ngưỡng phổ biến tối thiểu minsup=0,4 hãy:
Câu1:
Tìm các tập phổ biến tối đại theo ngưỡng minsupp=0,4
Câu2:
Tìm tất cả các luật kết hợp có độ phổ biến tối thiểu là 0,4 và độ tin cậy tối thiểu là 0,8

Lý thuyết dựa trên thuật toán tập phổ biến và luật kết hợp
Bài giải:

-Hoá đơn O={o1, o2, o3, o4, o5} : 5 giao tác hoá đơn
-Mặt hàng

{i1, i2, i3, i4, i5}

: 5 mặt hàng

23

24

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING

Ta có cơ sở dữ liệu nhị phân
i1
1
1

o1
o2
o3
o4
o5

i2

i3
1
1

1

i4
1
1

i5

1
1
1

1
1

1

Câu 1:
Tìm các tập phổ biến tối đại theo ngưỡng minsup=0,4

Ta có: Độ phổ biến của từng mặt hàng :

SP(s)= Số giao tác của S /tổng số giao tác,

Với SP(S) thuộc [0,1]

1/ Tập phổ biến 1 mặt hàng: F1=?
Ta có
SP({i1}) =2/5=0.4 = minsupp
SP({i2}) =1/5

(loại).

SP({i3}) =4/5 >0.4
SP({i4}) =3/5 >0.4
SP({i5}) =3/5 >0.4
==>F1={ {i1}, {i3}, {i4}, {i5} }

2/ Tập phổ biến 2 mặt hàng: F2=?

{i1}

{i1}
{i3}
{i4}

{i3}

{i4}

{i5}

{i1,i3}

{i1,i4}

{i1,i5}

{i3,i4}

{i3,i5}
{i4,i5}

24

BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGĐỀ 1 ĐỀ THI MÔN DATAMININGThời gian : 120 phút ( Được phép sử dụng tài liệu ) 1. Cho toàn cảnh khai thác dữ liệu như sau ( 4 điểm ) o1o2o3o4o5o6i1i2i3i4i51. 1 Tìm những tập thông dụng tối đại theo ngưỡng minsupp = 0.31.2 Tìm những luật tích hợp từ tập phổ cập tối đại với ngưỡng minconf = 1.02. Cho bảng quyết định hành động sau ( 4 điểm ) O1O2O3O4O5O6O7O8Vóc dángNhỏLớnLớnNhỏLớnLớnLớnNhỏQuốc tịchĐứcPhápĐứcĐứcĐứcGia cảnhĐộc thânĐộc thânĐộc thânĐộc thânCó gia đìnhĐộc thânCó gia đìnhCó gia đìnhNhóm2. 1 Tìm những luật phân lớp của bảng quyết định hành động trên với  Tập thuộc tính điều kiện kèm theo là { Vóc dáng, Quốc tịch, Gia cảnh }  Thuộc tính phân lớp là { Nhóm } 2.2 Tìm những reducts bảng quyết định hành động trên và liệt kê những luật phân lớp có số thuộc tính vế trái nhỏnhất3. Trình bày một ứng dụng đơn cử của CSDL dạng khối 3 chiều và nêu lên một số ít thao tác trên CSDLdạng khối mà CSDL quan hệ khó triển khai ( 2 điểm ) BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGĐỀ THI MÔN DATAMININGThời gian : 120 phút ( Được phép sử dụng tài liệu ) 4. Cho toàn cảnh khai thác dữ liệu như sau ( 4 điểm ) o1o2o3o4o5o6i1i2i3i4i54. 1 Tìm những tập thông dụng tối đại theo ngưỡng minsupp = 0.34.2 Tìm những luật phối hợp từ tập phổ cập tối đại với ngưỡng minconf = 1.05. Cho bảng quyết định hành động sau ( 4 điểm ) O1O2O3O4O5O6O7O8Vóc dángNhỏLớnLớnNhỏLớnLớnLớnNhỏQuốc tịchĐứcPhápĐứcĐứcĐứcGia cảnhĐộc thânĐộc thânĐộc thânĐộc thânCó gia đìnhĐộc thânCó gia đìnhCó gia đìnhNhóm5. 1 Tìm những luật phân lớp của bảng quyết định hành động trên với  Tập thuộc tính điều kiện kèm theo là { Vóc dáng, Quốc tịch, Gia cảnh }  Thuộc tính phân lớp là { Nhóm } 5.2 Tìm những reducts bảng quyết định hành động trên và liệt kê những luật phân lớp có số thuộc tính vế trái nhỏnhất6. Trình bày một ứng dụng đơn cử của CSDL dạng khối 3 chiều và nêu lên 1 số ít thao tác trên CSDLdạng khối mà CSDL quan hệ khó thực thi ( 2 điểm ) BÀI GIẢICâu 1 : 1.1 Tìm những tập phổ cập tối đại theo ngưỡng minsupp = 0.3 BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGTính F1 : Supp ( { i1 } ) = 4/6 = 0.66 Supp ( { i2 } ) = 3/6 = 0.5 Supp ( { i3 } ) = 3/6 = 0.5 Supp ( { i4 } ) = 4/6 = 0.66 Supp ( { i5 } ) = 3/6 = 0.5 Vậy : F1 = { { i1 }, { i2 }, { i3 }, { i4 }, { i5 } } Tính C2 từ F1 : i1i2i3i4i5i1i2i3i4i1, i2i1, i3i1, i4i1, i5i2, i3i2, i4i2, i5i3, i4i3, i5i4, i5i5C2 = { { i1, i2 }, { i1, i3 }, { i1, i4 }, { i1, i5 }, { i2, i3 }, { i2, i4 }, { i2, i5 }, { i3, i4 }, { i3, i5 }, { i4, i5 } } Từ C2 tính F2 : Supp ( { i1, i2 } ) = 2/6 = 0.3 Supp ( { i1, i3 } ) = 2/6 = 0.3 Supp ( { i1, i4 } ) = 3/6 = 0.5 Supp ( { i1, i5 } ) = 2/6 = 0.3 Supp ( { i2, i3 } ) = 0/6 = 0 < minsupp : loạiSupp ( { i2, i4 } ) = 3/6 = 0.5 Supp ( { i2, i5 } ) = 2/6 = 0.3 Supp ( { i3, i4 } ) = 1/6 = 0.17 < minsupp : loạiSupp ( { i3, i5 } ) = 1/6 = 0.17 < minsupp : loạiSupp ( { i4, i5 } ) = 2/6 = 0.3 BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGVậy : F2 = { { i1, i2 }, { i1, i3 }, { i1, i4 }, { i1, i5 }, { i2, i4 }, { i2, i5 }, { i4, i5 } } Tính C3 từ F2 : { i1, i2 } { i1, i3 } { i1, i4 } { i1, i5 } { i2, i4 } { i2, i5 } { i4, i5 } { i1, i2 } { i1, i3 } { i1, i4 } { i1, i5 } { i2, i4 } { i2, i5 } { i1, i2, i3 } { i1, i2, i4 } { i1, i2, i5 } { i1, i2, i4 } { i1, i2, i5 } { i1, i2, i4, i5 } { i1, i3, i4 } { i1, i3, i5 } { i1, i2, i3, i4 } { i1, i2, i3, i5 } { i1, i3, i4, i5 } { i1, i4, i5 } { i1, i2, i4 } { i1, i2, i4. i5 } { i1, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i5 } { i1, i4, i5 } { i2, i4, i5 } { i2, i4, i5 } { i2, i4, i5 } { i4, i5 } C3 = { { i1, i2, i3 }, { i1, i2, i4 }, { i1, i2, i5 }, { i1, i3, i4 }, { i1, i3, i5 }, { i1, i4, i5 }, { i2, i4, i5 } } Từ C3 tính F3 : Theo nguyên tắc Apriori, ta loại những tập sau : Loại { i1, i2, i3 } vì { i2, i3 } không có trong F2Loại { i1, i3, i4 } vì { i3, i4 } không có trong F2Loại { i1, i3, i5 } vì { i3, i5 } không có trong F2Supp ( { i1, i2, i4 } } = 2/6 = 0.3 Supp ( { i1, i2, i5 } } = 2/6 = 0.3 Supp ( { i1, i4, i5 } } = 2/6 = 0.3 Supp ( { i2, i4, i5 } } = 2/6 = 0.3 Vậy : F3 = { { i1, i2, i4 }, { i1, i2, i5 }, { i1, i4, i5 }, { i2, i4, i5 } } Tính C4 từ F3 : { i1, i2, i4 } { i1, i2, i5 } { i1, i4, i5 } { i2, i4, i5 } { i1, i2, i4 } BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING { i1, i2, i5 } { i1, i4, i5 } { i2, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i4, i5 } C4 = { { i1, i2, i4, i5 } } Tính F4 : Supp ( { i1, i2, i4, i5 } ) = 2/6 = 0.3 Vậy : F4 = { { i1, i2, i4, i5 } } Tập phổ cập tối đại : { i1, i3 }, { i1, i2, i4, i5 } { i1, i2, i4, i5 } { i1, i2, i4 } { i1, i2, i5 } { i1, i2 } { i1 } { i1, i3 } { i2 } { i2, i4 } { i3 } { i1, i4 } { i2, i4, i5 } { i1, i4, i5 } { i2, i5 } { i1, i5 } { i4 } { i4, i5 } { i5 } 1.2 Tìm những luật tích hợp từ tập phổ cập tối đại với ngưỡng minconf = 1.0 Định nghĩa : cho I : tập những item, O : tập những giao tác. Ta định nghĩa ánh xạ  : I   O, khi đó S  I thì :  ( S ) = { o |  i  S,  ( i ) = o }, ie. tập những giao tác có chứa S.Cho luật phối hợp S1 => S2. Conf ( S1 => S2 ) = |  ( S1 )   ( S2 ) | / |  ( S1 ) |. BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGConf ( S1 => S2 ) = 1.0 khi và chỉ khi  ( S1 )   ( S2 ) vì  ( S1 )   ( S2 ) =  ( S1 ). – Xét tập phổ cập tối đại { i1, i3 }, những luật tích hợp khả dĩ là : i1 => i2 và i2 => i1. Ta có :  ( i1 ) = { o1, o2, o4, o6 },  ( i2 ) = { o4, o5, o6 }, nên :  ( i1 )   ( i2 ) và  ( i2 )   ( i1 ) Do đó i1 => i2 và i2 => i1 không là luật tích hợp. – Xét tập thông dụng tối đại { i1, i2, i4, i5 } : Luật : S1 => S2 { i1 } => { i2, i4, i5 } { i2, i4, i5 } => { i1 } { i1, i2 } => { i4, i5 } { i4, i5 } => { i1, i2 } { i1, i4 } => { i2, i5 } { i2, i5 } => { i1, i4 } { i1, i5 } => { i2, i4 } { i2, i4 } => { i1, i5 } { i1, i2, i4 } => { i5 } { i5 } => { i1, i2, i4 } { i1, i2, i5 } => { i4 } { i4 } => { i1, i2, i5 } { i1, i4, i5 } => { i2 } { i2 } => { i1, i4, i5 }  ( S1 ) { o1, o2, o4, o6 } { o4, o6 } { o4, o6 ) } { o4, o6 } { o1, o4, o6 } { o4, o5, o6 } { o4, o6 } { o4, o5, o6 } { o4, o6 } { o3, o4, o6 } { o4, o6 } { o1, o4, o5, o6 } { o4, o6 } { o4, o5, o6 }  ( S2 ) { o4, o6 } { o1, o2, o4, o6 } { o4, o6 } { o4, o6 } { o4, o5, o6 } { o1, o4, o6 } { o4, o5, o6 } { o4, o6 } { o3, o4, o6 } { o4, o6 } { o1, o4, o5, o6 } { o4, o6 } { o4, o5, o6 } { o4, o6 }  ( S1 )   ( S2 ) Ta có những luật phối hợp : L1 : { i2, i4, i5 } => { i1 } L2 : { i1, i2 } => { i4, i5 } L3 : { i4, i5 } => { i1, i2 } L4 : { i1, i5 } => { i2, i4 } L5 : { i1, i2, i4 } => { i5 } L6 : { i1, i2, i5 } => { i4 } L7 : { i1, i4, i5 } => { i2 } Câu 2 : 2.1 Tìm những luật phân lớp của bảng quyết định hành động : BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGO1O2O3O4O5O6O7O8Vóc dángNhỏLớnLớnNhỏLớnLớnLớnNhỏQuốc tịchĐứcPhápĐứcĐứcĐứcGia cảnhĐộc thânĐộc thânĐộc thânĐộc thânCó gia đìnhĐộc thânCó gia đìnhCó gia đìnhNhómĐặt : P = A, N = B ; p : số thành phần thuộc lớp P, p = 3 ; n : số thành phần thuộc lớp N, n = 5 ; Ta có : I ( p, n ) = I ( 3,5 ) = – 3/8 * log23 / 8-5 / 8 * log25 / 8 = 0.954 Tính độ lợi thông tin cho những thuộc tính điều kiện kèm theo : Vóc dángNhỏLớnpiniI ( pi, ni ) 0.920.97 E ( Vóc dáng ) = 3/8 * I ( 1,2 ) + 5/8 * I ( 2,3 ) = 3/8 * 0.92 + 5/8 * 0.97 = 0.951 G ( Vóc dáng ) = I ( p, n ) – E ( Vóc dáng ) = 0.954 – 0.951 = 0.003 Quốc tịchĐứcPháppiniI ( pi, ni ) E ( Quốc tịch ) = 4/8 * I ( 2,2 ) + 1/8 * I ( 1,0 ) + 3/8 * I ( 0,3 ) = 4/8 * 1 = 0.5 G ( Quốc tịch ) = I ( p, n ) – E ( Quốc tịch ) = 0.954 – 0.5 = 0.454 BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGGia cảnhĐộc thânCó gia đìnhpiniI ( pi, ni ) 0.97 E ( Gia cảnh ) = 5/8 * I ( 3,2 ) + 3/8 * I ( 0,3 ) = 5/8 * 0.97 = 0.606 G ( Gia cảnh ) = I ( p, n ) – E ( Gia cảnh ) = 0.954 – 0.606 = 0.348 Thuộc tính Quốc tịch có độ lợi thông tin lớn nhất, nên được chọn để phân lớp : Quốc tịchĐứcPhápO1, O3, O5, O8O2O4, O6, O7 ( Gạch duới : thuộc lớp A, Không gạch dưới : thuộc lớp B ) Phân lớp nhóm Quốc tịch – Đức : Bảng dữ liệu còn lại : O1O3O5O8Vóc dángNhỏLớnLớnNhỏGia cảnhĐộc thânĐộc thânCó gia đìnhCó gia đìnhNhómTa có : I ( p, n ) = – 2/4 * log22 / 4-2 / 4 * log22 / 4 = 110B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGVóc dángNhỏLớnpiniI ( pi, ni ) E ( Vóc dáng ) = 2/4 * I ( 1,1 ) + 2/4 * I ( 1,1 ) = 2/4 * 1 + 2/4 * 1 = 1G ( Vóc dáng ) = I ( p, n ) – E ( Vóc dáng ) = 1 – 1 = 0G ia cảnhĐộc thânCó gia đìnhpiniI ( pi, ni ) E ( Gia cảnh ) = 0G ( Gia cảnh ) = 1T huộc tính Gia cảnh được chọn để phân lớp : Quốc tịchĐứcO1, O3, O5, O8Độc thânO1, O3PhápGia cảnhO2O4, O6, O7Có gia đìnhO5, O81011BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGCây quyết định hành động : Quốc tịchĐứcGia cảnhĐộc thânPhápCó gia đìnhCác luật phân lớp : L1 : Nếu có Quốc tịch Đức và Gia cảnh Độc thân thì thuộc về nhóm AL2 : Nếu có Quốc tịch Đức và Gia cảnh Có mái ấm gia đình thì thuộc về nhóm BL3 : Nếu có Quốc tịch Pháp thì thuộc về nhóm AL4 : Nếu có Quốc tịch Ý thì thuộc về nhóm B1112BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGRút gọn luật : Các luật trên đều không dư thừa. 2.2 Tìm những reducts bảng quyết định hành động trên và liệt kê những luật phân lớp có số thuộc tính vế trái nhỏ nhấtQuốc tịchĐứcPhápĐứcĐứcĐứcVóc dángNhỏLớnLớnNhỏLớnLớnLớnNhỏO1O2O3O4O5O6O7O8Gia cảnhĐộc thânĐộc thânĐộc thânĐộc thânCó gia đìnhĐộc thânCó gia đìnhCó gia đìnhNhómKý hiệu : Q. : Quốc tịch, V : Vóc dáng, G : Gia cảnhMa trận phân biệt : O1O2O3O4O5O6O7O8O1O2O3O4O5O6O7V, GV, QV, Q., GV, QQ, GQ, GV, Q., GV, QQ, GV, GO8Từ ma trận phân biệt, ta có hàm phân biệt : F ( V, Q., G ) = Q  ( V  G )  ( V  Q )  ( V  Q  G )  G  ( Q  G ) Sử dụng luật hút : p  ( p  q ) = p, ta có : 1213B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGQ  ( V  Q ) = QQ  ( V  Q  G ) = QG  ( V  G ) = GG  ( Q  G ) = GVậy : F ( V, Q., G ) = Q  GReduct : { Q., G } Tìm luật từ reduct : { Q., G } Đặt : O = { O1, O2, …, O8 } X1 = { Oi : Nhóm = A, i = 1 .. 8 } = { O1, O2, O3 } X2 = { Oi : Nhóm = B, i = 1 .. 8 } = { O4, O5, O6, O7, O8 } Xét phân hoạch O / Q. = { { O1, O3, O5, O8 }, { O2 }, { O4, O6, O7 } } Lower ( X1, Q. ) = { O2 } Lower ( X2, Q. ) = { O4, O6, O7 } k = ( | Lower ( X1, Q. ) | + | Lower ( X2, Q. ) | ) / | O | = 4/8 < 1N ên ta có luật phân lớp không đúng đúng chuẩn 100 % : Q => D ( với D = { Nhóm } ) Xét phân hoạch O / G = { { O1, O2, O3, O4, O6 }, { O5, O7, O8 } } : Lower ( X1, G ) = { O2 } = { } Lower ( X2, G ) = { O5, O7, O8 } k = ( | Lower ( X1, G ) | + | Lower ( X2, G ) | ) / | O | = 3/8 < 1N ên ta có luật phân lớp không đúng đúng mực 100 % : G => DXét phân hoạch O / QG = { { O1, O3 }, { O5, O8 }, { O2 }, { O4, O6 }, { O7 } } : { O4, O5, O6, O7, O8 } Lower ( X1, QG ) = { O1, O2, O3 } Lower ( X2, QG ) = { O4, O5, O6, O7, O8 } 1314B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGk = ( | Lower ( X1, QG ) | + | Lower ( X2, QG ) | ) / | O | = 8/8 = 1N ên ta có luật phân lớp đúng đúng mực 100 % : QG => DCác luật phân lớp có số thuộc tính vế trái nhỏ nhất : Từ Q => D, ta có những luật phân lớp : L1 : Nếu có Quốc tịch Pháp thì thuộc về nhóm A ( { O2 } ) L2 : Nếu có Quốc tịch Ý thì thuộc về nhóm B ( { O4, O6, O7 } ) Từ G => D, ta có những luật phân lớp : L3 : Nếu Có mái ấm gia đình thì thuộc nhóm B ( { O5, O7, O8 } ) 1415B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGĐỀ 2 ĐỀ THI DATA MINING KHÓA 2C âu 1 : Kích thướcVừaNhỏNhỏLớnLớnLớnLớnMàu sắcXanhĐỏĐỏĐỏLụcĐỏLụcHình dạngViên gạchHình nêmHình cầuHình nêmHình trụHình trụHình cầuLớpa ) Tính những reduce tương đối của bảng quyết định hành động trên. b ) Tìm những luật phân lớp được tạo lập dựa trên những reduce tương đối tìm được trong câu a ) Câu 2 : Bài tập về tập mẫu sản phẩm và tập giao tác I = { i1, … …. i8 }, O = { o1, … .. o6 } o1 = { i1, i7, 8 } o2 = { i1, i2, i6, i7, i8 } o3 = { i1, i2, i6, i7 } o4 = { i1, i7, i8 } o5 = { i3, i4, i5, i6, i8 } o6 = { i1, i4, i5 } Tìm ngữ cảnh khai thác dữ liệu được tạo từ I, O.Tìm tổng thể những tập phổ cập theo ngưỡng minsupp = 0,3 Tìm toàn bộ những tập phổ cập tối đại theo ngưỡng minsupp = 0,3 Tìm tổng thể những luật tích hợp hợp lệ theo ngưỡng minsupp = 0,3 và ngưỡng minconf = 1 đượctạo từ những tập phổ cập tối đại của câu 2 c. e. Anh chị có tâm lý gì về một thuật toán tìm tập phổ cập tối đại. a. b. c. d. GIẢI ĐỀ THI KHOA 2C ÂU 1 : a ). Tính những Reduct tương đối của bảng quyết định hành động trênKý hiệu : a : kích thước1516BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGb : màu sắcc : hình dángTa được ma trận phân biệt như sau : abcabcabcabcabcacacbcbcbcTừ ma trận phan biệt ta có hàm phân : F ( a, b, c ) = ( a  b  c )  c  ( a  c )  ( b  c )  bSử dụng luật hút : ( a  b )  a = a ( a  b  c )  c = cTa được : F ( a, b, c ) = ( b  c ) Vậy Reduct : { b, c } hay { Màu sắc, Hình dạng } b ). Tìm những luật phân lớp được tạo lập dựa trên Reduct tương đối tìm được trong câu a. 1 Tính R dương của Do Tính U / DU / D = { X1, X2 } với X1 = { 1, 3, 5, 7 } ; X2 = { 2, 4, 6 } o Tính U / RU / R = { { 1 }, { 2, 4, 6 }, { 3 }, { 5 }, { 7 } } o Tính R dương của DR dương của D = RX1  RX2 = { 1, 3, 5, 7 }  { 2, 4, 6 } = U1 Lấy một thành phần A của U / R ghép với 1 thành phần B thuộc U / DA, B { 1 }, { 1, 3, 5, 7 } { 1 }, { 2, 4, 6 } { 2, 4, 6 }, { 1,3,5,7 } { 2,4,6 }, { 2,4,6 } { 3 }, { 1,3,5,7 } { 3 }, { 2,4,6 } { 5 }, { 1,3,5,7 } { 5 }, { 2,4,6 } A  B { 1 } { } { } { 2,4,6 } { 3 } { } { 5 } { } A  B < >  yesnonoyesyesnoyesnoA  ByesnonoyesyesnoyesnoKết quảcó luật conf = 1 không có luậtkhông có luậtcó luật conf = 1 có luật conf = 1 không có luậtcó luật conf = 1 không có luật1617BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING10 { 7 }, { 1,3,5,7 } { 7 }, { 2,4,6 } { 7 } { } yesnoyesnocó luật cong = 1 không có luật2 Vậy ta có những luật phân lớp như sau : 1. Nếu Màu sắc = Xanh và Hình dạng = Viên gạch  Lớp A2. Nếu Màu sắc = Đỏ và Hình dạng = Hình nêm  Lớp B3. Nếu Màu sắc = Đỏ và Hình dạng = Hình cầu  Lớp A4. Nếu Màu sắc = Lục và Hình dạng = Trụ  Lớp A5. Nếu Màu sắc = Lục và Hình dạng = Hình cầu  Lớp BCÂU 2 : a. Tìm ngữ cảnh khai thác dữ liệu được tạo từ I, OTa có toàn cảnh nhị phâni1O1O2O3O4O5O6i2i3i4i5i6i7i8b. Tìm những tập thông dụng theo ngưỡng minsupp = 0.3 Với minsupp = 0.3 số dòng là 6 * 0.3 = 1.8 hay 2 dòngSuy ra F1 = { { i1 }, { i2 }, { i4 }, { i5 }, { i6 }, { i7 }, { i8 } } Tính C1i1i2i4i5i6i7i8i1i2i4i5i6i7i1, i2i1, i4i1, i5i1, i6i1. i7i1, i8i2, i4i2, i5i2, i6i2, i7i2, i8i4, i5i4, i6i4, i7i4, i8i5, i6i5, i7i5, i8i6, i7i6, i8i7, i8i8Tu C1 tinh F2C1 = { { i1, i2 }, { i1, i4 }, { i1, i5 }, { i1, i6 }, { i1, i7 }, { i1, 8 }, { i2, i4 }, { i2, i5 }, { i2, i6 }, { i2, i7 }, { i2, i8 }, { i4, i5 }, { i4, i6 }, { i4, i7 }, { i4, i8 }, { i5, i6 }, { i5, i7 }, { i5, i8 }, { i6, i7 }, { i6, i8 }, { i7, i8 } } F2 = { { i1, i2 }, { i1, i6 }, { i1, i7 }, { i1, i8 }, { i2, i6 }, { i2, i7 }, { i4, i5 }, { i6, i7 }, { i6, i8 }, { i7, i8 } } 1718B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING { i1, i2 } { i1, i6 } { i1, i7 } { i1, i8 } { i2, i6 } { i2, i7 } { i4, i5 } { i6, i7 } { i6, i8 } { i7, i8 } { i1, i2 } { i1, i6 } { i1, i7 } { i1, i8 } { i2, i6 } { i2, i7 } { i4, i5 } { i6, i7 } { i6, i8 } { i1, i2, i6 } { i1, i2, i7 } { i1, i2, i8 } { i1, i2, i6 } { i1. i2, i7 } { i1, i2, i4, i5 } { i1, i2, i6, i7 } { i1, i2, i6, i8 } { i1, i2, i7, i8 } { i1, i6, i7 } { i1, i6, i8 } { i1, i2, i6 } { i1, i2, i6, i7 } { i1, i4, i5, i6 } { i1, i6, i7 } { i1, i6, i8 } { i1, i6, i7, i8 } { i1, i7, i8 } { i1, i2, i6, i7 } { i1, i2, i7 } { i1, i4, i5, i7 } { i1, i6, i7 } { i1, i6, i7, i8 } { i1, i7, i8 } { i1, i2, i6, i8 } { i1, i2, i7, i8 } { i1, i4, i5, i8 } { i1, i6, i7, i8 } { i1, i6, i8 } { i1, i7, i8 } { i2, i6, i7 } { i2, i4, i5, i6 } { i2, i6, i7 } { i2, i6, i8 } { i2, i6, i7, i8 } { i2, i4, i5, i7 } { i2, i6, i7 } { i2, i6, i7, i8 } { i2, i7, i8 } { i4, i5, i6, i7 } { i4, i5, i6, i8 } { i4, i5, i7, i8 } { i6, i7, i8 } { i6, i7, i8 } { i6, i7, i8 } { i7, i8 } Tinh F3 tu C2C2 = { { nguyen ban tren } } F3 = { { i1, i2, i6 }, { i1, i2, i7 }, { i1, i6, i7 }, { i1, i2, i6, i7 }, { i2, i6, i7 } } c. Tìm tổng thể tập phổ cập tối đại theo ngưỡng minsupp = 0.3 Ta nhận thấy tập phổ cực lớn chính là F3 = { i1, i2, i6, i7 } d. ( Đến đây những bạn làm giống bài mẫu ) ĐỀ 3C âu 1 : Cho tập mẫu sản phẩm : { i1, i2, i3, i4, i5, i6 } và 6 giao tácT1 = { i1, i2 } ; T2 = { i1, i2, i3 }, T3 = { i1, i2, i5 } ; T4 = { t1, t2, t5, t6 } ; T5 = { i3, i4, i5, i6 } 1.1 Tìm tổng thể những tập phổ cập có minsupp = 0.31.2 Tìm toàn bộ những tập phổ cập tối đại có minsupp = 0.31.3 Tìm toàn bộ những lụât tích hợp có mincof – = 1.0 từ những tập phổ cập tối đại ở câu 1.2 Giải : 1.1 Tìm toàn bộ những tập phổ cập có minsupp = 0.3 Bối cảnh nhị phânT1T2T3T4T5i1i2i3i4i5i61819BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGT6 1V ới minsupp = 0,3, số dòng là 6 * 0,3 = 1,8 hay 2 dòngF1 = { { i1 }, { i2 }, { i3 }, { d5 }, { d6 } } Tính C1i1i1i2i3i5i6i2i3i5i6i1, i2i1, i3 i2, i3i1, i5 i2, i5 i3, i5i1, i6 i2, i6 i3, i6 i5, i6Từ C1 tính F2 : C1 = { { i1, i2 }, { i1, i3 }, { i1, i5 }, { i1, i6 }, { i2, i3 }, { i2, i5 }, { i2, i6 }, { i3, i5 }, { i3, i6 }, { i5, i6 } } F2 = { { i1, i2 }, { i1, i3 }, { i2, i3 }, { i1, i5 }, { i2, i5 }, { i5, i6 } } 1920B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGTính C2i1i2i1i3i2i3i1i5i2i5i5i6i1i2i1i3i2i3i1i5i2i5i1, i2, i3i1, i2, i3i1, i2, i5i1, i2, i5i1, i2, i5, i6i1, i2, i3i1, i3, i5i1, i2, i3, i5i1, i2, i3, i5 i2, i3, i5i1, i2, i5i1, i3, i5, i6 i2, i3, i5, i6 i1, i5, i6 i2, i5, i6i5i6C2 = { { i1, i2, i3 }, { i1, i2, i5 }, { i1, i3, i5 }, { i2, i3, i5 } { i1, i5, i6 } { i2, i5, i6 } } F3 = { { i1, i2, i3 }, { i1, i2, i5 } } Tính C3i1i2i3i1i2i5i1i2i3i1i2i5 i1, i2, i3, i5C3 = { { i1, i2, i3, i5 } } F4 = {  } Tập phổ cập là F1, F2, F31. 2 Tìm toàn bộ những tập thông dụng tối đại có minsupp = 0.3 Tập thông dụng tối đại : { i1, i2, i3 }, { i1, i2, i5 }, { i5, i6 } { i1, i2, i3 } { i1, i2 } { i1, i2, i5 } { i1, i3 } { i2, i3 } { i1, i5 } { i2, i5 } { i5, i6 } 2021B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING { i1 } { i2 } { i3 } { i4 } { i5 } { i6 } 1.3 Tìm tổng thể những lụât phối hợp có mincof – = 1.0 từ những tập thông dụng tối đại ở câu 1.2 Tạo luật tích hợp từ những tập tối đại : Định nghĩa  : I  O với I : tập loại sản phẩm và O tập giao tácCho S  O,  ( S ) = { o  O |  i  S, giao tác o có mặt hàng i } Ý nghĩa  ( S ) là tập những giao tác có chứa tổng thể những mẫu sản phẩm trong S.Cho luật phối hợp S1  S2, CF ( S1  S2 ) = |  ( S1 )   ( S2 ) | / |  ( S1 ) | Ta nhận thấy CF ( S1  S2 ) = 1.0 khi và chỉ khi  ( S1 )   ( S2 ) Lúc đó  ( S1 )   ( S2 ) =  ( S1 )  Với tập phổ cập tối đại : { i1, i2, i3 } Các luật khả dĩ : { i1 }  { i2, i3 } { i2 }  { i1, i3 } { i3 }  { i1, i2 } { i2, i3 }  { i1 } { i1, i3 }  { i2 } { i1, i2 }  { i3 }  ( { i1 } ) = { T1, T2, T3, T4, T6 }  ( { i2 } ) = { T1, T2, T3, T4, T6 } 2122B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING  ( { i3 } ) = { T2, T5, T6 }  ( { i1, i2 } ) = { T1, T2, T3, T4, T6 }  ( { i1, i3 } ) = { T2, T6 }  ( { i2, i3 } ) = { T2, T6 } Vậy ta có 2 luật thỏa : { i2, i3 }  { i1 } { i1, i3 }  { i2 }  Với tập phổ cập tối đại : { i1, i2, i5 } Các luật khả dĩ : { i1 }  { i2, i5 } { i2 }  { i1, i5 } { i5 }  { i1, i2 } { i2, i5 }  { i1 } { i1, i5 }  { i2 } { i1, i2 }  { i5 }  ( { i5 } ) = { T3, T4, T5 }  ( { i1, i5 } ) = { T3, T4 }  ( { i2, i5 } ) = { T3, T4 } Vậy ta có 2 luật thỏa : { i2, i5 }  { i1 } { i1, i5 }  { i2 }  Với tập thông dụng tối đại : { i5, i6 } Các luật khả dĩ : 2223B ÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MINING { i5 }  { i6 } { i6 }  { i5 }  ( { i6 } ) = { T4, T5 } Vậy ta có 1 luật thỏa : { i6 }  { i5 } Tóm lại, có 5 luật : { i2, i3 }  { i1 } { i1, i3 }  { i2 } { i2, i5 }  { i1 } { i1, i5 }  { i2 } { i6 }  { i5 } LUẬT KẾT HỢPBài 2C ho tập những hóa đơn O = { o1, o2, o3, o4, o5 }, mỗi hóa đơn chứa những mẫu sản phẩm như sau : o1 = { i1, i3, i4 } ; o2 = { i1, i3, i4 } ; o3 = { i3, i5 } ; o4 = { i4, i5 } ; o5 = { i2, i3, i5 } Cho ngưỡng thông dụng tối thiểu minsup = 0,4 hãy : Câu1 : Tìm những tập thông dụng tối đại theo ngưỡng minsupp = 0,4 Câu2 : Tìm tổng thể những luật tích hợp có độ phổ cập tối thiểu là 0,4 và độ đáng tin cậy tối thiểu là 0,8 Lý thuyết dựa trên thuật toán tập phổ cập và luật kết hợpBài giải : – Hóa đơn O = { o1, o2, o3, o4, o5 } : 5 giao tác hóa đơn-Mặt hàng { i1, i2, i3, i4, i5 } : 5 mặt hàng2324BÀI TẬP VÀ ĐỀ THI KHAI PHÁ DỮ LIỆU – DATA MININGTa có cơ sở dữ liệu nhị phâni1o1o2o3o4o5i2i3i4i5Câu 1 : Tìm những tập phổ cập tối đại theo ngưỡng minsup = 0,4 Ta có : Độ phổ cập của từng loại sản phẩm : SP ( s ) = Số giao tác của S / tổng số giao tác, Với SP ( S ) thuộc [ 0,1 ] 1 / Tập thông dụng 1 mẫu sản phẩm : F1 = ? Ta cóSP ( { i1 } ) = 2/5 = 0.4 = minsuppSP ( { i2 } ) = 1/5 ( loại ). SP ( { i3 } ) = 4/5 > 0.4 SP ( { i4 } ) = 3/5 > 0.4 SP ( { i5 } ) = 3/5 > 0.4 ==> F1 = { { i1 }, { i3 }, { i4 }, { i5 } } 2 / Tập phổ cập 2 mẫu sản phẩm : F2 = ? { i1 } { i1 } { i3 } { i4 } { i3 } { i4 } { i5 } { i1, i3 } { i1, i4 } { i1, i5 } { i3, i4 } { i3, i5 } { i4, i5 } 24

BÀI TẬP VÀ ĐỀ THI MÔN KHAI PHÁ DỮ LIỆU DATA MINING – Tài liệu text

Bài viết liên quan
Hotline 24/7: O984.666.352
Alternate Text Gọi ngay