<< Chapter < Page Chapter >> Page >
1 2 3  B
A 
1 1 2 4
2 1 0 5
3 0 1 -1

- Đối với B thì chiến lược 2 bị trội hơn bởi chiến lược 1 vì vậy B bỏ chiến lược 2. Ta có :

1 2 3  B
A 
1 1 2 4
2 1 0 5
3 0 1 -1

Cuối cùng thì bộ chiến lược (1,1) là nghiệm tối ưu của trò chơi với kết quả là người A thu thêm được 1 (ngàn) phiếu từ người B.

Trong nhiều trường hợp, khi dùng chiến lược bị trội hơn chỉ mới giảm được cở của bài toán mà chưa giải quyết xong vấn đề đặt ra.

Chiến lược MaxiMin và MiniMax

Xét ví dụ tương tự như ví dụ trên nhưng bảng kết quả vận động được các cố vấn đánh giá như sau :

1 2 3  B
A 
1 -3 -2 6
2 1 0 2
3 5 -2 -4

Đây là trường hợp người chọn quyết định nghĩ là đối phương thông minh và cố ý chọn quyết định chống lại mình nên họ luôn nghĩ đến chiến lượt “ăn chắc” , đó là MaxiMin(A) và MiniMax(B) như sau :

a- MaxiMin(A)

A luôn xem B là đối thủ thông minh. Khi A đi nước i0 (dòng i0) thì B sẽ chọn nước đi j0 (cột j0) sao cho A thắng điểm ít nhất . Nghĩa là B đi vào ô :

a i 0 j 0 = Min j a i 0 j size 12{a rSub { size 8{i rSub { size 6{0} } j rSub { size 6{0} } } } = { ital "Min"} cSub { forall j} size 12{ left lbrace a rSub {i rSub { size 6{0} } j} right rbrace }} {}

Trong tình huống đó A sẽ chọn nước đi sao cho A thắng nhiều điểm nhất. Chiến thuật của A là đi vào ô :

g A = a i A j A = MaxiMin ( A ) = max i min j a ij size 12{g rSub { size 8{A} } =a rSub { size 8{i rSub { size 6{A} } j rSub { size 6{A} } } } ="MaxiMin " \( A \) = {"max"} cSub {i} left lbrace size 12{ {"min"} cSub {j} size 12{ left lbrace " a" rSub {"ij"} right rbrace } size 12{ }} right rbrace } {}

A đi nước 1 thì B sẽ đi nước 1: a11=-3

A đi nước 2 thì B sẽ đi nước 2 : a22=0

A đi nước 3 thì B sẽ đi nước 3 : a33=-4

1 2 3  B
A 
1 -3 -2 6
2 1 0 2
3 5 -2 -4

Vậy MaxiMin(A) = a22 = 0

b- MiniMax(B)

B luôn xem A là đối thủ thông minh. Khi B đi nước j0 (cột j0) thì A sẽ chọn nước đi i0 (dòng i0) sao cho B thua điểm nhiều nhất . Nghĩa là A đi vào ô

a i 0 j 0 = max i a ij 0 size 12{a rSub { size 8{i rSub { size 6{0} } j rSub { size 6{0} } } } = {"max"} cSub { forall i} size 12{ left lbrace " a" rSub { ital "ij" rSub { size 6{0} } } right rbrace }} {}

Trong tình huống đó B sẽ chọn nước đi sao cho B thua ít điểm nhất. Chiến thuật của B là đi vào ô :

g B = a i B j B = M iniMax ( B ) = min j max i a ij size 12{g rSub { size 8{B} } =a rSub { size 8{i rSub { size 6{B} } j rSub { size 6{B} } } } =M"iniMax " \( B \) = {"min"} cSub {j} size 12{ left lbrace {"max"} cSub {i} size 12{ left lbrace a rSub {"ij"} right rbrace } size 12{ } right rbrace }} {}

1 2 3  B
A 
1 -3 -2 6
2 1 0 2
3 5 -2 -4

B đi nước 1 thì A sẽ đi nước 3: a31=5

B đi nước 2 thì A sẽ đi nước 2 : a22=0

B đi nước 3 thì B sẽ đi nước 1 : a13=6

Vậy MiniMax(B) = a22= 0

Lần này ta thấy rằng :

MaxiMin(A) = MiniMax(B) = a22= 0

Bộ chiến lược (2,2) có giá trị là 0 là nghiệm tối ưu của trò chơi vì nếu người nào đi lệch và người kia đi đúng thì người đi đúng thu lợi nhiều hơn giá trị của trò chơi. Nghiệm tối ưu trong trường hợp này còn được gọi là nghiệm ổn định.

Trò chơi không có nghiệm không ổn định

Xét ví dụ tương tự như trên với bảng kết quả được các chuyên gia đánh giá như sau :

1 2 3  B
A 
1 0 -2 2
2 5 4 -3
3 2 3 -4

Khi A và B dùng chiến lược MaxiMin và MiniMax của mình thì cho kết quả như sau :

MaxiMin(A) = a12 = -2

MiniMax(B) = a13 = 2

Vì MaxiMin(A) và MiniMax(B) là khác nhau nên trò chơi không có nghiệm ổn định. Ta xem điều gì có thể xảy ra ?

- A tính rằng nếu B thực hiện đúng chiến lược của mình là chọn cột 3 thì A sẽ chọn chiến lược 1 để thắng 2 từ B (thay vì thắng -2)

1 2 3  B
A 
1 0 -2 2
2 5 4 -3
3 2 3 -4

- Lúc này B sẽ suy tính và thấy rằng phải chọn chiến lược 2 để thua -2 từ A (thay vì thua 2).

1 2 3  B
A 
1 0 -2 2
2 5 4 -3
3 2 3 -4

- Đến lượt A cũng đủ thông minh để tính liền được 2 nước, biết được B sẽ chọn chiến lược 2 nên A sẽ dùng chiến lược 2 để thắng 4 từ B .

1 2 3  B
A 
1 0 -2 2
2 5 4 -3
3 2 3 -4

- Nhưng B cũng tính được điều này nên sẽ quay lại chọn chiến lược 3 để thua -3 từ A .

1 2 3  B
A 
1 0 -2 2
2 5 4 -3
3 2 3 -4

- Cũng như B , A cũng sẽ tính được điều này nên sẽ quay lại chọn chiến lược 1 để thắng 2 từ B.

1 2 3  B
A 
1 0 -2 2
2 5 4 -3
3 2 3 -4

Get Jobilize Job Search Mobile App in your pocket Now!

Get it on Google Play Download on the App Store Now




Source:  OpenStax, Quy hoạch tuyến tính. OpenStax CNX. Aug 08, 2009 Download for free at http://cnx.org/content/col10903/1.1
Google Play and the Google Play logo are trademarks of Google Inc.

Notification Switch

Would you like to follow the 'Quy hoạch tuyến tính' conversation and receive update notifications?

Ask