Lý thuyết trò chơi-cây quyết định

3633

Hầu hết các tính huống chiến lược trong lý thuyết trò chơi có nhiều lượt ra quyết định hơn, mỗi lượt lại có một vài khả năng lựa chọn và nếu chỉ lập luận miệng đơn thuần thì khó có thể theo dõi được tất cả.

Việc áp dụng thành công quy tắc nhìn xa hơn và suy luận ngược về cần một hỗ trợ trực quan hơn. “Cây quyết định” của các lựa chọn trong trò chơi là một cách hỗ trợ như vậy. Chúng tôi sẽ chỉ cho các bạn thấy sử dụng những cây đồ thị này như thế nào.

Một thứ tự các quyết định với sự cần thiết phải nhìn xa hơn và suy luận ngược về có thể phát sinh ngay cả với người ra quyết định một mình mà không tham gia vào trò chơi chiến lược với những người khác. Đối với Robert Frost trong khu rừng màu vàng thì:

Hai ngã đường tách ra trong rừng, và tôi

Tôi chọn con đường ít người đi hơn

Và chính điều này đã làm nên tất cả những gì khác biệt[1]

Đây không nhất thiết là kết cục cuối cùng của lựa chọn. Mỗi con đường có thể lại có thêm vài nhánh nữa. Sơ đồ bây giờ sẽ trở nên phức tạp hơn một cách tương ứng. Sau đây là một ví dụ từ kinh nghiệm riêng của chúng tôi.

Những người đi từ Princeton đến New York có một vài khả năng lựa chọn. Trước hết là chọn phương tiện đi lại: xe buýt, xe lửa hoặc xe hơi. Những người chọn đi xe hơi sẽ phải chọn tiếp trong số các đường đi sau: cầu Varrazano Narrows, đường hầm Hà Lan, đường hầm Lincoln và cầu George Washington.

Những người đi xe lửa phải quyết định chuyển sang tàu PATH tại ga Newark hay đi tiếp đến ga Pen. Một khi đã đến New York, nhưng người đi xe lửa và xe buýt sẽ phải chọn giữa đi bộ tiếp, đi tàu điện ngầm (tàu nhanh hoặc tàu chợ), đi xe buýt hay bắt taxi để đến được địa điểm cuối cùng. Lựa chọn tối ưu phụ thuộc vào nhiều yếu tố, bao gồm giá cả, tốc độ, dự tính về tắc đường, địa điểm cuối cùng tại New York và thậm chí cả sự khó chịu với bầu không khí trên xa lộ Hersey.

1

Sơ đồ này mô tả những lựa chọn của một người tại mỗi điểm cắt và có hình dạng giống một cái cây với những nhánh rẽ ngang liên tiếp – do vậy nó được gọi là “cây quyết định”. Cách đúng đắn để sử dụng sơ đồ hay cây đồ thị này không phải là chọn con đường có nhánh đầu tiên có vẻ tốt nhất và sau đó “đến nơi thì đi qua cầu Verrazano”.

Thay vào đó bạn phải dự tính cho cả các quyết định sau đó và sử dụng nó để đưa ra các quyết định trước đó. Chẳng hạn, nếu bạn định đến trung tâm thương mại quốc tế, tàu PATH sẽ là lựa chọn ưu việt nhất vì nó đi thẳng một mạch từ Newark.

Chúng ta có thể sử dụng chính cây đồ thị như vậy để mô tả các lựa chọn trong trò chơi chiến lược, tuy nhiên có một yếu tố mới thêm vào bức tranh. Đó là trò chơi bây giờ sẽ có từ hai người chơi trở lên. Tại các điểm mọc nhánh dọc theo đồ thị cây có thể sẽ là những người chơi khác nhau luân phiên ra quyết định.

Người chọn trước cần phải nhìn xa hơn, không chỉ cho những lựa chọn trong tương lai của anh ta mà cả lựa chọn của những người khác nữa. Anh ta phải dự đoán được những người khác sẽ làm gì bằng cách đặt mình vào địa vị của những người đó và cố đoán xem họ sẽ nghĩ gì.

Để nhắc bạn về sự khác biệt chúng tôi gọi cây đồ thị chỉ ra thứ tự cho các quyết định trong trò chơi chiến lược là cây trò chơi và giữ tên gọi cây quyết định cho những tình huống mà chỉ có một người chơi tham gia.

Câu chuyện của Charlie Brown đơn giản một cách nực cười, nhưng bạn có thể quen hơn với các cây trò chơi bằng cách dùng câu chuyện này cho hình vẽ. Bắt đầu trò chơi vào thời điểm Lucy đưa ra lời mời và Charlie đối mặt với quyết định chấp nhận hoặc từ chối. Nếu Charlie từ chối, câu chuyện chấm dứt.

Nếu cậu chấp thuận, Lucy sẽ có hai lựa chọn giữa việc để Charlie đá bóng và kéo bóng ra ngoài. Chúng ta sẽ minh họa điều này bằng cách kéo thêm một nhánh chạc đôi nữa dọc theo đường đi của cây đồ thị.

2

Như đã nói ở trên, Charlie cần phải đoán trước là Lucy sẽ chọn nhánh trên. Do vậy, cậu phải cắt bớt nhánh dưới trong chọn lựa của cô bé khỏi chiếc cây. Bây giờ nếu cậu chọn nhánh trên của mình, nó sẽ dẫn thẳng đến cú ngã đau điếng. Do vậy, lựa chọn tối ưu của cậu khi đến lượt mình sẽ là nhánh dưới.

Để kết lại ý tưởng, hãy xem xét một ví dụ kinh doanh với một cây trò chơi tương tự như trên. Để tránh đụng chạm đến bất kỳ một công ty thực nào và xin cáo lỗi cùng Graham Greene, chúng ta giả sử thị trường máy hút bụi ở Cu Ba trong thời trước Phidel Castro đang bị chi phối bởi nhãn hiệu Fastcleaners và một công ty mới có tên Newcleaners bằng cách chấp nhận thị phần nhỏ hơn hoặc lao vào một cuộc chiến giá cả[2].

Giả sử rằng Fastcleaners thỏa hiệp với sự gia nhập thị trường nói trên, Newcleaners sẽ có lợi nhuận là 100.000 đô la, còn nếu cạnh tranh về giá thì chi phí đối với Newcleaners sẽ là 200.000 đôla. Nếu Newcleaners đứng ngoài thị trường, hiển nhiên lợi nhuận của công ty sẽ bằng không. Chúng ta sẽ minh họa câu chuyện này bằng cây trò chơi và mức lợi nhuận cho từng kết quả:

3

Newcleaners cần phải làm gì? Đây là dạng quyết định cho vấn đề mà các nhà phân tích vẫn thường phải giải quyết và các trường kinh doanh vẫn hay giảng dạy. Họ cũng vẽ một hình tương tự, nhưng gọi nó là cây quyết định. Lý do là vì họ thường cho rằng các kết quả “tự dàn xếp” hay “chiến tranh giá cả” là những khả năng có thể phát sinh tình cờ. Do vậy, họ gắn các xác suất xảy ra cho cả hai.

Chẳng hạn nếu cùng dàn xếp và chiến tranh giá cả có khả năng xảy ra như nhau thì xác suất của mỗi kết cục là ½. Sau đó họ tính toán mức lãi trung bình mà Newcleaners có thể kỳ vọng khi tham gia vào thị trường, nhân số lãi hoặc lỗ với xác suất thương ứng và công chúng lại với nhau. Họ sẽ thu được:

(½) 100.000$ – (½) 200.000$ = -50.000$

Bởi vì kết quả thu được là lỗ nên với các xác suất này, nhận định của các nhà phân tích kinh doanh sẽ là Newcleaners không nên nhảy vào thị trường Cu Ba.

Các đánh giá về xác suất là từ đâu ra? Lý thuyết trò chơi đưa ra câu trả lời: xác suất này đến từ sự tin tưởng của Newcleaners vào lợi nhuận của Fastcleaners trong mỗi trường hợp trên.

Để đánh giá xem Fastcleaners sẽ làm gì, trước hết Newcleaners sẽ phải đánh giá mức lãi của Fastcleaners trong các kịch bản khác nhau. Sau đó, những người chơi có thể nhìn xa hơn và suy luận ngược về để đoán xem đối phương sẽ làm gì. Để tiếp tục ví dụ này, giả sử rằng ngài độc quyền Fastcleaners có thể thu lợi nhuận là 300.000 đô la.

Việc chia sẻ thị trường với Newcleaners sẽ làm mất đi 100.000 đô la lợi nhuận. Canh tranh giá cả sẽ khiến Fastcleaners mất một khoản chi phí 100.000 đô la. Bây giờ chúng ta điền toàn bộ những con số tính toán trên đây vào cây đồ thị sau:

4

Chúng ta sẽ sử dụng thông tin trên cây đồ thị để dự đoán tất cả các bước đi trong tương lai. Bởi các hành động có thể được xác định từ cơ cấu của trò chơi nên cây đồ thị này đúng nhất phải được gọi là cây trò chơi chứ không phải cây quyết định. Chẳng hạn để dự đoán câu trả lời của Fastcleaners cho hành động gia nhập thị trường, chúng ta nhận thấy rằng công ty kiếm được 100.000 đô la nếu cùng dàn xếp và mất 100.000 đô la nếu cạnh tranh về giá.

Newcleaners cần phải dự đoán được rằng Fastcleaners sẽ chọn cùng dàn xếp thay vì cạnh tranh giá. Nhìn xa hơn và suy luận ngược về, Newcleaners cần phải nhẩm tính để cắt bớt đi nhánh cây chiến tranh giá cả. Do vậy, họ nên quyết định tham gia thị trường với tính toán sẽ thu lãi 100.000 đôla.

Quyết định này có thê sẽ khác trong các tình huống khác. Chẳng hạn, nếu Newcleaners có khẳ năng sẽ tiếp tục nhảy vào thị trường trên một hòn đảo khác nơi Fastcleaners đã thiết lập thị trường cho mình, Fastcleaners có thể có động cơ để chứng tỏ mình là một đối thủ khó chơi và sẵn sàng chịu lỗ ở CuBa để làm điều chứng tỏ đó.

Nhìn xa hơn và suy luận ngược về, Newcleaners phải nhận thấy rằng họ cầm chắc lỗ 200.000 đô là và do vậy, nên quyết định đứng ngoài thị trường Cu Ba.

Newcleaners có thể thấy các kết cục cho trước được chuyển thành hành động như thế nào. Nhưng họ có thể không chắc về phần thưởng mà Fastcleaners có được ở cuối cây đồ thị. Chính sự không chắc chắn về lợi nhuận này sẽ chuyển thành sự không chắc chắn trong hành động. Chẳng hạn Newcleaners có thể tin rằng trong cuộc chiến giá cả có 33,3% khả năng Newcleaners sẽ thiệt hại 100.000 đô la, 33,3% khả năng hòa vốn và 33,3% còn lại là có lãi 120.000 đô la bất kể có cuộc chiến giá cả.

Trong trường hợp này nhìn xa hơn và suy luận ngược về cho thấy có 2/3 khả năng Fastcleaners sẽ muốn thương lượng để dàn xếp ví 100.000 đôla vẫn còn tốt hơn là bị mất ngần đó tiền hoặc hòa vốn, tuy nhiện lại xấu hơn so với khi kiếm được 120.000 đôla. Cơ hội xảy ra cuộc chiến giá cả do vậy sẽ là 1/3. Cách duy nhất để biết điều gì sẽ xảy ra là cứ nhảy vào thị trường.

Với lợi thế cho trước, Newcleaners dự tính sẽ kiếm được 100.000 đôla trong 2/3 trường hợp và mất 200.000 đôla trong 1/3 trường hợp còn lại: lợi nhuận dự tính của họ như vậy đúng bằng 0 và như vậy họ chẳng có lý do gì để gia nhập thị trường.

Trong ví dụ này, chúng ta đã chuyển sự không chăc chắn của Newcleaners về thu nhập của Fastcleaners sang các xác suất dự tính về các câu trả lời của Fastcleaners.

Tuy nhiên, cần thận trọng khi đặt sự không chắc chắn vào một chỗ nào đó. Chỗ đặt đúng nhất là ở cuối cây đồ thị. Hãy nhìn xem cái gì đã đi sai ở đây và tránh vội vàng trong đánh giá của mình. Tính trung bình, Fastcleanners có thể kiếm lợi nhuận trong cuộc chiến giá cả (1/3 x 120.000$ + 1/3 x 0$ – 1/3 x 100.000$ = 6.667$).

Tuy nhiên điều này không có nghĩa là họ sẽ luôn muốn có chiến tranh. Xác suất thắng không phải là 100%. Sự hiện diện của tính không chắc chắn cũng không có nghĩa xác suất thắng sẽ là 50%. Cách đúng đắn để phân tích chính xác vấn đề đối với Newcleaners là bắt đầu từ cuối cuộc chơi và nhẩm tính xem Fastcleaners sẽ làm gì trong mỗi trường hợp.

[1] Các bài thơ của Robert Frost, Louis Untermeyer biên soạn (New York, Washington Square Press, 1971)

[2] Trong cuốn Người của chúng ta ở Havana của Greene, người bán hàng cho một trong hai công ty này đã chọn chiến tranh – với thuốc độc thay vì giá cả.

Trang chủ

Bài viết quản trị