May 30, 2013

Lý thuyết trò chơi, tính hợp lý và sự thông thái

(Tác giả: VQH – Nguồn: vietnamica.net)
© Op-Economica, 30-9-2010 — Lý thuyết trò chơi từ nửa sau của Thế kỷ XX được gọi là “cuộc cách mạng kinh tế học thầm lặng” diễn ra rất mạnh mẽ, nhưng ít ồn ào. Nó đã bước qua ranh giới thuần túy dành cho các nhà toán học để trở thành lĩnh vực ứng dụng phân tích kinh tế, chính sách dồi dào tiềm năng. Nó nhanh chóng bước sang nhiều lĩnh vực khoa học xã hội liên quan tới hành vi con người, và trở thành một công cụ không gì sánh nổi trong việc cung cấp logic và lập luận phân tích sâu. Có lẽ chỉ có nhánh thống kê toán là có thể sánh với lý thuyết trò chơi về mức độ ứng dụng rộng rãi. Tuy nhiên, trong các môi trường thống kê khó hoạt động do tình trạng  “dữ liệu bẩn” hay rải rác, khó thu thập, phương tiện duy nhất là cứu cánh cho các phân tích khoa học hợp lý, có tính tiên lượng cao (tương đương với thống kê) còn lại chỉ có lý thuyết trò chơi. Đó là lý do mà Op-Economica có nguyên một mục lớn về Lý thuyết trò chơi, mặc dù nó có thể coi là một phần của Math Modeling của Kinh tế học.
Bài đầu tiên này của Op-Economica muốn cung cấp một số thông tin ban đầu nhằm tạo dựng mối quan tâm thích đáng tới lĩnh vực lý thuyết trò chơi, mà sớm hay muộn cũng sẽ phát triển rất mạnh tại Việt Nam, cho dù hiện tại thì chưa.
Vậy lý thuyết trò chơi là gì? Trước tiên có thể nói rằng, đó là hệ thống nghiên cứu về các mô hình toán học đặc tả sự xung đột và hợp tác giữa “các cá nhân ra quyết định một cách khôn ngoan”. (Các bạn còn nhớ ở Việt Nam, khi mà người tiêu dùng bày tỏ sự bức xúc vì hàng hóa kém cỏi về chất lượng cho mức giá tiền phải trả nhiều một cách không tương xứng, đã có vị quan chức gợi ý: Vậy thì “ông” người tiêu dùng phải thông thái thôi. Không rõ ông này có chút hiểu biết nào về game theory không, nhưng khẩu khí đó thì nghe cũng ra vành ra vẻ đượm mùi lý thuyết trò chơi đấy).
Gọi là lý thuyết, bởi vì lĩnh vực này cung cấp các kỹ thuật toán học để phân tích các tình huống trong đó hai cá nhân, hoặc đông hơn nữa, tiến hành ra các quyết định, mà các quyết định đó gây ra ảnh hưởng lên lợi ích của (những) người khác có mặt trong tình huống (trò chơi).

Players in a gamePlayers in a game
Như vậy, lý thuyết trò chơi giúp cung cấp sự thấu hiểu có tính trọng yếu mà các nhà nghiên cứu ở tất cả (xin lưu ý là “tất cả”) các nhánh của các lĩnh vực khoa học xã hội rất cần để nhận biết các vấn đề hành vi con người. Các nhà kinh doanh, chính trị gia, chiến lược quân sự lại còn càng cần hơn, vì họ phải xử lý quan hệ đa chiều phức tạp giữa các đám đông thuộc cấp, xã hội, đối tác-đối tượng, v.v.. Tính chất “nghiêm trọng” này rõ ràng tương phản với cái tên lý thuyết “trò chơi” mà thoạt nghe dễ dẫn đến hiểu lầm là nghiên cứu về cái gì đó có tính chất giải trí, hay là như phong trào Võ Lâm Truyền Kỳ đang sôi nổi vài năm gần đây. Tuyệt nhiên cái tên lý thuyết trò chơi chỉ phản ánh cái nguồn gốc sơ khởi ban đầu – nguồn cảm hứng từ cờ bạc – của lĩnh vực toán học quan trọng này.
Nếu để diễn tả tốt hơn bản chất khoa học nghiêm chỉnh, đứng đắn của lý thuyết trò chơi, có thể gọi tên là “lý thuyết về phân tích các xung đột” hoặc “lý thuyết quá trình ra quyết định có tương tác”, hay cái gì đó tương tự.
Lý thuyết trò chơi có thể hiện diện từ rất lâu rồi, lẩn khuất trong các lĩnh vực xã hội, quân sự, cho dù không mang cái tên hiện đại như ngày hôm nay. Những nghiên cứu lớn đã xuất hiện từ thế kỷ XIX, cùng với sự phát triển của bộ môn xác suất, với cái tên như Bertrand. Tuy vậy, lý thuyết trò chơi hiện đại – với dáng dấp như một ngành khoa học đã “đủ lông cánh” hôm nay – coi như được đánh dấu từ thế kỷ XX, với những tác phẩm trứ danh của Zermelo (1913), Emile Borel (“La théorie du Jeu et les équations intégrales à noyau symétrique,” Comptes Rendus de l’Académie des Sciences, Vol. 173: 1304-1308, 1921), Von Neumann (1928), và cuốn sách rất ấn tượng của Von Neumann và Morgenstern (Theory of Games and Economic Behavior, ấn bản năm 1944).
Lý thuyết trò chơi hiện đại nợ nần nhiều đóng góp rất lớn của Princeton, và rất nhiều đóng góp ban đầu được công bố trong khoảng thời gian Thế chiến Đệ Nhị. Nơi sinh ra những đóng góp lớn của lý thuyết trò chơi, cũng là nơi nhiều vĩ nhân của ngành vật lý sản sinh ra những đóng góp tạo ra bước tiến khổng lồ của khoa học vật lý nhân loại. Sự gần gũi về mặt không gian này, theo các nhà nghiên cứu về lịch sử phát triển tri thức nhân loại, xét ở góc nhìn rộng rãi, không hề tình cờ hay ngẫu nhiên. Và như vậy, nó là kết cục tất yếu. Phần lớn sự hấp dẫn, cuốn hút và những gì chứa đựng hứa hẹn lớn lao của lý thuyết trò chơi là kết quả của vị trí trung của lý thuyết trò chơi, với tư cách nền tảng toán học và logic cho tất cả các ngành khoa học xã hội. Trong thời kỳ đầu thế kỷ XX này, những tiến bộ lớn diễn ra trong tất cả các nhánh của các ngành khoa học vật lý đã sản sinh ra nghịch lý và sự xung đột tiềm tàng về vũ khí hạt nhân, và điều này đã trực tiếp đe dọa sự tồn tại của toàn bộ nền văn minh nhân loại.
Tiến bộ khoa học vật chất có vẻ như giúp con người biết cách thiết kế các hệ thống vật lý để khai thác vật liệu tạo năng lượng phóng xạ, nhưng lại không đủ tri thức để tạo ra các hệ thống xã hội có thể giúp điều hòa hành vi của con người trong bối cảnh xung khắc tới mức sẵn sàng tiêu diệt nhau. Yêu cầu bức bách dẫn tới sự kỳ vọng lớn lao rằng ngành khoa học xã hội cũng sẽ đạt được những bước tiến đủ lớn, có tính căn nguyên và đảm bảo học thuật, có khả năng cung cấp nhận thức sâu sắc tương xứng với những tiến bộ khoa học vật chất, đặc biệt là vật lý lý thuyết và ứng dụng. Sự hy vọng lớn lao này là động lực mạnh mẽ khiến rất nhiều nhà toán học và khoa học xã hội miệt mài nghiên cứu thúc đẩy lý thuyết trò chơi trong nửa còn lại của Thế kỷ XX.
Cuối cùng thì mong mỏi đó cũng được đền đáp. Bằng chứng rất thực về sức mạnh của lý thuyết trò chơi có thể đặc trưng bởi quá trình mắn đẻ các ứng dụng quan trọng của nó trong kinh tế học và đời sống kinh tế toàn cầu.
Về bản chất công việc, các nhà nghiên cứu lý thuyết trò chơi thực ra bỏ công sức nhằm hiểu được bản chất của xung đột và hợp tác, thông qua việc tìm hiểu, xây dựng các mô hình định lượng, kèm theo đó là các ví dụ mang tính chất ước đoán về các tình huống, hành vi của cuộc sống. Các ví dụ thì như chúng ta vẫn thấy, thường phải được đơn giản hóa đi (một cách phi thực tế), nhằm cô lập một nhóm vấn đề phức tạp về một số ít vấn đề rất căn bản của bản chất xung đột hay hợp tác. Tính đơn giản này giúp giải quyết vấn đề được thuận lợi hơn, trong khi vẫn có thể duy trì tính tổng quát cho cả các trường hợp vô cùng rắc rối của đời sống thực. Điều này cũng là chuyện thường thấy trong rất nhiều ngành khoa học khác nữa: Gạt bỏ các chi tiết dù là có thực, nhưng không quá quan trọng, để tập trung cho một số ít các câu hỏi lớn, không thể bỏ qua.
Khái niệm “trò chơi” ở đây chỉ là quy ước về mặt ngôn ngữ, nhằm ám chỉ bất kỳ tình huống xã hội nào có liên quan tới ít nhất 2 người. Do cách gọi, các cá nhân liên quan tới một “trò chơi” thì đều được gọi là “người chơi”. (Mặc dù có thể họ chẳng chơi gì cả, trong tình huống lý thuyết đang xét. Nói chính xác là họ chỉ ra các quyết định, thậm chí rất nghiêm túc và bằng trí khôn chuẩn mực, chứ không có chơi bời gì hết.) Điều kiện để nghiên cứu là hai giả thiết: Thứ nhất, người chơi có tính hợp lý. Thứ hai, người chơi thông thái (sử dụng trí khôn để ra quyết định). Để không còn chút mù mờ nào về hai giả thiết nền tảng này, chúng ta sẽ cần làm rõ “tính hợp lý” và “tính khôn ngoan” ở dưới đây.
Về tính hợp lý. Một người ra quyết định được gọi là “hợp lý” nếu như người đó nhất quán trong việc ra các quyết định để theo đuổi mục tiêu của mình. Trong lý thuyết trò chơi, chúng ta giả định rằng mục tiêu của mỗi người chơi là tối đa hóa giá trị kỳ vọng của lợi ích thu được; đôi lúc giá trị này được đo thông qua một đại lượng gọi là “độ thỏa dụng” (utility). Dĩ nhiên, ta thì gọi là “giả định về tính hợp lý của người chơi”, nhưng nó có căn cứ. Trên thực tế, nhà toán vĩ đại  Bernoulli năm 1738 đã đề xuất quan điểm rằng người chơi hợp lý cần biết cách ra quyết định để tối đa hóa lợi ích thỏa dụng kỳ vọng. Với lý thuyết hiện đại, Von Neumann và Morgenstern năm 1947 đưa ra “định lý tối đa hóa thỏa dụng kỳ vọng” chứng minh rằng, người chơi sẽ biết cách gán các giá trị thỏa dụng cho các quyết định, và sau đó sẽ tìm ra lựa chọn để tối đa hóa độ thỏa dụng kỳ vọng của mình.
Hành vi nhất quán tối đa hóa thỏa dụng còn được nhận biết từ các mô hình “chọn lọc tiến hóa”. Trong một vũ trụ mà sự hỗn loạn tăng lên là một quy luật vật lý, các cơ quan phức tạp (như cơ thể con người, hay tổ chức xã hội) chỉ có thể tồn tại nếu biết cách điều chỉnh hành vi, theo hướng làm tăng xác suất sống sót và duy trì sinh sản (tái tạo các thế hệ). Như thế, theo cách nhìn của chọn lọc tiến hóa, các cá nhân có xu hướng tối đa hóa giá trị kỳ vọng của đại lượng “sống sót” hoặc “thích nghi sinh sản”.
Thực ra, tối đa hóa lợi ích của độ thỏa dụng kỳ vọng không nhất thiết đồng nghĩa với tối đa hóa giá trị tiền tệ kỳ vọng, vì các giá trị thỏa dụng không nhất thiết chỉ được quy đổi ra tiền. Một cá nhân không thích mạo hiểm nhận được nhiều giá trị biên thỏa dụng hơn từ một đô-la thu nhập tăng lên của anh/chị ta khi còn nghèo, hơn một đô-la khi anh/chị ta đã giàu. Cái này tựa như người Việt vẫn nói “Một miếng khi đói bằng một gói khi no” cho dù thực tế thì miếng vẫn chỉ là miếng, và gói thì to hơn hẳn, vượt trội, và rất đáng phấn đấu để có một gói!
Điều này dẫn đến gợi ý rằng, biết đâu đấy, độ thỏa dụng lại chẳng có dáng điệu của một hàm phi tuyến của giá trị tiền tệ. Đây là một gợi ý rất hữu ích với các nhà kinh tế. Hãy xét ví dụ sau. Một mô hình rất hay được sử dụng trong nghiên cứu ra quyết định phát biểu rằng, lợi ích thỏa dụng của một người ra quyết định  (người chơi) từ việc thu về được x đô-la sẽ là hàm thỏa dụng có dạng u(x)=1-e^{-cx}. Trong biểu thức này, c đại diện cho một tham số gọi là “chỉ số mức độ không ưa mạo hiểm” (Pratt, J.W. 1964. “Risk aversion in the small and in the large,” Econometrica, 32: 122-136.)
Trong bối cảnh bất trắc, mức thỏa dụng kỳ vọng có thể được định nghĩa và tính toán nếu các sự kiện bất trắc có liên quan được gán cho các xác suất.  Còn trong những trường hợp những phép gán xác suất khách quan khó có thể thực hiện, thì Ramsey (1926) và Savage (1954) vẫn cho rằng người chơi có thể gán các xác suất “chủ quan” cho các sự kiện, rồi từ đó tính ra được những giá trị kỳ vọng.
Tuy thế, trong các tình huống có từ 2 người chơi trở lên, xuất hiện những khó khăn phức tạp trong việc xác định những con số xác suất chủ quan có thể dùng để gán cho các sự kiện. Chẳng hạn, giả sử một trong những yếu tố không chắc chắn với Người chơi 1 là hành động của Người chơi 2. Để đánh giá xác suất cho mỗi hành động trong các lựa chọn của Người chơi 2, Người chơi 1 cần phải biết hành vi ra quyết định của Người chơi 2, vì thế NC 1 giả sử mình ở vào vị trí của NC 2. Trong quá trình “thí nghiệm tư duy” đó, NC 1 nhận ra rằng NC 2 đang cố gắng giải một bài toán ra quyết định một cách “hợp lý”, và để làm việc đó, chính NC 2 đang cần phải đánh giá các xác suất mà NC 1 sẽ gán cho các sự kiện, rồi dựa vào đó ra quyết định. Như vậy, nghiệm hợp lý đối với mỗi bài toán ra quyết định của mỗi cá nhân lại phụ thuộc vào nghiệm của NC khác trong trò chơi. Tức là nếu không biết nghiệm của NC kia, thì cũng không làm sao tìm ra nghiệm của chính mình. Theo cách hiểu này, khi các tay chơi hợp lý tương tác với nhau trong trò chơi, các bài toán riêng rẽ của họ phải được giải quyết cùng một lúc, giống như chúng ta vẫn bắt gặp trong các hệ phương trình tuyến tính ở môn đại số PTTH. Quá trình phân tích này là đối tượng nghiên cứu của lý thuyết trò chơi.
Ở khía cạnh thứ hai: Tính thông thái, ta thấy như sau. Với các nhà nghiên cứu xã hội, một NC được coi là thông minh, sử dụng trí khôn trong khi “chơi” nếu như anh/chị ta biết mọi thứ mà chúng ta biết về bản thân trò chơi, và anh/chị ấy sẽ có thể ra quyết định và suy diễn về các tình huống giống như chúng ta có thể. Vì thế, nếu chúng ta phát triển một lý thuyết mô tả hành vi của những NC thông thái – và chúng ta tin rằng lý thuyết này có cơ sở để tin cậy được – thì chúng ta cần phải giả định rằng mỗi NC trong trò chơi đang xét đều nhận thức rõ được lý thuyết thông thái, cũng như những gì có thể tiên lượng khi mang nó ra sử dụng.
Có thể tách rời hai tính chất bắt buộc của trò chơi này để phân tích kinh tế không? Thực tế là với các phân tích khác, không sử dụng lý thuyết trò chơi, thì vẫn được. Lấy ví dụ gần gũi là lý thuyết giá của kinh tế học. Nghiên cứu lý thuyết có thể chỉ giả định “tính hợp lý”, nhưng không cần giả định “tính thông thái”. Trong các phân tích về điểm cân bằng tổng quát, mô hình xem xét giá, mỗi cá nhân được giả định…
———–&&———-

No comments:

Post a Comment