Συνεχή παίγνια και Λύσεις Stackelberg

Μια ειδική κατηγορία της θεωρίας παιγνίων αποτελείται από τα συνεχή παίγνια. Όπως δεν ανήκουν στα διακριτά συστήματα μπορούμε να εφαρμόσουμε τον διαφορικό λογισμό ειδικά όταν γνωρίζουμε τις συναρτήσεις κέρδους των παικτών.

Κλασικά ορίζουμε x τις στρατηγικές του παίκτη Ι και y τις στρατηγικές του παίκτη ΙΙ. Τότε αν οι παίκτες παίζουν ορθολογικά, οι συνθήκες ισορροπίας οδηγούν στις εξής αναγκαίες συνθήκες για ένα ζεύγος στρατηγικών x*, y* που αποτελείται από τις βέλτιστες στρατηγικές των παικτών.

Κ_Ι (x*, y*) μέγιστο ως προς x με y* σταθερό Þ ¶Κ_Ι / ¶x = 0 ½ (x*, y*)

Κ_ΙΙ (x*, y*) μέγιστο ως προς y με x* σταθερό Þ ¶Κ_ΙΙ / ¶y = 0 ½ (x*, y*)

Αν οι δύο εξισώσεις δεν επαρκούν, τότε προσθέτουμε συνθήκες μεγαλύτερης τάξης.

Το ενδιαφέρον αυτής της προσέγγισης είναι ότι μπορεί και να ερμηνευτεί ως επίπτωση μίας διπλής αντίδρασης. Ο παίκτης Ι, γνωρίζοντας ότι ο παίκτης ΙΙ θα παίξει y , αντιδρά παίζοντας Λύση (¶Κ_Ι / ¶x = 0) και ο παίκτης ΙΙ, γνωρίζοντας ότι ο παίκτης Ι θα παίξει x , αντιδρά παίζοντας Λύση (¶Κ_ΙΙ / ¶y = 0). Όμως στην τελική φάση, το αποτέλεσμα είναι εντελώς συμμετρικό και οι εκτιμήσεις είναι ανεξάρτητες.

Μια άλλη περίπτωση προκαλείται από το ασυμμετρικό στοιχείο του χρόνου. Δηλαδή μπορούμε πια να διαχωρίσουμε τους παίκτες χρονικά. Ο παίκτης ΙΙ γνωρίζει την κίνηση του παίκτη Ι. Τότε η γενική προσέγγιση αλλάζει και μετατρέπεται σε ανάλυση του Stackelberg . Αυτήν τη φορά η ανάλυση γίνεται αναστροφικά. Με άλλα λόγια ο παίκτης Ι ξέρει ότι ο παίκτης ΙΙ γνωρίζει την κίνησή του και ότι θα παίξει Λύση ( ¶Κ_ΙΙ / ¶y = 0), συνεπώς εξετάζει το κέρδος του Κ_Ι διαφορετικά ενσωματώνοντας την πληροφορία της αντίδρασης του παίκτη ΙΙ. Έχει λοιπόν όχι πια Κ_Ι ( x, y) αλλά Κ_Ι ( x, y αντίδραση) άρα επιλέγει Λύση (¶Κ_Ι ( x, y αντίδραση) / ¶x = 0).

Μέσα σε αυτήν τη διαδικασία ονομάζουμε ηγέτη τον πρώτο παίκτη και υποτελή τον δεύτερο παίκτη. Η ύπαρξη αυτού του ζευγαριού δεν είναι τεχνητή εφόσον με την επέμβαση του χρόνου αλλάζει και η θέση της ισορροπίας. Η λύση του Stackelberg είναι διαφορετική από τη συμμετρική ισορροπία που προέρχεται από τη μη πρόσβαση στην πληροφορία. Μέσω της μεθοδολογίας αυτής μπορούμε δίχως δυσκολία να ερμηνέψουμε τον χρόνο ως μέσο πληροφόρησης και μάλιστα πλήρους πληροφόρησης στη συγκεκριμένη περίπτωση. Δημιουργεί με αυτόν τον τρόπο ένα πλαίσιο ενδιάμεσο σε σχέση με τα παίγνια συνεργασίας και τα παίγνια μη συνεργασίας. Συνεπώς μπορούμε με την προσέγγιση του Stackelberg να εξετάσουμε και να ερμηνέψουμε διαπραγματευτικές περιπτώσεις όπου ο χρόνος μέσω της διάταξης των επεμβάσεων είναι σημαντικός.

1253 - Συνεχή παίγνια και Λύσεις Stackelberg

Ν. Λυγερός

SECTIONS