假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
我们先来看一个历史上最经典的有趣个例:“囚徒困境”。话说警方抓到两个盗窃犯,惜证据尚不足,遂寄希望于嫌犯自己招供。警方把两个犯人隔离起来,分别审问,交代政策如下:坦白从宽,抗拒从严!如果你招了,另一个人没招,那么就将你释放,另一人判20年;同样如果你不招,另一个人招了,那么你得被判20年,另一个人被释放。如果两个人都招,警方证据就足了,两人都判10年。至於两个人都不招的情况,不用警方交代,两个人都得判,但因证据不力,判得都要轻许多,比如1年。警方最后说,那边还有个警察,对你的同伙交代一模一样的政策呢。罪犯心里打起小九九,如果对方招了,我招是10年,不招是20年,是招划算;如果对方不招,我招是无罪释放,不招是1年,还是招划算。於是乎,招!两个“精明”的小偷都招了,都被判了10年,正中警方下怀。聪明的读者,其实如果两个小偷都不招,就会被各判1年,对他们来说岂不更好?在这个囚徒困境问题中,参与者仍是两名(两个盗窃犯),但这不再是一个零和的博弈,人受损并不等於我收益。两个小偷可能一共被判20年,或一共只被判2年。
对于多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡”。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在於他天才性地提出了“纳什均衡”的基本概念,为更加普遍广泛的博弈问题找到了解。纳什均衡的基本思想是,在这个解集中所有参与者的策略都是对其他参与者所用策略的最佳对策,没有人能够通过单单改变自己的策略提高收益。以前面的囚徒困境为例,如果小偷甲相信小偷乙招供,那么他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那么他的最佳策略仍是招供。这就是一个纳什均衡,它是“自确定”的。在囚徒困境中,只存在一个纳什均衡。但若将条件改变一下,在许多其它的具体问题中,纳什均衡可能不止一个。纳什巧妙地运用数学技巧,证明了如下纳什定理:对於任何一个n人参与,非合作博弈(零和或非零和),如果每个参与者都只有有限条策略,那么一定存在至少一个纳什均衡解集。象许多科学上最杰出的思想一样,这一概念以极简洁明了的方式解决了悬而未解的难题。看似简单,似乎属於那种“本来我也能想到”的东西,然而那时除了纳什,一代宗师诺伊曼也没有想到。纳什均衡的提出,对博弈论的发展产生了革命性的影响,纳什均衡的概念已成为现代博弈论的基石和中心(虽然在少数博弈理论家中此点仍有争议)。
纳什的好友,普林斯顿大学经济学教授迪克西特曾说,“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”