时间偏好、跨期选择不一致及其神经基础

引用本文

王锦锦, 汪思绮, 罗卫东. 时间偏好、跨期选择不一致及其神经基础[J]. 南方经济, 2017, 36(9): 21-36. 复制到剪切板

Wang Jinjin, Wang Siqi, Luo Weidong. Time Preference, Intertemporal Choice Inconsistency and Its Neural Basis[J]. South China Journal of Economics, 2017, 36(9): 21-36. 复制到剪切板

通讯作者

罗卫东(通讯作者), 浙江大学经济学院, E-mail: luo.wd@zju.edu.cn

作者简介

王锦锦, 浙江大学经济学院、浙江财经大学经济行为与决策研究中心; E-mail: wangjinjinjane@163.com, 通讯地址:浙江省杭州市浙大路38号浙江大学经济学院, 邮编:310027;
汪思绮, 浙江大学经济学院、浙江大学跨学科社会科学研究中心, E-mail: wsq2424@163.com

Contents Abstract Full text Figures/Tables PDF

时间偏好、跨期选择不一致及其神经基础

王锦锦, 汪思绮, 罗卫东

作者简介：王锦锦, 浙江大学经济学院、浙江财经大学经济行为与决策研究中心; E-mail: wangjinjinjane@163.com, 通讯地址:浙江省杭州市浙大路38号浙江大学经济学院, 邮编:310027; 汪思绮, 浙江大学经济学院、浙江大学跨学科社会科学研究中心, E-mail: wsq2424@163.com

通讯作者：罗卫东(通讯作者), 浙江大学经济学院, E-mail: luo.wd@zju.edu.cn

感谢匿名审稿人的中肯评阅与建议，作者文责自负

摘要：时间偏好是跨期选择行为研究中一个至关重要的依据，19世纪的经济学家们通过对它的定性分析形成了一套系统的古典时间偏好理论。直到1937年萨缪尔森提出指数贴现模型并成为新古典时间偏好理论的核心技术手段，新古典时间偏好理论得以成为跨期选择问题的主流分析框架。但因其高度理性的假定，指数贴现模型也一直饱受诟病和质疑，几乎每一个关键假设都有系统的实证结果与之相悖。20世纪80年代行为经济学的兴起，行为经济学家们肯定认知偏差的存在并引入了贴现率递减的双曲线贴现模型完成了对许多市场异象的解释，加之神经经济学和神经影像学的发展为时间偏好不一致提供了神经基础，时间偏好的研究迎来了新篇章。文章将对这些研究成果进行较为全面的回顾与评述，借以推动国内时间偏好理论研究的发展。

关键词：时间偏好理论跨期选择指数贴现模型时间偏好不一致双曲线贴现模型神经经济学

Time Preference, Intertemporal Choice Inconsistency and Its Neural Basis

Wang Jinjin , Wang Siqi , Luo Weidong

Abstract: Time preference is a crucial basis in the study of intertemporal choice behavior. Economists in the nineteenthcentury formed a systematic classical time preference theory by qualitative analysis of it. Until 1937, Samuelson put forward the discounted utility model and it became the core technical means of the neoclassical time preference theory, the neoclassical time preference theory became the mainstream analysis framework of the intertemporal choice problem. However, because of its highly rational assumptions, the discount utility model has always been criticized and questioned, almost every key hypothesis has a systematic empirical results contrary to it. In the 1980s, behavioral economics rose, behavioral economists affirmed the existence of cognitive bias and introduced the hyperbolic discounting model with decreasing discounting rate to complete the interpretation of many market anomalies. Combined with the development of neuroeconomics and neuroimaging providing a neural basis for the time preference inconsistency, study of time preference theory ushered in a new chapter. This article will conduct a more comprehensive review and comment on these research results, so as to promote the development of domestic time preference theory research.

Key Words: Time preference theory Intertemporal choice Discounted utility model Time preference inconsistency Hyperbolic discounting model Neuroeconomics

一、引言

时间偏好作为人们跨期选择行为中一个重要影响因素，经济学家们对它的研究已历时近两个世纪。以对行为主体的描述与假设为轴线，时间偏好理论分析框架的发展历程可分为以下三个阶段。

第一阶段是古典时间偏好理论，形成于19世纪，主要代表人物为苏格兰经济学家John Rae和奥地利学派经济学家Eugen von Böhm-Bawerk等。他们从心理学和社会学的角度出发，解释了时间偏好的形成，探讨了影响个体时间偏好的主要因素，但他们的讨论仅仅囿于定性分析，没有建立起严谨规范的数理模型。第二阶段是新古典时间偏好理论。1937年，Paul Samuelson在论文《关于效用的测量》(A Note on Measurement of Utility)中向世人介绍了指数贴现效用模型(Discounted Utility Model)，该模型以理性经济人假设为基本出发点，通过贴现率不变的假定，得出时间偏好一致的结论，该结论与新古典一般均衡一致。正是DU模型的简洁性及其与一般均衡理论的完美契合性，使得它迅速成为研究跨期选择问题的主流分析框架。然而，随着行为经济学的发展和量值效应、符号效应等众多市场“异象”的发现，DU模型也面临着巨大的冲击和挑战。第三阶段是由行为经济学开创的时间不一致性偏好理论。20世纪80年代，行为经济学逐渐兴起，它认为人们普遍存在认知偏差，在思想路线上放松了理性经济人假设代之以行为人假设，在技术路线上摈弃了指数贴现模型代之以双曲线贴现模型(Hyperbolic Discounting Model)，通过贴现率递减得出时间偏好不一致的结论，这一结论成功解释了诸多市场异象，并得到广泛应用。

进入21世纪以来，脑科学、认知神经科学，尤其是神经经济学的不断发展和成熟使得神经经济学家得以在行为实验的基础上，排除许多行为实验所无法排除的干扰项，利用功能性磁共振成像技术(fMRI; functional Magnetic Resonance Imaging)探究跨期选择行为及时间偏好不一致与人类大脑神经组织、神经活动之间的相关关系，为时间偏好理论的研究提供来自神经经济学的证据，更客观准确地从神经科学的层面上证实(或证伪)时间偏好不一致的微观基础，为时间偏好理论研究提供一个新方向。

本文的余下内容将作如下安排：第二部分将介绍时间偏好理论的发展历程，详述从古典时间偏好理论到新古典时间偏好理论阶段出现的主要观点。第三部分将会描述行为实验中发现的各种“异象”及其对DU模型造成的冲击和挑战。关于行为经济学时间不一致偏好理论的介绍将会在第四部分呈现。第五部分将介绍神经经济学为时间偏好不一致提供的神经基础，从神经活动的角度理解人们的跨期选择不一致行为。第六部分将作为本文的总结。

二、时间偏好理论的嬗变

时间偏好理论最早是从国民财富的讨论中引申出来的。1776年，《国富论》首次出版，Adam Smith在其中讨论了跨期选择问题对于国家财富积累的重要意义，在此之后不久，苏格兰经济学家John Rae便开始研究影响跨期选择行为的主要因素，跨期选择理论也正是在他所著的《资本存量的社会理论》(The Social Theory of Capital)中建立的。Adam Smith在《国富论》中指出，一国财富由该国分配给资本生产的劳动力数量决定，John Rae同样想解决为何国与国之间财富不同的问题，但他认为Adam Smith所言还不是影响国民财富多少的决定因素。根据Rae的观点，造成这种分配情况的原因——“人们对积累的愿望”才是决定国民财富积累量的因素，换言之，能够影响“人们对积累的愿望”的因素便是能够影响国民财富积累量的因素。并且他认为跨期选择行为是这些因素的联产品，跨期选择行为同样深受这些因素影响。一方面，Rae认为促进人们积累愿望的心理因素主要有二：一为遗产动机。一国人民普遍拥有为子孙、为社会留下馈赠的仁慈情感，将竭尽全力为这个国家创造并留下更多的财富，这也将推迟他们的消费，削弱他们的时间偏好。二为自我约束。社会成员普遍具有反思习惯和审慎思想，懂得节制自己，同样将使得国家积累起更多的财富，减弱了自身的时间偏好。另一方面，限制人们积累愿望的心理因素也是两点：一为人生的不确定性。中国古语有言“人生得意须尽欢”表达的也是同一个意思，若是生命中存在的各种不确定性使得一国社会成员更倾向于提前消费，“今朝有酒今朝醉”，这自然就延缓了国民财富的积累，同时加强了人们的时间偏好。二为即时消费带来的快感。克制带来的痛苦感不言而喻，因而人们更愿意“及时行乐”，减少积累，这也就造成一国国民财富的减少和人们时间偏好的增强。以上这四种心理动机共同作用决定个体时间偏好的强弱继而影响其跨期选择行为。

John Rae的这一观点对后世的经济学家们影响颇深，其中便有奥地利学派经济学家Eugen von Böhm-Bawerk。他将所有影响跨期选择行为的因素分为两类，一类是个人因素(personal factors)，Böhm-Bawerk继承了John Rae的观点，将Rae所说的四种心理动机归为个人因素，并补充了“人们总是趋于低估未来的需要”这一因素来共同解释人们迷恋眼前而忽视未来的心理偏差。另一类是客观因素(objective factors)，指的是“未来的财富和风险”，认为预期收入和个体的风险偏好对其当期消费行为存在很大影响。此外，Böhm-Bawerk还在Rae的基础上考虑了两期的跨期选择问题，并借助两种商品(如房产和食物)在两个时期的消费分配问题来加以说明。

这一思路由美国经济学家Irving Fisher继承。Fisher将跨期选择问题置于两种商品的无差异曲线图中，以当年的消费量为横轴，下一年的消费量为纵轴，得出个体的时间偏好率——图中表现为所选消费束的边际替代率取决于时间偏好和边际效用的结论。并且，他注意到个体在不同时期消费水平的不同对时间偏好的影响，因此他提出纯时间偏好的概念，即个体在两个消费水平总体相等的时期所选消费束的边际替代率。此外，Fisher也和他的前辈们一样从心理学角度思考影响时间偏好因素的问题，他同意Böhm-Bawerk的分类方式，也赞同将Rae的四种心理动机归为个人因素，但在对个人因素的补充上，他认为还应包括“远见”，即对未来需求的想象能力，这一点恰恰与Böhm-Bawerk的观点相反。并且他进一步认为，在所有个人因素中，最重要的是“潮流”，这一方面使得人们努力储蓄以期成为富人，另一方面又鼓励富人们过奢靡尊贵的生活，保持一种高规格的消费水平。

在长达一个世纪的时间里，经济学家们都在致力于探究各种可能影响时间偏好的心理动机，直到1937年Paul Samuelson引入指数贴现模型，并简单地以贴现率概括所有的心理动机，同时将跨期选择行为的分析从两期推广到了多期。虽然Samuelson本人也对DU模型的局限性做了清晰的阐释，但它的简洁性及其与人们长期的复利计算实践严格吻合仍使它迅速应用到了跨期选择行为的分析中。DU模型认为，个体从未来多期获得的贴现效用为

${U^{\rm{t}}}\left( {{c_t}, \cdots ,{c_T}} \right) = \sum\limits_{k = 0}^{T - t} {D\left( k \right)} u\left( {{c_{t + k}}} \right),{\rm{ 其中}}D\left( k \right) = {\left( {\frac{1}{{1 + \rho }}} \right)^k}。$

(1)

在这个模型中，D(k)代表了个体的贴现函数，ρ代表了个体的纯时间偏好率，即贴现率，也就是前文所述所有心理动机在个体身上作用的总和。DU模型包含了以下七个假设：

第一，效用整合原则。该假设认为人们在决定是否作出新选择时，会将新选择与原有计划进行整合，若是所得效用大于原效用，则将作出该选择。即假设人们的初始禀赋为E₀，新选择X使得人们的禀赋变为E₀∪X, B(E)为禀赋E下人们的预算，则当

$\mathop {{\rm{max}}}\limits_{\left( {{c_t}, \cdots {c_T}} \right) \in B\left( {{E_0} \cup X} \right)} \sum\limits_{\tau = t}^T {{{\left( {\frac{1}{{1 + \rho }}} \right)}^{\tau - t}}} u\left( {{c_\tau }} \right) > \mathop {{\rm{max}}}\limits_{\left( {{c_t}, \cdots {c_T}} \right) \in B\left( {{E_0}} \right)} \sum\limits_{\tau = t}^T {{{\left( {\frac{1}{{1 + \rho }}} \right)}^{\tau - t}}} u\left( {{c_\tau }} \right)$

(2)

时，人们将作出新选择。但实际上这一假设很不现实的，人们可能并没有关于未来的消费计划，无法将之与新选择进行效用整合，也可能并不愿意或者并没有能力在每次做出新选择时都进行如此复杂的计算。

第二，效用独立性假设。总效用简单地等于未来各期以相同贴现率贴现到当期的效用总和，该假设排除了人们随着时间的推移表现出对某种效用模式产生偏好的可能，未来任何时期的贴现率都是相同的。

第三，消费独立性假设。这表明，个体在某一时期的消费不受其他任何时期的消费影响。举个实例，消费独立性假设说的就是一个人今天关于火锅和烧烤的偏好与他昨天是否吃过火锅以及明天是否想吃火锅无关。这个假设在实际生活中也同样是站不住脚的，正如 Koopmans(1960)说的那样，“我们不会认为‘独立性假设’是高度现实的”。

第四，即时效用函数不变假设。即人们在不同时期从相同活动中获得的效用是相同的。然而，目前有越来越多的经济学家将注意力放在了研究人们偏好的变化路径上，证实人们的偏好不仅是可变化的，而且是以可知和不可知的方式变化的。( Steven Suranovic et al., 1999)。

第五，贴现函数及贴现率不变假设。该假设假定人们在各种不同类型的消费上贴现函数及贴现率都是不变的。贴现函数的通式是$D\left( k \right) = \prod\limits_{n = 0}^{k - 1} {\left( {\frac{1}{{1 + {\rho _n}}}} \right)} $，ρ_n代表了从第n期到第n+1期之间所使用的贴现率，而DU模型所用的贴现函数$D\left( k \right){\rm{ = }}{\left( {\frac{1}{{1 + \rho }}} \right)^k}$则表明了每一期的贴现率ρ都是不变的。

第六，固定贴现和时间一致性假设。固定贴现意味着人们对时间的评价是公正的，无论增长或缩短贴现时间都不影响人们的偏好，即若是人们在时期t，对于某些τ值，相比于τ+d期的γ更偏好于τ期的χ，则必有对于全部的τ而言，人们相比于τ+d期的γ更偏好于τ期的χ。而时间一致性则意味着上一期的偏好与当期的偏好是一致的。用公式表述即为若有两组消费计划(c_t, …, c_T)和(c_t^′, …, c^{^′}_T)，且有初始消费c_t=c_t^′，那么若有U^t(c_t, c_t+1, …c_T)≥U^t(c_t^′, c^{^′}_t+1, …c_T^′)，则有U^t+1(c_t, c_t+1, …c_T)≥U^t+1(c_t^′, c_t+1^′, …c_T^′)。

第七，正时间偏好假设。即认为人们对未来的关注较少，倾向于将消费集中在当前。

总体而言，DU模型虽然给出了一个简洁优美的分析范式，但其对于个体理性程度的要求过高，是一项理想条件下的贴现技术。因此，在它广泛应用于消费、储蓄、投资、增长等领域的同时，无论是实验室还是市场上仍存在着许多“异象”。随着行为经济学和实验经济学的兴起，这些“异象”也成为了经济学领域一个难以回避的命题。

三、行为实验中发现的异象

DU模型对人们决策过程中普遍出现的时间偏好作出了解释，并根据贴现率不变的假设得出了时间偏好一致的结论。但20世纪以来，越来越多的经济学家在行为实验中发现了“时间偏好不一致”及诸多与DU模型的假设相悖的现象，最明显的一点就是由经验观察所得的贴现率随时间递减的现象( Thaler, 1981)。本章将对一些重要行为实验的实验过程、实验结果做出详细介绍。

Thaler在1981年做了一个实验，该实验将被试分为四组并准备了四组问卷，其中三组关于收益(记为A、B、C三组)，另外一组关于损失(记为D组)。A、B、C三组的被试被告知他们有一笔中彩票获得的奖金存在银行里，可以现在就取也可以过段时间取更多的钱，要求被试填写他们推迟获得奖金所需要的补偿金额。D组的被试被告知他们有一张罚单需要支付，要求被试填写他们为推迟支付罚单所愿意支付的补偿金额。且告知被试整个等待时间内没有任何风险，所有金额的收支都将通过邮寄的方式完成。每组收到的问卷里均包含一张表格(表内金额单位均为美元，负号表示支出)，分别为：

表 1 A组问卷中的表格

表 2 B组问卷中的表格

表 3 C组问卷中的表格

表 4 D组问卷中的表格

该实验每组问卷的有效回收数约是20份，合计回收约80份。回收数据整理如下(表格内所填数字均为整理后的平均值，括号内数字代表贴现率)：

表 5 A组实验结果

表 6 B组实验结果

表 7 C组实验结果

表 8 D组实验结果

该实验的结果表明：首先，对比A组和D组的实验结果可以发现，人们对于损失的贴现率明显低于收益的贴现率；其次，观察A、B、C、D组同一列的贴现率数据可以发现，除了B组的第三列，不管是收益还是损失，随着金额的扩大，相同贴现时间内贴现率都在逐渐缩小。 Thaler(1981)将该列数据当作是个别被试在实验过程中的笔误导致平均值偏大。

从该实验的实验结果中可以归纳出两种现象。一为“符号效应”，认为人们在进行跨期选择时普遍对收益的贴现率高于对损失的贴现率，即人们更愿意立即蒙受损失，“长痛不如短痛”。二为“量值效应”，认为人们在跨期选择时会随着支出或收益的金额的增加而降低贴现率，即人们对于大额支出(收益)的贴现率低于小额支出(收益)。

此后，Loewentein进行了大量行为实验来探究人们在不同情境下的时间偏好。他首先关注到了人们对于收益和损失的不同态度，进行了实验。该实验将某校5个班级的学生作为被试，首先让每个班级的学生两两结对，通过投掷硬币的方式确定一人为胜者，一人为负者。接着，告知每个学生他们将收到当地音像店的7美元礼券。随后将所有结对学生分为两组，一组(记为A组)被告知他们中的胜者将在1个礼拜之后收到礼券，负者在4个礼拜之后收到礼券；另一组(记为B组)被告知他们中的胜者将在4个礼拜之后收到礼券，负者在8个礼拜之后收到礼券。最后，询问A组中的胜者他们愿意维持现状还是提前获得金额较小的礼券亦或是在4个或8个礼拜后获得金额更大的礼券，并填写具体金额；询问A组中的负者及B组中的胜者他们愿意维持现状还是在1个礼拜后获得金额较小的礼券亦或是在8个礼拜后获得金额更大的礼券，并填写具体金额；询问B组中的负者他们愿意维持现状还是在1个或4个礼拜后获得金额更小的礼券，并填写具体金额。

根据询问及填写结果，得到以下数据表格内所读数据均为平均数，且括号内表示贴现率：

根据表 9中的实验结果，我们可以发现第二列数据的贴现率明显高于第三列数据。这就说明人们对于延迟收入所要求的贴现率要大于提前收入所愿意支付的贴现率。Benzion et al(1989) 做了一个关于损失的实验，实验结果同样表明人们对于延迟支付所愿意支付的贴现率要低于提前支付所要求的贴现率。这一现象即称为“框架效应”。

表 9 Loewenstein实验结果

1991年，Loewenstein and Nachum Sicherman设计了一个实验来考察人们对于最普遍的两类收入：工资收入和不动产收入的态度。该实验将所有被试分为两组并收到两份问卷。第一组(记为A组)问卷的要求是：假设你现在没有工作，并且在未来六年内唯一的经济来源就是你即将要选择的这份工作，请按照自己的偏好给下面七组工资流(每个工资流总额相等)进行排序，序号1-7表示偏好程度递减。第二组(记为B组)问卷的要求是：假设你现在没有工作，在未来六年内你唯一的经济来源就是将你继承的房子出租给房地产中介所获得的租金，请按照自己的偏好给下面七组租金流(每个租金流总额相等)进行排序，序号1-7表示偏好程度递减。问卷所说的工资(租金)流如表 10所示。

表 10 七组工资(租金)流

表 10中的七组工资(租金)流中，第一组是递减序列，第二组是常数序列，第三至第七组是递增序列，且斜率越来越大。根据实验结果统计，首先，在A组中只有7.3%的被试是基于当下进行考虑的，即排序方式为1, 2, 3, 4, 5, 6, 7(最偏好第一组，其次第二组，…，最后第七组)。在B组中，也仅有23.1%的被试作出这种当下利益最大化的选择。再者，A组中仅有12.2%的被试将第一组工资流作为第一选择，B组中将第一组工资流作为第一选择的被试比例为33.3%。显然，人们在进行选择时产生了明显的负时间偏好倾向，即大多数人希望自己能够“越来越好”。这与DU模型正时间偏好的假设相悖，人们倾向于“把好的东西留在最后”，而不是仅仅考虑到当下利益最大化。同样地，Chapman(2000) 设计了一个实验，在实验中他让被试假想自己头痛，头痛程度可以选择是渐强或是渐弱，头痛持续时间包括1个小时、1天、1个月、1年、5年和20年，实验结果表明无论是哪种持续时间，绝大多数(82%-92%)被试都愿意选择头痛程度减弱。这同样体现出人们的负时间偏好，倾向于“把坏的东西放在最前面”。

Loewenstein and Prelec(1993)通过就餐选择问题来考察人们的选择与选择之间是否独立。该实验要求被试决定未来五周周六晚餐的就餐问题，并提供以下四组选择(“美味法国菜”指在一家美味的法国餐厅进餐，“美味龙虾”指的是在一家四星级饭店品尝精致的龙虾晚宴)。先在第一组和第二组中进行选择，随后在第三组和第四组中进行选择。

根据实验结果统计，在第一组和第二组就餐选择上，11%的被试偏好于第一组，89%的被试偏好于第二组。而在在第三组和第四组就餐选择上，49%的被试偏好于第三组，51%的被试偏好于第四组。根据消费独立性假设，由于第一、二组与第三、四组之间除了第五周的就餐计划，其余选择完全一致，那么若是被试在第一、二组之间表现出了明显的偏好于第二组的倾向，则在第三、四组之间也应该表现出明显的偏好于第四组的倾向，然而事实是被试在第三组与第四组之间不存在明显的偏好。这意味着DU模型中独立性假设与人们在生活中的跨期选择行为相悖。

表 11 四组就餐选择

实验(一)设置了对照组来更直观地说明实验结论，其余实验遵循了随机的原则来选择被试，总体来说，实验方法简单易懂，实验数据采集、处理规范，实验结果是可靠的。当然，这些实验还存在许多可以改进的地方。首先，以上实验均没有提及性别分布等基本信息，导致没有考虑到男性女性对于风险偏好、时间偏好的差异等，实际上在如今的实验中，常常会在正式实验开始之前先对被试进行简单的测试(以确保对实验规则的充分了解)和信息采集(以便于比较不同群体对于时间偏好的差异)。其次，实验仅仅是通过问卷的形式进行提问，而不是提供真正的礼券或是金钱，这会使被试在回答问题时由于并非关乎切身利益而存在随意性，不能最大程度模拟出他们的时间偏好。最后，实验(二)是到了某一学校某五个班级进行实验，群体仅仅为学生，也并非通过招募的方式使得被试自愿参与，其中有些被试的动机就会不太一样，如仅仅是听从老师的安排等，影响实验结果。

DU模型自问世以来，因其高度理性甚至“严苛”的假设而引发诸多学者关于其是否能有效应用于现实生活实践的疑问。随着行为实验的展开，DU模型作为行为的描述性模型却与人们实际的跨期选择行为存在诸多违背这一重大缺陷也暴露了出来，过于理想化的指数贴现技术无法解释人们复杂的跨期选择行为。实际上，行为经济学家们所发现的异象远不止以上五种，诸多异象的存在使得学者们无法简单地将其归为谬误，而是致力于寻找能更贴切地描述人们跨期选择行为的模型。

四、行为经济学时间不一致性偏好理论

行为经济学对新古典时间偏好理论的突破体现在两个方面：在思想路线上，抛弃了“理性经济人假设”代之以“行为人假设”，认为现世中的人并非“上帝人”，不具备全知全能的视角(在新古典时间偏好理论中，这一特质称为“偏好的完备性”)，“动物人”仅能具备“有限理性”(Herbert Simon, 1959)，存在认知偏差；在技术路线上，形成了较为系统的数理模型——双曲线贴现模型取代指数贴现模型，来解释时间偏好不一致等市场异象，并在实际应用中取得较大的成功。

在DU模型问世近二十年后， Strotz(1956)率先指出指数贴现模型中固定贴现率的假设是缺少根据的，尝试考虑使用别的模型，或许能得到贴现率递减的结论并解释普遍存在的时间不一致性偏好。Strotz虽然并没有给出具体的模型，但他的观点仍然给了当时的经济学家们很大的启发。 Chung and Herrnstein(1961)在一次动物行为实验中采用了贴现函数

$D\left( \tau \right) = \frac{1}{{{{\left( {1 + \alpha \tau } \right)}^{\frac{\gamma }{\alpha }}}}},\alpha ,\gamma > 0$

(3)

来描述实验结果。这个贴现函数的贴现率为$\frac{\gamma }{{1 + \alpha \tau }}$，很明显在参数α，γ给定的情况下，贴现率随时间τ的增长递减。 Laibson David(1997)使用这个贴现率得出了双曲线贴现模型的基本范式：

${U^t}\left( {{c_t}, \cdots {c_T}} \right) = u\left( {{c_t}} \right) + \beta \sum\limits_{\tau = 1}^{T - t} {{\delta ^\tau }u\left( {{c_{t + \tau }}} \right)} $

(4)

目前应用较为广泛的是(4) 式的改进形式——半双曲线贴现模型。其基本范式为：

${U^t} = u\left( {{c_t}} \right) + \beta \sum\limits_{\tau = 1}^\infty {{\delta ^t}u\left( {{c_{t + \tau }}} \right)} ,0 ＜ \beta \le 1,\delta \le 1$

(5)

该范式既继承了双曲线贴现模型贴现率递减的特征，又维持了指数贴现模型计算上的简便性，因此被视为成熟的双曲线贴现模型。该模型在经济学领域得到了很大关注， Laibson et al.(1998)和 George-Marios Angeletos et al. (2001)同时使用DU模型和(β，δ)函数来校准消费-储蓄模型，将模拟数据与真实数据比较发现，双曲线贴现能更好地解释学者们过去在消费-储蓄问题上得出的研究结论。 Laibson(1997)利用(β，δ)函数研究了非流动资产(比如房产)的作用，研究发现，非流动资产作为一种不完全的承诺工具，可以通过其与财富的捆绑实现限制消费的目的，以解决欧美国家过度消费的问题。 Angeletos et al.(2001)使用双曲线贴现解释了人们在退休前高财富、低流动资产持有、高信用卡负债共存的问题。 Kirby(1999)将(β，δ)函数应用在对上瘾行为的分析上，研究发现平均而言，瘾君子的贴现率是对照组的2倍(p=0.04)。 O'Donoghue and Rabin (2000)用双曲线贴现解释了为何人们会过度消费上瘾产品。在对拖延问题的分析上， Carolyn Fischer(2001)发现对于工作的拖延是由于人们消费娱乐产品的贴现率高于对工作奖励的贴现率。 Cameron Hepburn(2010)将双曲线贴现模型应用到了环境问题上，通过构建双曲线贴现下的资源管理模型，研究执行者的时间不一致行为对环境的破坏程度。

此外，行为经济学作为一门交叉学科，借鉴了心理学上的“展望理论”(Prospect Theory; Kahneman and Tversky, 1979; Tversky and Kahneman, 1991)形成参照点模型(Reference-Point Models)用以解释符号效应、量值效应和框架效应等市场异象。该模型认为人们在做出决策时内心是依据一个参照点的，它依赖于个体的消费习惯、社会地位等因素，第τ期的即时效用函数形式是u(c_τ, r_τ)=v(c_τ－r_τ)，r_τ就是所谓的参照点。假设个体对于立即得到10美元和一年后得到20美元的偏好是无差异的，那么他对于立即得到100美元和一年后得到200美元应该是偏好后者的，因为虽然两者的变动比率是相同的，但后者的绝对变动水平大于前者，故而量值效应得以解释。至于框架效应，由于“损失厌恶”的存在，人们对于延迟消费是不偏好的，因此人们会对延迟收入、加速支付要求更高的贴现率。同理，人们不偏好延迟支付，因此对于收益将要求比损失更高的贴现率，这就是符号效应( Loewenstein and Prelec, 1992)。

除此之外，还有预期效用模型(Models Incorporating Utility from Anticipation； Lowenstein, 1987)等，认为由预期效用所致的评估贴现率时的主观性是造成各种异象的主要原因。其基本范式为

$u\left( {{c_\tau };{c_{\tau + 1}},{c_{\tau + 2}}, \cdots } \right) = v\left( {{c_\tau }} \right) + \alpha \left[ {\gamma v\left( {{c_{\tau + 1}}} \right) + {\gamma ^2}v\left( {{c_{\tau + 2}}} \right) + \cdots } \right],\gamma ＜ 1$

(6)

这些模型本质上都是对DU模型即时效用函数进行修正，但又都只针对DU模型的某些方面进行修正，结合这些模型的观点能更有效解释人们复杂的跨期选择行为。

五、时间偏好的神经基础

长期以来，经济学家们对于人们在做出跨期选择行为时表现出来的时间不一致性偏好持有两种观点。其一认为造成这种动态不一致的是单个的决策系统( P. Bloom, 2000; H. Wiese, 2003)，另外一个观点则认为这种不一致是由两个不同决策系统之间的相互作用共同驱动产生的( S. Dehaene et al., 1998; E. Spelke et al., 2001)。 M. Samuel McClure et al.(2004)在实验中组织被试进行一系列较小/较早和较大/较晚金钱报酬之间的二元选择时通过功能性磁共振成像技术(fMRI)观测人类的大脑活动，发现大脑确实是存在两个系统以截然不同的方式运行，与理性和计算相关的前额叶(PFC)和顶叶皮层(parietal cortex)负责对遥远的将来做长期预期，而短期决定则由与中脑多巴胺系统相连的大脑边缘系统(limbic system)掌管，该系统主要包括腹侧纹状体(VS)，内侧眶额叶皮质(MOFC)和内侧前额叶皮质(MPFC)，通常更倾向于及时满足需求。当人们作出延迟获得更多报酬的选择时，PFC和顶叶皮层显著活跃，且实验任务难度越高，其活跃度越高；而在决定立即得到报酬时被试大脑边缘系统的活跃度显著增强。

前额叶皮质(PFC)是大脑新皮层中端脑皮质的一个大区，它包括了背外侧前额叶皮质(DLPFC)、背内侧前额叶皮质(DMPFC)和腹内侧前额叶皮质(VMPFC)三个皮质脑区。从神经进化学的角度看，人类前额叶皮质的体积超过普通灵长类动物约30%-40%，由此提示人类智力水平的提升可能主要来自该神经组织的进化。前额叶皮质与大脑神经中枢以及其它部位(如顶叶、枕叶、颞叶、丘脑、脑干以及边缘系统等)都有着非常广泛的神经联系，通过神经元接受由大脑各部位传入的信息，并对这些信息进行评估、编码和综合后再输送给相关脑区，以协调包括思维、判断、决策和行为在内的人类所有高级认知活动。因此，PFC被称为“大脑总指挥”( 高德伯格，2014)。PFC受损会使人表现出以短视、缺少理性为特征的“奖励依赖综合征”。( Lhermitte, 1986)

顶叶皮层(parietal cortex)位于大脑中央沟之后，顶枕裂于枕前切迹连线之前。横行的顶间沟将顶叶余部分为顶上小叶和顶下小叶。顶下小叶又包括缘上回和角回。顶叶皮层能够响应疼痛、触摸、品尝、温度、压力的感觉，同时也与数学和逻辑等复杂认知活动相关。有研究表明，一个人的顶叶后区体积越大，他的逻辑思维、发散思维就越强；顶叶前区越大，他在身体协调性、感知能力等方面就越强。

边缘系统(limbic system)所包括的大脑部位相当广泛，如梨状皮层、内嗅区、眶回、扣带回、胼胝体下回、海马回、脑岛、颞极、杏仁核群、隔区、视前区、下丘脑、海马以及乳头体等等。因其主要部分环绕大脑两半球内侧形成一个闭合的环，故而得名。它参与调解本能和情感行为、内脏活动，并与情绪、行为、学习和记忆等心理活动密切相关。被称为“情感的大脑”。

Samuel M. McClure et al.(2007)在研究关于初级奖励(如橙汁、水等基本需求)的脑区时将半双曲线贴现模型的基本范式做一定程度上的变形得到

${W^t} = \underbrace {\left( {\frac{1}{\beta } - 1} \right)u\left( {{c_t}} \right)}_{\beta 系统} + \underbrace {\sum\limits_{\tau {\rm{ = }}0}^\infty {{\delta ^\tau }u\left( {{c_{t + \tau }}} \right)} }_{\delta 系统}$

(7)

该式能更为直观地揭示大脑在做出跨期选择时的双系统原理。β系统通常给当下的奖赏赋以更高的权重，使得人们做出较为短视的选择；δ系统则严格以δ为贴现因子遵照指数贴现法则做出长远决策。以上是就数学层面而言的，就神经层面而言，β系统对应处理信息的脑区就是边缘系统，δ系统对应于PFC和顶叶皮层。该实验结果表明，人类感应初级奖励的脑区，尤其是当选择立即获得奖励时活跃的脑区与金钱奖励有所差异。感应即时初级奖励的脑区主要是双侧原发皮质(bilateral primary taste cortex)、前运动区(PMA)和腹侧纹状体(VS)，这些感应区也位于边缘系统。对这种差异的解释是边缘系统通常会涉及很多具体的刺激或任务，不同刺激或任务所涉及的具体区域则取决于奖励模式，时间尺度或特定任务环境中的其他细节。我们注意到，VS同时参与两种奖励的神经活动，它由伏隔核、嗅结节组成，主要参与大脑中不同神经功能环路的调控，除了调节运动环路控制人的肢体运动平衡外，还参与认知调控环路以调节人的认知能力和情感行为调控环路以调节情绪，也是已知传播奖励信息的中脑多巴胺神经元的主要投影站点( Schultz et al., 1997)。

神经经济学研究成果表明，人类大脑在表征事物价值(效用)时是通过将事物的物理性质经过人的感觉器官输送给参与跨期选择的神经组织，并由此激发这些神经组织的膜电压，膜电压通过神经元传送至参与决策和行为的脑区，并由这些脑区识别出所有信号中与标准电压方差最大的实时电压信号，并对其他信号进行抑制和屏蔽，即通过一种所谓“赢者通吃”(winner-take-all)的法则最终转化为大脑中枢神经唯一有效的执行命令，并以此来指导人的行动( 格莱姆齐，2016)。因此，当问及在立即获得10美元与明天获得11美元之间人们常常选择前者，而当问及在30天后获得10美元与31天获得11美元之间人们又倾向于选择后者，这是由于当涉及当下的奖赏时，常常是边缘系统起主导作用指导人们的选择，而当涉及到长期计划时，又由PFC和顶叶皮层起主导作用，引导人们做出具有长远打算的选择。这就形成了时间不一致性偏好。也就是时间偏好不一致形成的微观神经机理。

行为实验和以fMRI为技术手段的神经实验为时间偏好不一致真实有效地存在于人类大脑中提供了全新的、系统的证据，时间偏好不一致正是通过自然选择将相应的行为规则在人类神经系统中内部化的结果。就神经经济学而言，它完成了两个目标：第一，找到了人类大脑中负责作出跨期选择的神经组织；第二，揭示了在时间偏好不一致情境下作出跨期选择的微观神经机理。

六、结语

DU模型作为新古典时间偏好理论的核心技术手段，将时间偏好理论的研究带入了数理分析的新时代，而在人们跨期选择行为中普遍观察到的贴现率递减、偏好逆转( Green et al., 1994; Kirby and Herrnstein, 1995; Jay Solnick et al., 1980))等异象切实存在却无法据其得到解释，始终是新古典时间偏好理论的阿喀琉斯之踵。随着行为经济学的兴起，符号效应、量值效应、框架效应等更多的市场异象被发现并得到认可，跨期选择行为中表现出来的时间不一致性偏好几乎成为了对传统经济学的一种拷问。

传统经济学是规范性经济学，旨在教会人们应该怎么做才能达到效用最大化，而行为经济学是描述性经济学，其目标在于准确描述并解释人们决策时的心理，根据真实的行为建立数理模型并进行行为预测。就时间偏好理论而言，行为经济学的改进表现在对即时效用函数的更替上，更贴切地描述了人们的跨期选择行为；并引入不耐心递减、有限意志力、估测偏见、参照点依赖等观点完成了对时间不一致性偏好等诸多市场异象的解释，形成一套较为系统的全新的时间偏好理论。神经经济学则进一步从微观神经活动的角度为行为实验的研究成果提供神经基础。

总之，本文的核心结论可归纳为：传统经济学通过对时间偏好成因的定性总结使得人们初步揭开了时间偏好的面纱；行为经济学通过对人们真实行为的观测，建立起了一套全新的理论体系，该体系能更有效地对人们的决策行为作出解释和预测，具有更强的应用能力，为时间偏好理论的研究增添了新的活力；神经经济学应用功能性磁共振成像技术通过对人类大脑的观测，在行为实验的基础上进一步证实了时间不一致性偏好是有神经基础的。

然而，目前国内对时间偏好理论的研究基本处于停滞状态，DU模型仍在国内经济学领域的研究中广泛采用，有关行为经济学时间偏好理论及其核心技术手段——双曲线贴现模型仅停留于书本上而未投入实际应用，相比于国际上大量这方面的研究及应用，其差距日益扩大。本文通过对时间偏好理论发展历程的回顾和关于行为经济学、神经经济学带来的突破的介绍，希望能够对推动国内时间偏好理论研究发展有所裨益，缩小该领域国内与国际水平间的差距。

参考文献

[]	费雪, 2013, 《利息理论》中译本, 陈彪如译, 商务印书馆.
[]	高德伯格, 2014, 《大脑总指挥: 揭秘最具人性的大脑区域》中译本, 黄有志、邱小菊译, 华东师范大学出版社.
[]	格莱姆齐, 2016, 《神经经济学分析基础》中译本, 贾拥民译, 浙江大学出版社.
[]	金迪斯, 2011, 《理性的边界: 博弈论与各门行为科学的统一》中译本, 董志强译, 上海三联书店.
[]	凯莫勒, 2010, 《行为经济学新进展》中译本, 贺京同、宋紫峰、杨继东、那艺译, 中国人民大学出版社.
[]	庞巴维克, 2010, 《资本与利息》中译本, 何崑曾、高德超译, 商务印书馆.
[]	威尔金森, 2012, 《行为经济学》中译本, 贺京同、那艺译, 中国人民大学出版社.
[]	西蒙, 2007, 《管理行为》中译本, 詹正茂译, 机械工业出版社.
[]	西尼尔, 1977, 《政治经济学大纲》中译本, 蔡受百译, 商务印书馆.
[]	叶德珠、王聪、李东辉, 2010, “行为经济学时间偏好理论研究进展”, 《经济学动态》, 第 4 期, 第 99–103 页。
[]	Ainslie George, Richard J. and Herrnstein , 1981, "Preference Reversal and Delayed Reinforcement". Animal Learning Behavior, 9(4), 476–482. DOI:10.3758/BF03209777
[]	Angeletos , George-Marios , David Laibson, Andrea Repetto, Jeremy Tobacman and Stephen Weinberg, 2001, "The Hyperbolic Consumption Model:Calibration, Simulation, and Empirical Evaluation". The Journal of Economic Perspectives, 15(3), 47–68. DOI:10.1257/jep.15.3.47
[]	Cameron Hepburn, Stephen Duncan and Antonis Papachristodoulou, 2010, "Behavioural Economics, Hyperbolic Discounting and Environmental Policy". Environmental and resource economics, 46(2), 189–206. DOI:10.1007/s10640-010-9354-9
[]	Carolyn Fischer, 2001, "Read This Paper Even Later:Procrastination with Time-Inconsistent Preferences". Journal of Economic Behavior and Organization, 46(3), 249–269. DOI:10.1016/S0167-2681(01)00160-3
[]	Chung , Shin-Ho , Richard J. and Herrnstein , 1961, "Relative and Absolute Strengths of Response as a Function of Frequency of Reinforcement". Journal of the Experimental Analysis of Animal Behavior, 4(3), 267–272. DOI:10.1901/jeab.1961.4-267
[]	E. Spelke, S. Tsivkin, 2001, Language Acquisition and Conceptual Development, Published by Cambridge University Press.
[]	Frederick , Loewensteinand O'Donoghue, 2002, "Time discounting and time preference:A critical review". Journal of Economic Literature, 40(2), 351–401. DOI:10.1257/jel.40.2.351
[]	Green Leonard, Astrid Fry and Joel Myerson, 1994, "Discounting of Delayed Rewards:A Life-Span Comparison". Psychological Science, 5(1), 33–36. DOI:10.1111/j.1467-9280.1994.tb00610.x
[]	Green Leonard E. B., Fischer Jr., Steven Perlow and Lisa Sherman, 1981, "Preference Reversal and Self Control:Choice as a Function of Reward Amount and Delay". Behav. Anal. Letters, 1(1), 43–51.
[]	Green Leonard, Nathanael Fristoe and Joel Myerson, 1994, "Temporal Discounting and Preference Reversals in Choice Between Delayed Outcomes". Psychonomic Bulletin and Review, 1(3), 383–389. DOI:10.3758/BF03213979
[]	H. Wiese, 2003, Numbers, Language and the Human Mind, Published by Cambridge University Press.
[]	Kahneman Daniel, Amos Tversky, 1979, "Prospect Theory:An Analysis of Decision Under Risk". Econometrica, 47(2), 263–292. DOI:10.2307/1914185
[]	Kirby , Kris N., 1997, "Bidding on the Future:Evidence Against Normative Discounting of Delayed Rewards". Journal of Experimental Psychology:General, 126(1), 54–70. DOI:10.1037/0096-3445.126.1.54
[]	Kirby , Kris N., Nancy M., Petry and Warren Bickel, 1999, "Heroin Addicts Have Higher Discount Rates for Delayed Rewards than Non-Drug-Using Controls". Journal of Experimental Psychology:General, 128(1), 78–87. DOI:10.1037/0096-3445.128.1.78
[]	Kirby , Kris N., Nino N. and Marakovic , 1995, "Modeling Myopic Decisions:Evidence for Hyperbolic Delay-Discounting with Subjects and Amounts". Organizational Behavior and Human Decision Processes, 64(1), 22–30. DOI:10.1006/obhd.1995.1086
[]	Kirby , Kris N., Richard J. and Herrnstein , 1995, "Preference Reversals due to Myopic Discounting of Delayed Reward". Psychological Science, 6(2), 83–89. DOI:10.1111/j.1467-9280.1995.tb00311.x
[]	Koopmans , Tjalling C., 1960, "Stationary Ordinal Utility and Impatience". Econometrica, 28(2), 287–309. DOI:10.2307/1907722
[]	Laibson D., 1997, "Golden eggs and hyperbolic discounting". Quarterly Journal of Economics, 112(2), 443–477. DOI:10.1162/003355397555253
[]	Laibson David, Andrea Repetto and Jeremy Tobacman, 1998, "Self-Control and Saving for Retirement". Brookings Papers on Economics Activity, 1, 91–196.
[]	Lhermitte F., 1986, "Human autonomy and the frontal lobes. Part 2:Patient behavior in complex and social situations-the environmental dependency syndrome". Annals of Neurolgy, 19(4), 335–343. DOI:10.1002/(ISSN)1531-8249
[]	Loewenstein George, 1987, "Anticipation and the Valuation of Delayed Consumption". The Economics Journal, 97(387), 666–684. DOI:10.2307/2232929
[]	Loewenstein George, 1988, "Frames of Mind in Intertemporal Choice". Management Science, 34(2), 200–214. DOI:10.1287/mnsc.34.2.200
[]	Loewenstein George, Drazen Prelec, 1991, "Negative Time Preference". The America Economic Review, 81(2), 347–352.
[]	Loewenstein George, Drazen Prelec, 1992, "Anomalies in Intertemporal Choice:Evidence and an Interpretation". Quarterly Journal of Economics, 107(2), 573–597. DOI:10.2307/2118482
[]	Loewenstein George, Drazen Prelec, 1993, "Preferences for Sequences of Outcomes". Psychological Review, 100(1), 91–108. DOI:10.1037/0033-295X.100.1.91
[]	Loewenstein George, Nachum Sicherman, 1991, "Do Workers Prefer Increasing Wage Profiles?". Journal of Labor Economics, 9(1), 67–84. DOI:10.1086/298259
[]	McClure S.M., Laibson D.I., Loewenstein G. and Cohen J.D., 2004, "Separateneural systems value immediate and delayed monetary rewards". Science, 306(5695), 503–507. DOI:10.1126/science.1100907
[]	McClure S.M., Ericson K. M., Laibson D.I., Loewenstein G. and Cohen J.D., 2007, "Time Discounting for Primary Rewards". The Journal of Neuroscience, 27(21), 5796–5804. DOI:10.1523/JNEUROSCI.4246-06.2007
[]	O'Donoghue , Ted and Matthew Rabin, 1999, "Incentives for Procrastinators". Quarterly Journal of Economics, 114(3), 769–816. DOI:10.1162/003355399556142
[]	O'Donoghue, Ted and Matthew Rabin, 2000, Addiction and Present-Biased Preferences, Cornell University and U. C. Berkeley Working Papar, No.E02-312.
[]	O'Donoghue , Ted and Matthew Rabin, 2001, "Choice and Procrastination". Quarterly Journal of Economics, 116(1), 121–160. DOI:10.1162/003355301556365
[]	P. Bloom, 2000, How Children Learn the Meanings of Words, Published by MIT Press.
[]	Pollak , Robert A., 1968, "Consistent Planning". The Review of Economic Studies, 35(2), 201–208. DOI:10.2307/2296548
[]	Rae John, 1834, The Sociological Theory of Capital, Published by Macmillan Press.
[]	Dehaene S., Dehaene-Lambertz G. and Cohen L., 1998, "Abstract representations of numbers in the animal and human brain". Trends in Neurosciences, 21(8), 355–361. DOI:10.1016/S0166-2236(98)01263-6
[]	Samuelson P., 1937, "A note on measurement of utility". Review of Economic Studies, 4(2), 155–161. DOI:10.2307/2967612
[]	Schultz W., Dayan P. and Montague P.R., 1997, "A neural substrate of prediction and reward". Science, 275(5306), 1593–1599. DOI:10.1126/science.275.5306.1593
[]	Solnick Jay, Catherine Kannenberg, David Eckerman and Marcus Waller, 1980, "An Experimental Analysis of Impulsivity and Impulse Control in Humans". Learning and Motivation, 11(1), 61–77. DOI:10.1016/0023-9690(80)90021-1
[]	Strotz R. H., 1956, "Myopia and Inconsistency in Dynamic Utility Maximization". The Review of Economic Studies, 23(3), 165–180.
[]	Suranovic Steven, Robert Goldfarb, Thomas C. and Leonard , 1999, "An Economic Theory of Cigarette Addiction". Journal of Health Economics, 18(1), 1–29. DOI:10.1016/S0167-6296(98)00037-X
[]	Thaler , Richard H., 1981, "Some Empirical Evidence on Dynamic Inconsistency". Economics letters, 8(3), 201–207. DOI:10.1016/0165-1765(81)90067-7
[]	TverskyAmos , Kahneman Daniel, 1991, "Loss Aversion in Riskless Choice:A Reference Dependent Model". Quarterly Journal of Economics, 106(4), 1039–1061. DOI:10.2307/2937956