消费者权益保护视角下的金融产品可读性分析——基于对保险条款可读性的度量与检验

作者:许闲、杨昊 发布时间:2022-04-10 来源:《保险研究》2022年第1期+收藏本文

作者简介: 

许闲,复旦大学经济学院风险管理与保险学系主任,复旦发展研究院中国保险与社会安全研究中心主任,中国保险科技实验室主任; 

杨昊,复旦大学经济学院本科生。


文章来源:《保险研究》2022年第1期


本文构建了保险条款可读性指标,测度了93家保险公司的2872份健康险产品条款的可读性。


结果表明:

从保险产品类型来看

重疾险条款的可读性最优、百万医疗次优、医疗险次之、终身重疾最次;

从公司所有制类型来看

重疾险条款的可读性最优、百万医疗次优、医疗险次之、终身重疾最次;

从公司所有制类型来看

国有保险公司的条款普遍可读性更优;

从公司类型来看

互联网保险公司的条款可读性极强,银行系保险公司和专业健康险公司的条款可读性较差。



一、问题的提出


金融消费者保护对于增强金融消费者信心、维护金融机构信用、维持金融市场秩序和防范金融风险有着至关重要的意义。但是,由于金融产品的专业性和复杂性以及消费者本身金融知识和素养的缺乏,金融消费者面临着产品信息的“鸿沟”,很难正确地认识和理解各类金融产品(赵大伟,2021)。如何提高金融产品信息披露水平,让金融消费者更好地“读懂”金融产品,是我国金融消费者保护面临的重要课题,研究金融产品的可读性也就有了十分重要的现实意义。目前政产学研均未存在统一的方法度量与比较不同类型金融产品合同条款的可读性。本文针对中文金融产品特征构建指标,选取较为复杂的保险产品条款为例检验其有效性,并对我国在售的健康险产品条款可读性做相应分析。


图片




二、保险条款可读性指标构建


本文从文本“质”的维度(单位文字的难易程度)和“量”的维度(文字的多少)考察文本的可读性:


首先看文本“质”的维度。从消费者理解单位文字难易程度的角度出发,可以自然地将对条款可读性的考察划分为对三个层次,即:字、词、句的可读性的考察——难字、难词、难句在单位文字中出现的频数越高,则文本越难理解。保险条款作为法律文本具有严谨、客观的特点,同时作为金融产品的表现形式具有很强的专业性,这些特点导致保险条款本身基本并不含有生僻字,其阅读难度集中表现在语句较长且结构复杂,且专业性词汇较多,例如保险中常见的“保险期间”、“现金价值”、“保费豁免”、“免赔额”的金融词汇,以及“原位癌”、“既往症”、“原发性”等医学词汇往往并不含生僻字,而是由于其极强的专业性使读者出现“字都认识,但是连到一起就不明白了”的阅读困境,因此将生僻字纳入适用于中文保险条款可读性的分析框架可能意义不大。相关的研究者张宁志(2000)在他的可读性指标中也没有涵盖汉字层面的因子,因此本文也不再涵盖字层面的因子,而以难词和难句在单位文字中出现的频数作为文本“质”层面可读性的度量指标。基于此,本文重点从如何衡量词和句层面的难易程度的角度构建指数。


对于词汇而言,越是生僻的词越是难以理解,因此本文以词汇在汉语语境中的使用频率为标准判断词汇难易程度,并以平均100个词汇中难词出现的频数作为词汇层面可读性的度量。本文在定义难词时,参考了清华大学开放中文词库(THUOCL),据此统计了条款中难词的数量,计算得到难词密度= 难词数/总词数 * 100。


而对于句子而言,本文参考了Fog Index和Flesch–Kincaid Index等指标的惯用做法,以平均句长,即单位句子所含字数表示句子层面的可读性。


综合词汇和句子的可读性指标,就可以得到整体文本“质”层面的可读性指数。本文在已有方法的逻辑上做了改进,将难词密度和平均句长分别按Z-Score标准化,将标准化了的因子的平均数作为整体的可读性指数。


再来看“量”的维度。很好理解的是,相较于短小精悍的文本,从长篇大论中读取有效信息的阅读成本是更高的,这也就意味着对消费者而言,条款越长则越难读懂。因此,条款文本的文件大小可以作为“量”维度可读性的度量。


综上所述,本文设计了四种不同的可读性指标。一是平均句长,用以描述句子层面的可读性;二是难词密度,用以描述词汇层面的可读性;三是平均句长和难词频率的标准化分数的平均值,用以衡量总体的可读性(readability);四是文本长度,相比于前三个指标从“质”的维度出发,该指标从“量”的维度衡量了文本的可读性。这四个指标越大,则说明文本可读性越差,越难以理解。


图片




三、保险条款可读性指标



有效性检验



在检验可读性指标的有效性时,通常的做法是检验读者阅读文本后主观的心理感受是否与指标所衡量的水平一致,在Bonsall等人(2017)的研究中使用了完形填空的方法来检验读者对于文本的理解程度。本文借鉴了这种做法,招募了25名受试阅读者,并随机选取了258份健康险保险条款,在实验过程中,受试者将会随机地分配到20~40份不同的保险条款并开始阅读,并被要求在阅读过程中对关键信息点,例如:被保人、保险期间、缴费方式、保险责任、除外责任、保险金额、免赔额、最高限额等保险条款理解的关键信息,在条款中做出标记,并被记录完成标记所用的时间。


在这种实验设计下,完成标记的时长将会反映所标记保险条款的可读性,时间越久则可读性越差,条款越难以理解。基于此逻辑则可以对本文构建的可读性指标进行检验,即好的可读性指标应该与完成时长具有显著的正相关关系。因此,本文对完成时长的自然对数(time)和相关可读性指标做了回归。


检验结果表明,本文构建的四种可读性指标都与完成时长有着显著的正向关系,且指标间具有一定程度的相关性;但是可读性指数,即平均句长与难词密度的标准化分数的平均数,在于其他指标的检验中性质最优。


图片




四、我国健康保险条款出



可读性状况



本文运用前述方法度量了93家保险公司的2872份健康险条款的可读性,其中1364份重疾险条款,1508份医疗保险条款。


本文接下来进一步具体分析比较了我国健康险保险条款的可读性。


第一,比较不同保险类型条款可读性的差异。本文所统计的健康险条款分为两类:医疗险和重疾险,其中又细分出“百万医疗险”和终身重疾险。在控制了公司固定效应之后,用可读性指标对保险类型生成的哑变量做了回归,回归结果表明:从可读性排名来看,重疾险最优、百万医疗次优、医疗险再次、终身重疾最次,同时该结论稳健。该结论也很好理解:医疗险为费用补偿型保险而重疾险为发生给付型保险,从保险责任明确和道德风险的角度来说,重疾险的条款都较医疗险更简单;而百万医疗险作为普通医疗险的升级,通过其高免赔高保额的特点减少了很大一部分的道德风险,同时也为了迎合其便捷销售的特点,因此条款在其他方面的限制上会有所放松,显得更加易读;终身重疾险则将普通短期的重疾保险期间延长至终身,这毫无疑问增大了可保风险,保险公司处于自身利益的考虑有动机将条款表述得更为详尽和缜密,因此可读性上最差。


第二,比较不同所有制类型保险公司的健康险条款可读性。本文定义“国企”为国有独资保险公司,“外资”为中外合资保险公司。采用相同的回归方法,得到结论:国有保险公司在保单文本叙述的通俗易懂方面做得更好。这可能是由于国有企业在销售设计上考虑保险消费者的阅读感受,也有可能是国有企业往往规模更大,受到更严格的监管。


第三,比较不同类型保险公司保险条款可读性。本文选择了三类具有明显特征的保险公司:银行系保险公司、专业健康保险公司和互联网保险公司。结果表明:互联网保险公司的条款可读性极强,可读性指数大幅低于其他类型公司,银行系保险公司和专业健康险公司的条款可读性较差。


本文构建的保险条款可读性指数填补了中文保险产品可读性分析领域的空白,为后续保险产品相关研究积累了经验,也为其他类型的金融产品可读性度量提供了技术参考。同时,这一指标也将为监管和消费者提供必要的参考,可以帮助更好地保护消费者权益,维护更加公平公正的金融市场环境。