云圆桌 | 大数据助力疫情防控

作者: 发布时间:2020-02-27 18:01:10 来源:复旦发展研究院+收藏本文


1.jpg





2020年2月20日下午,复旦发展研究院组织召开了“智库思享汇·云圆桌”第二期:“大数据与新冠疫情防控讨论主题会议”,与会专家围绕“如何利用大数据以更好地精准应对新冠肺炎防控和社会经济恢复”等问题展开主题发言和自由讨论。会议由复旦发展研究院常务副院长、社会学院教授彭希哲主持,复旦大学管理学院黄丽华、经济学院吴力波、社会发展与公共政策学院张伊娜、国际关系与公共事务学院郑磊、新闻学院周葆华、上海市科研领域大数据联合创新实验室殷沈琴、人口与发展政策研究中心朱勤、计算机学院卢暾、发展研究院张怡等参加了此次会议。以下为部分专家发言要点:




黄丽华 复旦大学管理学院教授

根据对117家上海互联网企业所做的调研,提出:

1.疫情对上海互联网行业造成短期冲击,表现为企业营收下降和坚持抗疫造成的短期成本上升。

2.疫情对上海互联网企业造成了中长期影响,这种影响风险和机遇并存。74%的企业认为,疫情后业务将恢复之前水平,15%的企业认为疫情创造了新的市场机会,特别是在线教育、医药资源、线上办公等。

3.上海互联网企业存在政策诉求:年营收50万以下的微型互联网企业更需要政府创新贷款方式和直接资金补助;50万-1亿的中小企业需要政府加大社保费用灵活性,适当减免疫情期间社保费用;1亿元以上的大型互联网企业诉求更集中在减税降费和物流仓储成本补贴的减免。

4.建议上海市积极出台互联网专项政策,提振互联网行业信心,重点帮扶中小互联网企业渡过寒冬;主动跟踪互联网企业需求,提升产业政策靶向性;注意把握政策节奏,应对不同领域互联网企业产生的短期和中长期影响。




张伊娜复旦大学社会发展与公共政策学院副教授

基于对银联等的数据源分析研究,指出:

1.根据银联的数据,上海今年1月份消费与去年同期比较来看,餐饮类的消费不足去年同期的三成;电影演出服务仅有去年同期的10%,成为“受伤”最重的行业;旅游景点类、酒店业消费相当于去年同期的4成。

2.对上海人群消费进行了比对,分别是本地常住人口在本地的消费,本地常住人口在异地的消费,异地人口在本地的消费。其中,2020年1月上海本地常住人口在本地的消费几乎没有下降,但是另外两块下幅较大,相比2019年12月份下降50%-60%。




殷沈琴 上海市科研领域大数据联合创新实验室副教授

对公开数据源、政府数据源、银联消费数据以及唯智位置数据这四类疫情数据源做了介绍,其中:

1.公开数据源涵盖全国和全省疫情数据集、疫情舆情数据集、各省市出台的疫情法律法规、疫情犯罪数据案例集以及交通运输部提供的春运期间人口迁徙数据。

2.政府数据源主要包括国家卫健委流动人口动态监测数据、上海市公安局人口数据和教委复课数据。

3.银联消费数据来自于集疫情监控、影响分析以及灾后重建预测的智能化大数据应用平台,该平台主要以疫情监控和后疫情时期的经济恢复监控为主。

4.唯智位置数据主要用于疫情网格化防控管理服务,数据仍需购买后使用。




周葆华复旦大学新闻学院教授

对疫情相关的舆情分析做了介绍:

1.团队目前主要依靠公开社交媒体的信息(微博为主)和互联网公司信息相结合,产出关于疫情中舆情表现的分析,聚焦于网民的需求困难梳理和苗头性问题的跟进,围绕地方治理等集中性问题分析建言。

2.在疫情舆情方面,就官员问责事件与相关媒体进行合作,提出了一些合理化建议;在微博求助数据方面,一开始网络大数据杂音比较多,求助效果不理想,在向微博积极反映后,微博也开设了求助超话,管理求助信息,推动了求助信息的渠道完善和问题逐步解决;在常规舆情方面,重点关注前一阶段的地方治理问题、红十字会的问题、过度防控和违反法治等问题、媒体相关的性别问题、过度宣传问题等。最近出现的新问题还包括:疫情防控与经济恢复的关系、日本和新加坡的疫情对中国的反向影响等国际问题。

3.带领学生团队抓取并挖掘在线医疗、微博辟谣两方面的数据,形成了两个数据新闻作品——《数读在线医疗 | 疫情期间如何看病?线上问诊或能帮忙》、《看了946条辟谣信息,我们提炼出一些信息辨别方法》,已均在澎湃新闻刊出,产生较好社会效果。




吴力波 复旦大学经济学院教授

就大数据研究院在研的和疫情相关的两个重要项目做了介绍:

1.人群预警工作。具体工作流程是根据确诊人群、疑似人群和隔离人群的电信轨迹特征,锁定密切接触人群,以街道为单位给出各个区域风险指数;针对发病人群进行个体追踪,结果反馈给疾控中心,由疾控中心进行医学调查。

2.由电力大数据承接的“复产指数”研究。主要针对上海市36000企业的复产、复工程度,主要关注人群的聚集特征,企业复产有哪些聚集性风险,对疑似病例存在潜在接触的地点进行预警。

3.当前复产问题的评估难点在于仅仅依靠电力观察、居家办公和商业用电情况存在偏差和误判。目前的研究数据依然主要来自于电信数据,呼吁尽快开通移动和联通的数据,实现全网病例追踪。




郑磊 复旦大学国际关系与公共事务学院教授

数据开放问题:

1. 目前大部分地方依然在以传统的文字形式发布疫情数据,还没有以结构化的、可机器读取的数据集形式来开放疫情数据,不利于社会对数据进行开发利用。

2. 最近,深圳等多个城市已开始在开放数据平台上,以结构化、可机读数据集的形式向社会开放疫情数据,每天更新,包括病情、年龄、就诊医院,行动轨迹等字段,可以直接下载使用。目前已有各种企业和机构利用这些开放数据来开放应用和制作可视化产品,为公众提供信息服务。

3. 某些城市发布了每个病例的描述信息,而某些城市出于各种考虑并没有发布类似信息。

4.关于隐私泄露的问题,有些地方政府公布了确诊病例的住宅房号、私家车车牌,基本等于将患者信息实名公开了。需要平衡好保障公众知情权和保护病患隐私之间的关系,把握好“度”至关重要。

5.针对手机信令数据是否应当开放的问题,国企运营商采集的手机信令数据本质上是一种公共数据,当面临重大公共危机事件时,应在小范围内向研究机构免费提供不涉及隐私字段的手机信令数据,供科研目的使用,以实现整个社会公共利益的最大化,而不应向研究机构收取费用。




朱勤 复旦大学人口与发展政策研究中心教授

从系统动力学的角度提出:

1.我们用系统动力学的模型对疫情进行了模拟,系统动力学在加入政策干预变量后相对于一般传染病模型的解释力更强,该模型主要考虑了自我防护、病例隔离、病患筛查、医疗条件改善等干预措施,以及就诊和确诊的延迟环节等。根据模拟结果,疫情蔓延已得到有效遏制,若保持现有防控力度,湖北以外地区疫情反弹的可能性不大。

2.数据来源于国家卫健委和湖北卫健委。从预测数据看,总体符合疫情发展预期。

3.出于停工成本的考虑,应当严格区分湖北和湖北以外地区,因地施策,抓紧做好湖北以外地区复产复工工作;同时,很多癌症患者的诊治在疫情期间停滞,应当考虑优先解决这部分患者的问题。

4.在大数据应用方面,浙江有很多好的做法值得学习,例如居民申领健康码并按照安全等级分类。一味升级管控是不可取的。

5.应当充分发挥应急管理部的职责。




卢暾 复旦大学计算机学院副教授

从社会计算和社会大数据的角度介绍和提出:

1. 关注跨源数据的多主体多群体画像及其演化。可以通过传统媒体(纸媒、电视等)和社交媒体(微博、微信公众号等)收集的跨源数据,为不同主体和群体做画像,包括各级政府、科研机构、科学家群体、各类大V等,做画像,并通过时间序列分析描述画像的演化;

2. 关注不同角色在危机过程当中的应对和协作模式。特别应该注意在信息的过滤和处理后,可能同时存在负面的效果,比如小区社群在信息过滤和决策之后,可能会产生阻止回家医护人员进入的负面行为;在不具备专业知识的情况下,部分信息源过度解读或误读科学论文的结论,导致不少不实信息和恐慌,以及线下负面同步行为;

3. 关注多源大数据,如实时性和表达性更强的直播相关数据,同时希望利用文本挖掘、主题挖掘、情感分析,以及时间序列分析技术,探索政府发布政策和大众对政策理解之间的内容偏差和时效模式;

4. 要防止在大数据利用过程中出现对大数据的盲目信任和过分依赖。不要让大数据成为自动决策依赖的唯一路径,需要区分特殊人群,允许被决策对象的主动参与、反馈和评估,例如不能因为疫情出现而导致不公平救治的问题;同时应为自动决策提供可解释、透明、可信的机制、规则、示例和方法。


记录整理 | 白玉川 邓梦佳