报告题目:在存在偏差来源的情况下具有汇总统计量的稳健融合提取程序
报告人:王启华 研究员
报告时间:2023年4月10日(周一)上午 10:00-11:00
报告地点:藕舫楼629会议室
主持人:曹春正 教授
报告人简介:
王启华,中国科学院数学与系统科学研究院研究员,博士生导师,教育部特聘教授,国家杰出青年基金获得者,中科院百人计划入选者。曾在北京大学、香港大学任教及在深圳大学与浙江工商大学任特聘教授,先后访问加拿大、美国、德国及澳大利亚10多所世界一流大学。主要从事复杂数据经验似然统计推断、缺失数据分析、高维数据统计分析、大规模数据分析等方面的研究, 出版专著三部,在The Annals of Statistics, JASA及Biometrika等国际重要刊物发表论文140余篇, 部分工作已产生持久的学术影响。曾主持国家自然科学基金委国家杰出青年基金项目、重点项目、多项面上项目,作为核心骨干成员先后参加了两项国家自然科学基金创新群体项目。是高维统计分会理事长, 生存分析分会副理事长,中国现场统计研究会常务理事,中国概率统计学会常务理事,曾任或现任《中国科学》(中英文版)(2005-2012)、Electronic Research Archive、Ann. Inst. Stat. Math、Biostatistics & Epidemiology 及《应用数学学报》英文版等刊物及《现代数学基础丛书》与《统计与数据科学丛书》的编委。
报告简介:
来自多个数据源的信息越来越可用。但是,由于有偏差的抽样、数据损坏或模型规范错误,某些数据源可能会产生有偏差的估计值。这需要具有有偏见来源的稳健数据组合方法。该文提出一种鲁棒的数据融合提取方法。与现有方法相比,所提出的方法可以应用于研究人员不知道哪些数据源是无偏的重要情况。所提出的估计器易于计算,仅采用汇总统计,因此可以应用于许多不同的领域,例如meta分析,孟德尔随机化和分布式系统。即使许多数据源有偏差,建议的估计器也是一致的,并且渐近等效于仅使用无偏差数据的预言机估计器。还建立了所提出的估计器的渐近正态性。与现有的meta分析方法相比,即使数据源的数量和参数的维度随着样本量的增加而发散,理论特性也能得到保证。此外,所提出的方法为概率接近1的无偏数据源提供了一致的选择。仿真研究从实证上验证了所提方法的有效性和鲁棒性。将该方法应用于评估中度牙周病手术治疗的meta分析数据集和研究头颈癌危险因素的孟德尔随机化数据集。
欢迎广大师生踊跃参加!
数学与统计学院
2023年4月6日