2022联邦学习全球研究与应用趋势报告发布,联邦学习进入2.0时代

  • 时间:
  • 浏览:0
  • 来源:图客团文章网

9月3日,在2022年世界人工智能大会(WAIC2022)“数据元素分布技术前沿探索论坛”期间,清华大学深圳国际研究生院知识工程研究中心、北京智谱华章科技有限公司、开放岛开源社区联合发布了《2022年联邦学习全球研究与应用趋势报告》。清华大学计算机系教授、博士课程指导教师、清华大学人工智能研究院知识智能中心主任小李,在现场对报告进行综合解释后,与中国人工智能学会(CAAI)名誉副理事长、香港科技大学计算机工学系教授、前系主任杨强、清华大学计算机系教授、副系主任唐杰进行圆桌讨论。对全球联邦学习的热点话题进行了深入的讨论。

联邦学习自2016年提出以来,从通信终端“保护用户隐私”的首次尝试,到当前整个行业的“安全护航”,已成为最受关注的隐私计算技术之一。到2022年,联邦学习将全面进入2.0时代,技术将更加安全高效,并在工业中得到广泛应用。算法模型和安全隐私技术正引领着从全球角度发展联邦学习。该报告提供了对科学出版物、专利申请、学者地图和肖像、主流框架和行业应用进展以及技术发展趋势和前景的见解。李兴子表示,报告的亮点之一就是构建联邦学习知识树,围绕知识树中的相关知识节点,从技术研究、框架与系统、产业应用等方面总结联邦学习的研究应用现状,并在此基础上从多个方面预测联邦学习的发展趋势。从论文、专利等角度分析当前的研究热点和研究人员,以及相关的开源框架。报告显示,从发表论文数量和“高被引用论文”数量、全球专利受理数量、开源框架热度等方面来看,中美双雄正在引领全球联邦学习的发展。中国和美国的研究论文数量远远超过了联邦政府发表的研究论文数量。超过60%的高引用论文来自中国和美国,中国和美国的合作论文数量是世界上最多的。全球引用论文的顶级机构是谷歌、卡内基梅隆大学、北京邮电大学和魏曲银行。

就专利申请数量而言,中国更为突出。中国是全球专利申请量最多的国家,约占全球总量的60%,专利申请量排名前三的机构均为中国机构。Federation Learning的主流开源框架主要来自中国和美国,OpenMined的Psyft、Weiquotbank的FATE和Google的TFF框架位居全球前3报告称,通过大量的案例研究,联邦学习研究的未来趋势将更多地与算法模型和安全隐私技术相关。报告称,目前联邦学习研究的热点主要集中在机器学习方法、模型训练和隐私保护方面。未来几年的研究趋势将与算法模型和安全隐私技术有关,包括数据隐私、深度学习、差分隐私、边缘计算、物联网、云计算、移动设备、同态加密、优化问题和通信效率。行业应用日益成熟,应用研究方向呈现出与物联网、区块链、车辆交互、5G/6G等技术更加融合的趋势。技术突破和产业整合是联邦学习的显著特征。经过多年的发展,全球联邦学习概述了什么样的人才概况?隐私计算的研究和应用与联邦学习有什么区别?如何在物联网和边缘计算应用程序中最大限度地保护数据和应用程序数据?在物联网和边缘计算中,算法模型和安全隐私的融合趋势是什么?您对未来技术融合的愿景是什么?以这份报告为契机,李峰子、杨强、唐杰三位教授就联邦学习这一全球热点话题进行了深入探讨,并向业界呈现了重量级的“联邦学习前沿对话”。

杨强说:“联邦学习近年来发展非常快,从2018年的每年20-30个,增长到现在的数千个。中国和外国的研究重点肯定不同,例如,美国的研究侧重于横向联合学习。中国重视纵向和异质性的联邦学习。杨强进一步指出,横向联合学习是以云计算为中心的,有一台或多台服务器,面对大量的终端设备,需要全局模型优化,确保在这个过程中数据不会出现在本地,数据不会被暴露,模型会受到保护。异构联合学习与机器学习相结合,强调“数据不会移动,数据不可见”,当数据分布不同时。他强调,提高效率和有效性以及确保安全性是国内外研究人员的共同目标。Tang认为,算法、加密方法、共享机制以及分割和联合学习方法的研究在世界各地都有共同之处。中国的特点是国家层面的支持,学术界和工业界的高度融合。他表示,从开源平台来看,中国的联邦学习生态系统处于世界领先水平,顶级领导力、学术界核心研究能力、行业技术和数据能力的融合程度非常高。从长远来看,国内数据规模巨大,对联邦学习的需求也很大。从这个角度看,“生态发展理念,加上更大的数据市场”将促进联邦学习未来在国内的快速发展。联邦学习的未来趋势:技术融合与生态繁荣在谈到未来的技术融合时,杨强表示,物联网与联邦学习融合的新趋势非常明显,国内金融场景的第一个爆发点正在迅速扩展到边缘计算。边缘计算在工业领域有着如此多的应用,大家都知道的自动驾驶汽车、智能家电、可穿戴医疗都与边缘计算密不可分,边缘计算是未来计算的典范。从一个中心的大计算范式到多个计算中心的协同计算过程,如何实现高效、可靠和安全的效果?联邦学习是自然提出的,这表明联邦学习正在迅速渗透到其他行业领域的趋势。关于下一步的分享,唐杰分享了自己的最新想法。“现在最热门的是物联网和边缘计算。随著未来生态系统的发展和市场需求的发展,我个人认为,转折点在于云端、不同云端、不同机构之间的数据共享和运算上。我们相信,随着联邦学习联盟的发展,未来将有可能实现从简单的数据共享到模型共享的转变。例如,每个机构都可以进行模型计算,共享最终计算的中间和最终结果,这可能成为模型联盟的一个大平台。自2018年以来,联邦学习的产业化进程一直在加速,从金融领域的实践开始。它迅速扩展到医疗、智慧城市、自动驾驶等大型行业和行业,并深入发展到物联网、区块链、5G/6G等技术集成。在越来越多的情况下,联合学习是必须的,而不是一种选择。通过“构建和丰富联邦学习生态系统”,实现和促进技术成果的市场化和商业化,已成为行业共识。开源平台、技术标准、行业应用等诸多方面的协同发展,支撑着技术生态的繁荣。到目前为止,联邦学习领域已经有许多国际标准和国家组规范,这些标准是由企业和行业协会发起和发布的。FATE、Open Islands等开源社区在促进全国范围内资源的开放共享和数据元素的分发方面取得了初步的成果。随着越来越多的行业企业和机构加入和布局联盟学习技术的应用,联盟学习生态系统正逐步从目前的跨地域、跨平台连接向开放、通用的方向发展。在全球大数据时代,联邦学习正在成为一种新型的“技术基础设施”,它将成为下一代人工智能协作算法、隐私计算和协作网络的基础,使数据能够在合法、安全和高效的边界内流动真正的价值。