新闻网讯(通讯员潘志宏、袁梦霆)3月15日,中国科学院外籍院士、英国爱丁堡大学信息学院主任樊文飞做客武汉大学珞珈讲坛第336讲,带来了题为“Big Graphs: From Theory to Practice”(大规模图数据:从理论到实践)的学术报告。
樊文飞在报告中指出,目前大数据领域正面对着“4V”的挑战,分别是Volume(规模), Variety(多样化), Velocity(变化)和Veracity(可用性)。学术界和工业界大多关注数据的规模,对多样化、变化、可用性的理解只是冰山一角。大数据规模带来的挑战是指在处理大数据时,随着数据规模增大,过去易解的问题可能变得难解。针对这一问题,出现了许多并行图计算引擎,但是设计、调试和分析并行算法通常需要花费很高的代价,使得并行计算的受众受限。樊文飞和他的课题组提出了一种自动将顺序算法转换为并行算法的方法,根据输入的顺序算法自动生成并行算法并且保证正确性,让一些中小企业也能够负担起大规模并行图计算。
樊文飞还进一步分享了最新的研究成果,例如当并行计算效果不明显时,将图数据进行无损聚集,将大图变小,在有限资源下进行大数据计算。针对大数据中数据变化的挑战,他分享了一种增量算法的自动推导方法,可以只计算大数据中变化的部分而不需要重新计算整个数据,此举大大降低了计算成本。此外樊文飞还介绍了一些结合逻辑规则与机器学习提高图数据可用性的最新成果。
在交流环节,樊文飞对同学们提出的问题进行了详细解答。他对同学们积极探索、热心科研的精神予以肯定,勉励同学夯实理论基础,提升个人眼界和欣赏水平。樊文飞表示,从事科研工作除了要有浓厚的兴趣,更要注重研究质量和创新,做到不求回报、心无旁骛,这样才有可能取得优质的成果。
讲座结束后,科学技术发展研究院副院长郑晗为其颁发了珞珈讲坛纪念证书。
樊文飞,英国皇家学会院士、欧洲科学院院士、英国爱丁堡皇家学会院士、美国计算机协会会士(ACM Fellow),深圳计算科学研究院首席科学家、 北京大学深圳研究生院南燕荣誉教授、清华大学杰出客座教授,毕业于北京大学(本科,硕士)和美国宾夕法尼亚大学(博士),任职爱丁堡大学前为美国贝尔实验室科学家。他获英国皇家学会Wolfson研究成果奖 (2018)、欧洲研究委员会ERC Advanced Fellowship (2015)、英国 Roger Needham 奖(2008)等多项奖项。目前主要研究领域为数据库理论与系统,包括大数据、数据质量、分布式计算、查询语言、推荐系统和社会网络精准营销。
(摄影:震点演绎 编辑:付晓歌、相茹)