6月15日 张静副教授学术报告(智慧教育学院)

文章作者:  发布时间: 2018-06-13  浏览次数: 10

报 告 人:张静 副教授

报告题目:面向众包标注的机器学习

报告时间:6月15日(周五)15:30

报告地点:静远楼908室

主办单位:智慧教育学院、科学技术研究院

报告人简介:

张静,现任南京理工大学计算机科学与工程学院副教授。研究领域为数据挖掘、机器学习、大数据处理与分析、以及相关应用系统。

近5年来主要从事众包标注环境下的机器学习算法的相关研究。发表各类期刊和会议论文28篇,其中以第一作者身份发表SCI论文9篇(包括TKDE、TNNLS、TCYB、JMLR等权威期刊论文5篇)、国际会议论文5篇(包括AAAI,SIGIR、CIKM等顶级会议论文3篇)。以第一发明人身份申报发明专利2项,授权1项。主持国家自然科学基金(青年项目)、江苏省自然科学基金(青年项目)、中国博士后科学基金(特别资助、面上项目一等资助),中央军委科技委青年基金、江苏省博士后基金(C类资助)。担任WWW 2017,PAKDD 2018等10多个国际会议程序委员以及TKDE,TNNLS,JMLR等20多个国际期刊的审稿人。

报告摘要:

传统的监督学习依赖于具有良好标注的样本进行模型训练。在当今大数据时代,虽然大量数据不断产生,但是数据标注既昂贵又耗时。这导致学习模型的更新无法满足智能系统不断演进的现实需求。众包系统的出现为此问题提供了一种可行的解决方案。需求方可以将未标注数据发布在众包系统中,由网络大众进行标注,并提供合理的报酬,从而极大地提高了数据标注的效率。然而网络大众并非专家,其提供的标注中不乏“噪声”。如何利用这些“噪声”标注数据进行机器学习成为当前机器学习研究中的热点之一。本报告围绕众包环境下如何提升标签质量和如何构建高质量的学习模型展开,内容涵盖众包真值推断的经典算法,基于模型纠错的质量提升方法,监督学习模型构建方法,众包环境主动学习等内容,其中大多数内容来源于报告人近几年来在此方向上的研究成果。