2017年11月24日下午,“CCF走进高校”活动来到广东外语外贸大学。北京信息科技大学的张仰森教授和哈尔滨工业大学的徐睿峰教授分别做了题为“中文文本错误的自动侦测”和“面向社会媒体的文本情感分析”的讲座。讲座由bat365官网登录入口院长蒋盛益教授主持,百余名广外师生以及来自广东当地高校和海南大学等高校的师生共同聆听了此次讲座。
张仰森作报告
张仰森从文本错误的来源和类型切入,具体分析了基于捆绑加过滤的中文文本错误侦测等侦测文本错误方法,并比较和介绍了多种侦测方法的异同以及不同类型系统的建立方法。
徐睿峰作报告
徐睿峰则从情感分类、情感元素抽取、跨领域情感分析、个性化情感分析、隐式情感分析、立场分析、情感原因发现、情感生成、观点总结、意图挖掘,以及谣言检测与评价真实性分析等几个方面给师生较全面地介绍了文本情感分析发展的几个关键技术。
张仰森和徐睿峰两位教授的报告引起了与会教师与同学们的强烈反响,在座同学积极向教授提问,现场学术氛围浓厚,同学们纷纷表示收获很大。至此,本次“CCF走进广东外语外贸大学”专题讲座活动落幕。
师生认真听取专家讲座
讲座后合影
听众感言:
曾云峰软件工程大二本科生
对于计算机专业的学生来说,做科研就像不断修炼,一心练就绝世武功以求打败生活带来的技术难题。今天有幸见识到两位埋头苦干多年的学者,也是CCF的专家,他们在各自领域都有巨大贡献。
张仰森教授,徐睿峰教授,他们代表了新老两派学者,一个从网络不发达的时代走来,靠最简单的方法一路走到现在;一个用机器学习在研究中大做文章。值得学习的是,他们做研究思路清晰,把大课题逐层分解成几十个小问题再逐个击破。另外提出自己方法前学习比较其他常见的方法也是研究的必经之路,张教授就能清晰记得其他每个曾经或正在使用的研究方法出自谁手。下午的讲座给我们树立了一个榜样,要专注,也要讲究科学的方法。
包睿软件工程大二本科生
张仰森教授介绍了他所研究的中文文本错误的侦测方法,提出了基于上下文,基于规则,基于统计等判断方法,也提出了基于语调判断等新颖的猜想,其几十年如一日的文本语料库的构建工作让我由衷的敬佩,见识到了传统机器学习的伟大。徐睿峰教授介绍了他所研究的基于社会媒体的情感分析。介绍了基于浅层机器学习的情感分类以及基于深度学习的情感分类等方法,其中让我印象最深刻的就是他对机器学习模型的理解和优化。他提出的利用双向Attention来去除梯度下降的风险,模型之间的对抗训练,样本过少时的过采样处理(SMOTE)以及采样时去噪音的负面迁移检测等方法让我耳目一新。
在接下来的学习中,我觉得可以汲取两位专家的经验,尝试更多的模型优化搭方案去预测效果,再对各个方案进行多方面的对比,以达到更好的实验效果。
符斯慧管理科学与工程二年级硕士研究生
三个小时的讲座下来,感受最深的是两位学者对各自研究领域理解得相当透彻,介绍问题的框架脉络都非常清晰,化繁为简,让我们得以在短时间内一窥领域全貌。中文文本错误的侦测和文本情感计算的历史、难点、发展现状及未来的方向均被详细提及,整体的内容广泛深入而不繁杂。两位讲述时,相关文献更是信手拈来。这次讲座在如何撰写文献综述、阅读文献资料、跟进领域前沿等方面给我们带来了很好的示范,而两位对自己的研究工作,始终保持着数十年如一日的专注与热诚,也非常值得我们学习与效仿。