CCDM2016数据挖掘会议 大会报告

CCDM2016大会报告


???

报告题目:基于知识的编导计算—走向海量并发和海量编程

报告摘要: 编导(Orchestration) 在现代服务计算中的意义是调度网上的各种计算资源来完成一个复杂的计算任务。它较少关心细节,而重点关注计算的总体框架。Misra在2004年发表的Orc语言是一个进程代数形式的高级编导语言,取得较大成功,并引发了一系列的后续工作。我们以Orc为基础,做了两项新的设计。一项是把逻辑程序设计引进Orc, 成为基于知识的编导语言Knorc。二是进一步把海量并发和海量编程引进Knorc,设计了一个基于知识的海量编导语言框架Gorc。本报告简要介绍这两项工作。作为应用,我们用Gorc描述了MapReduce的基本程序逻辑,并以并行Apriori算法为例,讨论了Gorc在并发机器学习方面的可能应用。

报告人简介:陆汝钤,男,计算机科学家。 原籍江苏苏州,1935年2月生于上海,1999年当选为中国科学院院士。1959年毕业于德国耶拿大学数学系。在知识工程和基于知识的软件工程方面作了系统的、创造性的工作,是我国该领域研究的开拓者之一。设计并主持研制了知识工程语言TUILI和大型专家系统开发环境《天马》。首次把异构型DAI和机器辩论引进人工智能领域。研究出基于类自然语言理解的知识自动获取方法,把ICAI生成技术推进到以自动知识获取为特征的第三代,并开发出基于知识的应用软件自动生成技术。研究出能把中文童话故事自动转换成动画片的计算机动画全过程自动生成技术,在艺术创造领域内推进了人工智能。

个人主页:http://www.math.ac.cn/kyry/201407/t20140724_247883.html


???

报告题目: Going Beyond Traditional Machine Learning for Text Mining

报告摘要:Machine learning (ML) has been applied to solve all kinds of text mining problems. The classic ML paradigm works by running a machine learning (ML) algorithm on a given piece of data to produce a model. This is true for both supervised learning and unsupervised learning. Although they have helped move text mining forward in the past two decades, they have not helped us get any fundamental natural language processing problem solved. Understanding of natural language has not made significant progress. It is thus worth pondering whether existing ML paradigms and algorithms are the best or even suitable for text learning. After all, few ML algorithms were originally designed for language learning. Text is such that behind every sentence there is a hidden story or a large amount of background information or knowledge. In this talk, I will give my opinions on some key differences between text mining and traditional machine learning and data mining using structured data. I will then discuss what other learning techniques and paradigms may be needed to move text mining a major step forward, and describe some initial effort along this direction.

报告人简介:Bing Liu is a professor of Computer Science at the University of Illinois at Chicago. He received his PhD in Artificial Intelligence from the University of Edinburgh. His research interests include sentiment analysis and opinion mining, lifelong machine learning, fake/deceptive opinion detection, data mining, and natural language processing (NLP). He has published extensively in top conferences and journals in these areas. Two of his papers have received 10-year Test-of-Time awards from KDD, the premier conference of data mining and data science. He also authored three books: two on sentiment analysis (or opinion mining) and one on Web data mining. Some of his work has been widely reported in the press internationally, including a front-page article in The New York Times. On professional services, he serves as the current Chair of ACM SIGKDD. He has served as program chairs of many leading data mining conferences including KDD, ICDM, CIKM, WSDM, SDM and PAKDD, as associate editors of leading journals such as TKDE, TWEB, DMKD, and as area chairs of numerous NLP, Web research, and data mining conferences. He is an ACM Fellow, an AAAI fellow, and an IEEE Fellow.

个人主页:https://www.cs.uic.edu/~liub/


???

报告题目:从大数据到大知识: HACE + BigKE

报告摘要:大数据面向异构自治的多源海量数据, 旨在挖掘数据间复杂且演化的关联. 本报告从大数据的本质特征开始, 评述现有的几种大数据模型, 包括5V, 5R, 4P和HACE定理, 同时从知识建模的角度,介绍一种大数据知识工程模型BigKE来生成大知识,并对大知识的前景进行展望.

报告人简介:吴信东,美国佛蒙特大学计算机科学系教授,合肥工业大学长江学者,“多源海量动态信息处理”教育部创新团队带头人、IEEE & AAAS Fellow。于2005至2008年期间担任两届TKDE主编,是Knowledge and Information System的现任主编,IEEE ICDM 的指导委员会主席。2004年获得了ACM SIGKDD奉献奖,2006年获得了IEEE ICDM杰出奉献奖, 2012年获IEEE 计算机学会技术进步奖, 2014年获得ICDM 10年最有影响力论文奖。

个人主页:http://www.cs.uvm.edu/~xwu/home.html


???

报告题目:大数据挖掘面临的挑战与思考

报告摘要:大数据给现有的数据挖掘技术带来了前所未有的挑战,粒计算理论与方法有望成为数据挖掘领域重要的研究工具之一。本报告首先介绍了大数据处理的背景,分析了大数据挖掘面临的几个重要挑战;其次对我们在基于粒计算的大数据挖掘方面的最新研究进展进行了介绍;最后对基于粒计算的大数据挖掘进行了展望。

报告人简介:梁吉业,博士、教授、博士生导师,山西大学计算智能与中文信息处理教育部重点实验室主任,大数据挖掘与智能技术山西省协同创新中心主任,太原师范学院院长,教育部计算机类专业教学指导委员会委员,中国计算机学会理事,中国计算机学会大数据专家委员会委员,中国人工智能学会粗糙集与软计算专业委员会副主任委员,山西省计算机学会理事长,享受国务院政府特殊津贴专家,国际学术期刊《International Journal of Computer Science and Knowledge Engineering》与国内学术期刊《计算机研究与发展》编委。先后主持国家863计划项目2项、国家自然科学基金项目6项(其中重点项目2项),973计划前期研究专项1项,教育部博士点专项基金项目2项。先后在《Artificial Intelligence》、《IEEE Transactions on Pattern Analysis and Machine Intelligence》、《Data Mining and Knowledge Discovery》、《IEEE Transactions on Knowledge and Data Engineering》、《中国科学》等国际国内重要学术刊物和会议上发表论文180余篇,其中SCI收录80余篇;获得国内发明专利8项。作为第一完成人获山西省自然科学一等奖1项。

个人主页:http://cicip.sxu.edu.cn/researcher/jiyeliang.aspx


???

报告题目:教育大数据分析、挖掘与应用

报告摘要:随着教育领域信息化手段的飞速发展,教育教学以及学生日常生活过程中产生的多源异构数据日益丰富,对这些数据深入分析与挖掘,将有助于进一步提升教育教学水平、实现学生学习的个性化。本报告将首先介绍教育大数据的分析与挖掘面临的挑战问题,并结合实际介绍我们在教育大数据的数据融合、建模、预测分析等的相关研究成果。

报告人简介:陈恩红,中国科学技术大学计算机学院教授、博士生导师,国家杰出青年基金获得者,安徽省“特支计划”创新领军人才。现任计算机学院副院长、语音及语言信息处理国家工程实验室副主任、安徽大数据应用协同创新中心主任、安徽省计算机学会理事长,中国计算机学会理事。2014年全国数据挖掘会议程序委员会主席、2015年中国计算机大会(CNCC 2015)程序委员会共同主席、2015年全国大数据会议程序委员会主席等。在包括TKDE、TMC、TKDD、TIST,以及KDD、SIGIR、ICDM、CIKM等在内期刊、会议上发表论文100余篇,获KDD 2008最佳应用论文奖、ICDM 2011最佳研究论文奖、SDM2015最佳论文提名,2012年教育部自然科学二等奖。

个人主页:http://staff.ustc.edu.cn/~cheneh/


???

报告题目:Big Network Analysis—Algorithms, and Applications

报告摘要:Online social networks connect our physical daily life and the virtual Web space. The user generated data is becoming big, heterogeneous, and highly connected. In this talk, I will first present our recently developed methodologies and algorithms for connecting multiple heterogeneous networks (COSNET) and top-k similarity search (Panther). Both algorithms have been deployed to an online academic search and mining system AMiner, which has collected a large scholar dataset, with more than 130,000,000 researcher profiles and 100,000,000 papers from multiple publication databases. With COSNET, we connect AMiner with several professional social networks, such as LinkedIn and VideoLectures, which significantly enriches the scholar metadata. Panther is used to find similar authors in AMiner and can return top-k similar vertices 300× faster than the state-of-the-art methods.

报告人简介:唐杰,清华计算机系副教授、博士生导师。于2006年6月在清华大学计算机系获得博士学位,曾在康纳尔大学、伊利诺伊香槟分校、香港中文大学、香港科技大学进行学术访问。主要研究兴趣包括:社会网络分析、数据挖掘、机器学习和知识图谱,发表论文100多篇,Google引用5000多次,申请专利12项。荣获首届国家自然科学基金优秀青年基金、英国牛顿高级学者奖、2012中国计算机学会青年科学家奖以及KDD’12 Best Poster Award、PKDD’11 Best Student Paper Runnerup和JCDL’12 Best Student Paper Nomination。研发了研究者社会网络ArnetMiner系统,吸引全球220个国家和地区730万独立IP的访问。担任国际会议CIKM’16、WSDM’15、ASONAM’15、SocInfo’12、ADMA’11程序委员会主席、多个国际会议包括KDD’11-15组委会主席以及顶级国际期刊(ACM TKDD, IEEE TKDE, IEEE TBD)编委。

个人主页:http://keg.cs.tsinghua.edu.cn/teacher_detail.jsp?id=5