AI领域准独角兽雅乐美森亮相NLP国内顶会SMP2018

来源: IT商业新闻网 2018-08-07 17:28:31

  IT商业新闻网8月7号讯 近日,第七届全国社会媒体处理大会(SMP2018)于2018年8月4日在哈尔滨友谊宫顺利落幕。SMP(社媒派)专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供了广泛的交流平台,致力于构建产学研相结合的社会媒体处理生态圈。本次大会由中国中文信息学会社会媒体处理专委会主办、哈尔滨工业大学承办。大会还邀请了六位嘉宾进行特邀报告。

  同时,本届大会也得到了来自工业届的诸多优秀人工智能企业的支持与关注,腾讯、百度、科大讯飞、雅乐美森、新浪微热点等企业纷纷赞助并参与了本次大会。作为工业届的优秀代表,他们在社会媒体处理的产学研相结合的探索道路上也做出了积极探索。

  为期三天的全国社会媒体处理大会,包括4场讲习班报告、6场特邀报告、9场专题论坛和口头报告专场。围绕情感分析、数据挖掘、表示学习在内的三大核心技术,就计算社会科学展开了多方面的学术探讨,包括:计算社会学、计算传播学、智能金融、智能教育和新成立的智能司法及计算历史学等领域。

  讲习班报告于8月2日召开,大会邀请到了来自北京大学、清华大学、同济大学的四位学者,他们分别以《大规模网络表示学习》、《基于大数据方法的计算社会科学:从探索性研究到因果推论》、《深度强化学习及其在自然语言处理中的应用》、《交互式可视化异常检测机器在社交媒体分析中的应用》为主题展开了精彩的报告。

  大会主会于8月3日正式开幕,主办方表示,社会媒体加深和扩大了人与人之间的沟通和交流,希望本届SMP大会能给大家提供一个互相交流和沟通的场所,形成产学研合作的生态环境。与此同时,对从事科学研究和技术工作的青年学生寄予了三点治学的建议:实事求是、独立思考和提高能力。SMP2018大会主席就SMP大会及专委会情况作了概要介绍,主题为《“社媒派”中国计算社会科学的先锋》。他指出,社会媒体是大数据的重要来源,是社会计算的重要数据基础,是计算基数与社会科学历史性交汇的主要推动力,是人工智能技术的重要处理对象,也是智能社会的脑神经。SMP专委会从学科建设、人才培养、校企合作及国家智库等多个方面担负起相应的责任,包括推动社会计算交叉学科的发展,培养社会媒体处理领域的青年人才培养,有力促进我国计算技术与社会科学学术界、企业界的交流与协作,并为我国政府在社会计算方面的规划献计献策。

  六场特邀报告集中于8月4日与5日上午,内容涉及到世界知识的中文表达、图数据分析、幽默计算和社交网络中人与AI的关系探讨。第一场特邀报告为《世界知识的中文表达问题》。讲者表示,我国面临着两个问题:向世界讲好中国故事和向中国讲好世界故事。本次报告重点讨论世界知识的中文表达,即向中国讲好世界故事。通过对2006-2015年全世界各语种发表论文情况分析,发现SCI论文中中文占比仅0.59%,在所有语言中排在第三位,在SSCI论文中,中文没有进入前10位。解决这一问题的最有效途径就是全民外语学习、机器翻译和提升中文刊物声望。提升外语水平使得国人更好理解和发布学术观点;机器翻译可以让机器把世界的知识都翻译成中文,供国人使用;而提升中文刊物声望则是治本之道,他强调,用外文提升中国学术界的国际地位是策略,提升中文的国际学术地位才是根本,需要提倡科研成果中文首发。讲者指出,解决世界知识的中文表达问题十分不易,需要有耐心、有恒心、有信心,国家和知识界须有危机意识,更要通过政策支持建立「中文自信」的学术评价体系。

  随后,澳大利亚新南威尔士大学的林学民教授做了题为《Towards Big Graph Processing: Applications, Challenges and Advances》的特邀报告。

  他首先介绍了图数据在金融诈骗检测、产品推荐、投资分析、零售服务、反洗钱、网络安全等多个领域的广泛应用,并以k-Core、k-Truss、k-Edge Connected、k-Vertex Connected等多种算法为例,阐述了 Cohesive Subgraph的相应定义及核心思想。他介绍了两个领域的研究探索,一个是给定社交网络,判断对应的核心用户在留存及离开时,对于团体产生的影响分析;另一个是结合子图搜索研究以社交网络为代表的多维属性,并让图表在每个维度上都呈现稠密性。结合与多家知名企业及团队的合作,他也展现了Cohesive Subgraph在不同领域上的应用,比如在华为公有云上实现人物识别、社区发现及好友推荐等功能,并将其延伸到时间维度上;此外,他们也与阿里巴巴合作构建FLASH Query Language、Biclique欺诈检测及RT Cycle检测,在相应的电商业务、金融业务上实现毫秒级应用。

  第三场特邀报告为全场带来笑声不断,报告题为《幽默计算探讨》。讲者借助大量的例子,介绍了言语幽默、指称幽默等类别,并结合幽默的相关理论背景引出幽默计算框架:以认知语言学、情感图谱、自然语言处理为技术基础,以双关、谐音、隐喻、反讽为表达方式;以笑话、相声、喜剧、歇后语为呈现载体;最终划分为幽默识别、笑点识别、幽默等级、幽默理解及幽默生成等应用领域。他指出,目前幽默计算的难点在于常识知识的应用,而中文幽默的挑战在于「音形义结合的表示+基于常识的推理」。他总结道,幽默计算是一件并不幽默的事情,不懂幽默的智能只是机械的匹配,缺乏情感的计算也只是无趣的代码,也进一步强调了幽默计算于自然语言理解的重要性。

  第四场报告来自北京师范大学新闻传播学院张洪忠教授,主题是《社交网络中的AI机器人:新问题与新范式》。社交媒体中的AI机器人无处不在,如微软小冰、腾讯babyQ等。他表示,AI机器人已经成为计算机科学和社会科学都共同关注的一个新事物,一个交叉学科的研究对象。对社交网络中机器人影响的研究应该成为一个重要方向。随着技术的快速迭代,AI机器人越来越具有人格化特征,但这些人格化特性不同于我们正常的「人」,会为社会科学带来新的问题。他强调,社交网络中的AI机器人将引来社会科学研究的新范式。

  5日,两场专题报告分别来自德雷塞尔大学学者与中央财经大学国际经济与贸易学院学者。他们的报告主题为《Question-based Text Summarization》与《经济学中的大数据》。在报告《Question-based Text Summarization》中,学者表示,大多数摘要受限于陈述句,基于问题的摘要并不是要替换掉陈述性摘要,而是能用来反映源文件的主旨。之后,他提到研究问题的主要目标是确保生成的问题与文本相关,同时文本能回答生成的问题。这时候衍生出三个主要研究问题:一是问题存在于哪里,二是如何测量问题和文本间的相容性,三是如何评估基于问题的摘要的有效性。这一系统的整体架构,第一步是问题选择,这里涉及到目标、方法等等,第二步是问题多样化。接下来是一些实验,涉及到实验数据集、实验设置、网络模型、评价指标、实验结果等各个方面。这是一个信息检索和自然语言处理的交叉任务,包含问题选择和多样化的两层框架。在问题选择上,他探讨了基于检索的方法和数据驱动的方法。未来,他们将会延伸到多文本摘要,也将继续扩展至不同的文本,例如新闻、科学类文章、社交媒体等等。在《经济学中的大数据应用》报告中,学者指出:经济学(社会科学)的数据困境目前面临追求因果关系、实验数据有限、测量成本高昂等因素,而大数据为经济学研究提供了低成本、客观、迅速的有利条件。借助卫星遥感数据、网络平台数据、行政管理数据和文本数据等多种数据,研究者可以对经济学进行更加深入的研究。比如,通过植被覆盖率的变化,研究者可以推断其对温室效应造成的环境影响,甚至关联到国家治理问题;通过银行数据的调查,可以印证凯恩斯等经典经济学理论,并延伸到阶层固化问题于经济增长的意义。不论是考察电子商务平台对企业出口市场进入和出口规模的影响,或是基于报纸关键词集的测量判断对经济政策的影响,本质上都是借助大数据对经济学进行更加广泛的研究和调查。学者表示,上述成功案例说明在用大数据研究经济学问题时,需要关注重大现实问题,验证重要理论问题,并发明简单实用的方法。未来,学科交叉将成为大趋势,学术研究的模块化也会成为研究的新方向。

  九大分论坛分别于8月3日与4日的下午举办,论坛讨论内容涵盖:智能金融论坛、计算社会学论坛、技术评测论坛、情感分析论坛、数据挖掘论坛、计算传播学论坛、智慧司法论坛、计算历史学论坛、智能教育论坛。口头报告于3日下午召开,累计报告数量20篇,报告人为来自全国各大高校的优秀老师及学生代表。

  在此次学术会议中,众多人工智能领域的高科技企业代表都积极参与,与学术界专家共同讨论“产学研”结合的最佳路径。北京雅乐美森科技有限公司是一家以自然语言处理(NLP)、机器学习、知识图谱和高性能计算为核心技术,专注于计算语言学应用的前沿高科技企业。雅乐美森本着融知于行的精神,长期致力于人工智能核心领域前沿理论的成果转化。公司的舆情监测、情报分析、数据支持等业务在金融、政府、传媒等领域始终保持着行业领先地位。目前公司已推出了“知行智库”和“高参”等系列软件产品,涵盖舆情、情报、金融数据、招投标数据等多个领域。作为中央国家机关软件产品供应商,雅乐美森获得了政府、金融和企业等行业客户的信赖与支持,已经长期服务于中共中央组织部、中共中央宣传部、中国人民银行总行、国家开发银行总行、北京市政府、教育部、卫生健康委、光明网等重要机构。

  作为本次大会的金牌赞助商,雅乐美森全程参与讲习班报告、特邀报告、专题论坛及口头报告,聆听业界学者的最新研究方向和科研成果,并与各届企业代表一起探讨如何更好地将前沿科技成果应用于产业发展,收获颇丰。

  本届社会媒体处理大会秉承着领域交叉、文理交叉、产学研交叉的理念,通过多种跨界交叉的交流合作,激发了与会学者的科研灵感,同时也开阔了与会企业代表的研究视野及业务思路,使“产学研”三界紧密合作,拓宽了人工智能在未来实际应用的可能性。北京雅乐美森科技有限公司未来将继续探索自然语言处理技术应用与行业的结合点,让人工智能技术真正发挥的巨大价值,为国家核心科技进步不断贡献力量!