面向视觉问答的深层推理手艺研究

2020.09.30

投稿:周时强部分:盘算机工程与科学学院浏览次数:

活动信息

时间: 2020年10月16日 10:00

所在: 嘉定校区1-333(腾讯聚会ID:687

报 告 人:于静,,,,,,中国科学院信息工程研究所

报告时间:10月16日(周五)10:00-12:00

报告所在:嘉定校区1-333(腾讯聚会ID:687 579 018)

邀 请 人:马丽艳 副研究员


报告摘要:

随着网络中海量多媒体数据的快速增添,,,,,,怎样跨越视觉、语言等差别模态数据实现对现实天下越发泛化的剖析和推理,,,,,,关于提升盘算机的智能水平至关主要。。。 。。。因此,,,,,,连系视觉与语言(Vision and Language)是近年来较量热门的一个研究领域,,,,,,也已经成为各大盘算机视觉、自然语言处置惩罚主流聚会的主要主题之一。。。 。。。其中视觉问答( Visual Question Answering,,,,,,VQA)备受关注,,,,,,该问题要求盘算机凭证给定图像和自然语言表达的问题,,,,,,自动推理并给出谜底,,,,,,更靠近人类的剖析和认知能力。。。 。。。怎样建设视觉信息与高层语义之间的跨模态关联、怎样凭证自然语言推理重大的视觉内容已成为要害挑战。。。 。。。本报告将围绕“视觉关系明确-->多模态场景体现-->????榛跋笥胪评-->深度知识关联”递进式视觉-语言推理框架,,,,,,先容本课题组近期的一些研究希望。。。 。。。


报告人简介:

于静,,,,,,博士,,,,,,中国科学院信息工程研究所助理研究员。。。 。。。主要从事跨模态智能剖析领域的研究事情,,,,,,包括视觉问答、视觉对话、跨媒体信息检索等热门问题。。。 。。。在国际主要学术期刊和聚会上揭晓学术论文30余篇, 其研究效果揭晓于IEEE Trans. on Multimedia、Neurocomputing、Information Fusion、AAAI和IJCAI等。。。 。。。主持和加入多项国家级重点研发妄想项目、中科院战略性先导专项项目、国家自然基金项目等,,,,,,面向国家公共清静和网络清静提供领先的跨媒体数据剖析手艺息争决计划。。。 。。。小我私家主页:https://mmlab-iie.github.io/


【网站地图】【sitemap】