PhD Talk直播预告 | 亚马逊高级应用科学家熊元骏:人类行为理解研究进展

PhD Talk直播预告 | 亚马逊高级应用科学家熊元骏:人类行为理解研究进展

张俊张俊
「PhD Talk」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。这是第 19 期「PhD Talk」

人类行为理解(human action understanding)是计算视觉与视频理解的重点领域之一。本次讲座中,我们将回顾该领域近期的进展,包括方法,数据以及国际比赛的情况。接着将介绍香港中文大学多媒体实验室在行为理解方面所做的系列工作。

首先我将介绍用于剪辑视频分类的 Temporal Segment Network(TSN)方法。在该工作我们提出了对视频内容进行稀疏采样的新思路。

■ 论文 | Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

■ 链接 | paperweekly.site/papers

■ 代码 | github.com/yjxiong/temp

基于该思路,我们提出了用于时序动作检测的 Structure Segment Network 方法。以及用于从未剪辑长视频中学习行为理解模型的 UntrimmedNet 方法

■ 论文 | Temporal Action Detection with Structured Segment Networks

■ 链接 | paperweekly.site/papers

■ 代码 | github.com/yjxiong/acti

■ 论文 | UntrimmedNets for Weakly Supervised Action Recognition and Detection

■ 链接 | paperweekly.site/papers

■ 代码 | github.com/wanglimin/Un

最后,我将介绍我们 AAAI 2018 的最新工作,基于图卷积网络(graph convolutional networks)和股价关键的行为识别方法 ST-GCN

■ 论文 | Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

■ 链接 | 尚未发布

■ 代码 | github.com/yysijie/st-g

嘉宾介绍

熊元骏

亚马逊高级应用科学家

熊元骏,2012 年毕业于清华大学自动化系,获工学学士学位。2016 年毕业于香港中文大学信息工程系,获信息工程博士学位。2016 年至 2017 年,任香港中文大学多媒体实验室博士后研究员。现任美国亚马逊公司高级应用科学家。

主要研究领域为计算机视觉,机器学习,视频内容理解。在国际期刊及重要国际会议上发表论文多篇。攻读博士期间获香港政府博士奖学金全额资助。2016 年带领团队夺得首届 ActivityNet 国际计算机视频识别大赛冠军。作为重要成员多次在 ImageNet 图像识别大赛中名列前茅。

直播时间

12 月 10 日(周日)11:00-12:00

45 min 分享 + 15 min Q&A

直播观看方式

1. 使用斗鱼App搜索房间号「1743775」

2. 通过PC端访问:douyu.com/paperweekly

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

微信公众号:PaperWeekly

新浪微博:@PaperWeekly

文章被以下专栏收录
3 条评论
推荐阅读