谷歌宣布启动“视频理解挑战赛”:设10万美元奖金池

  谷歌博客今天比较忙,在发布TensorFlow's1.0这一重磅更新后,紧接着又发布了一条新闻:启动一场基于YouTube-8M数据库的视频理解挑战赛。挑战赛提供了丰厚的奖金,并终将在今年的CVPR2017大会上进行展示。去年9月,为了促进大规模视频理解技术的创新和发展,我们发布了YouTube-8M数据库,里面包含了数百万的视频,而且这些视频都被分类贴上的数千种标签。

  最近,谷歌其它团队相继发布了更多的数据库,比如OpenImages和YouTube-BoundingBoxes,与YouTube-8M数据库一起,促进图像和视频理解技术的发展。为了促进这些目标,今天我们正式发布升级版的YouTube-8M,并与GoogleCloudMachineLearning、yuhou.cn一起合作组织一场“视频理解挑战赛”和一场以此为主题的CVPR’17Workshop。

  升级版的YouTube-8M

  最新升级版的YouTube-8M包括更加清晰、详细的标签(平均每个视频多两倍的标签)和一系列干净的视频。除了之前发布的视觉特征之外,数据库首次包括了预先计算的音频特征,这是基于最先进的音频建模架构得来的。音视频特征以1秒的时间粒度实时同步,这使得YouTube-8M成为了一个大型多模态的数据库,为联合音视(临时的)建模提供了令人欣喜的机会。新版本的关键数据如下所示。

  升级版YouTube-8M数据库的可视化树状图。按照24个垂直行业组织起来,包括前200个最常用的实体和每一个垂直领域最常用的5个实体。

  样本视频,来自YouTube-8M数据库里前18个高等级的垂直领域