训练集:10万条新闻文本+10万张新闻配图,任务:给定新的新闻文本和新的配图集合,为每一篇新闻文本找到匹配度最高的10张图片并排序
如何让BERT拥有视觉感知能力?两种方式将视频信息注入BERT - 2020
Video + BERT
当NLPer爱上CV:后BERT时代生存指南之VL-BERT篇 - 2020
Image + BERT
Show, Attend and Tell: Neural Image Caption Generation with Visual Attention - UToronto2016
Code: https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/eager/python/examples/generative_examples/image_captioning_with_attention.ipynb (Tensorflow)
https://github.com/KoalaTree/models/tree/master/im2txt
Show and Tell: A Neural Image Caption Generator
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。