天才一秒记住【长江书屋】地址:https://www.cjshuwu.com
除了检索图像元素外、
过检索新闻文章中的视觉基础实体来处理新闻图片标题。
视觉基础对话lee
et
al.,
2021b)
要求检索视觉信息以生成相关的对话回复。
fan
et
al.
(2021)用基于
knn
的信息获取(kif)模块增强了生成模型,该模块可检索图像和维基知识。
梁等人
(2021)从图像索引中检索与对话框相关的图像,作为响应生成器的基础。
shen
等人
(2021)训练了一个单词-图像映射模型来检索反应的视觉印象,然后使用文本和视觉信息生成反应。
文本生成
对于一般的文本生成任务,图像检索也可以帮助扩展上下文。
杨等人
(2022a)通过检索现有图像和合成新生成的图像来增强文本模型的
"
想象力"
。
因此,为语言模型注入想象力可以提高许多下游自然语言任务的性能。
类似的例子还有
zhu
等人
(2023)将
"
想象力
"
。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!