2025 年 4 月 26 日消息,國(guó)家知識(shí)產(chǎn)權(quán)局信息顯示,西安電子科技大學(xué);OPPO 廣東移動(dòng)通信有限公司申請(qǐng)一項(xiàng)名為“視頻文本檢索模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)”的專利,公開(kāi)號(hào) CN119862302A,申請(qǐng)日期為 2023 年 10 月。
專利摘要顯示,本申請(qǐng)公開(kāi)了一種視頻文本檢索模型的訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:獲取訓(xùn)練樣本,其中,訓(xùn)練樣本包括原始視頻、第一文本數(shù)據(jù)和第二文本數(shù)據(jù),且第二文本數(shù)據(jù)基于第一文本數(shù)據(jù)進(jìn)行語(yǔ)言轉(zhuǎn)換得到;對(duì)訓(xùn)練樣本進(jìn)行特征提取,得到初始視頻特征、第一文本特征和第二文本特征;對(duì)初始視頻特征進(jìn)行特征交互和聚合處理,得到攜帶有上下文信息的視頻特征;根據(jù)第一文本特征、第二文本特征和攜帶有上下文信息的視頻特征對(duì)視頻文本檢索模型進(jìn)行訓(xùn)練,并在確定訓(xùn)練完成的情況下得到訓(xùn)練好的視頻文本檢索模型。提高了視頻文本檢索模型的檢索準(zhǔn)確性。