背景技術(shù):
1、在捕獲圖像數(shù)據(jù)(例如,靜止圖像,視頻)時,多個計算機(jī)控制的相機(jī)系統(tǒng)基于目標(biāo)幀中的所標(biāo)識的感興趣的區(qū)域(roi)來動態(tài)地調(diào)整捕獲參數(shù)。例如,roi經(jīng)常被用于3a(自動聚焦、自動曝光、自動白平衡)捕獲參數(shù)調(diào)整,盡管它們也可以用于其他捕獲參數(shù)調(diào)整。通常,計算機(jī)系統(tǒng)采用對象檢測算法來標(biāo)識視野幀內(nèi)的一個或多個感興趣的對象,使用那些所檢測的(多個)對象來標(biāo)識幀內(nèi)的roi,并且基于至少一個(多個)roi的可視化內(nèi)容來調(diào)整捕獲參數(shù)。在一個常見示例中,計算機(jī)系統(tǒng)采用軟件驅(qū)動的面部檢測技術(shù)來標(biāo)識包含面部(或其部分)的roi,并且基于roi的可視化內(nèi)容來調(diào)整一個或多個捕獲參數(shù),以改進(jìn)面部的捕獲。
2、在捕獲視頻饋送時,感興趣的對象的數(shù)目、大小和/或位置能夠隨著時間的進(jìn)展而改變,這能夠使得所標(biāo)識的一個或多個roi集不準(zhǔn)確或者不適用。一些計算機(jī)控制的相機(jī)系統(tǒng)通過以固定間隔(例如,每200毫秒,或者一秒五次)重新運(yùn)行對象檢測算法,并且在感興趣的對象改變時,調(diào)整所標(biāo)識的roi集(例如,通過添加roi、通過移除roi、通過調(diào)整幀內(nèi)roi的大小、通過調(diào)整幀內(nèi)roi的位置)來適應(yīng)這些改變。
3、本文所要求保護(hù)的主題不限于解決任何缺點或者僅在諸如上述環(huán)境中操作的實施例。相反,提供此背景僅以說明可以實踐本文中所描述的一些實施例的一個實例技術(shù)領(lǐng)域。
技術(shù)實現(xiàn)思路
1、在一些方面,本文描述的技術(shù)涉及用于在視頻饋送中的基于簽名的對象跟蹤的方法、系統(tǒng)和計算機(jī)產(chǎn)品,包括:基于視頻饋送的第一視頻幀的內(nèi)容,計算針對第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對象相關(guān)聯(lián);基于視頻饋送的第二視頻幀的內(nèi)容,計算針對第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內(nèi)的第一視頻幀之后,第二區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對象相關(guān)聯(lián);確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對象檢測。
2、在一些方面,本文描述的技術(shù)涉及用于在視頻饋送中的基于簽名的對象跟蹤的方法、系統(tǒng)和計算機(jī)產(chǎn)品,包括:基于視頻饋送的第一視頻幀的內(nèi)容,計算針對第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對象相關(guān)聯(lián),第一簽名表征第一區(qū)域內(nèi)的邊緣強(qiáng)度;基于視頻饋送的第二視頻幀的內(nèi)容,計算針對第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內(nèi)的第一視頻幀之后,第二簽名表征第二區(qū)域內(nèi)的邊緣強(qiáng)度;確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對象檢測。
3、在一些方面,本文描述的技術(shù)涉及用于視頻饋送中的基于簽名的對象跟蹤的方法、系統(tǒng)和計算機(jī)產(chǎn)品,包括:基于視頻饋送的第一視頻幀的內(nèi)容,計算針對第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對象相關(guān)聯(lián),其中計算第一簽名包括:將第一區(qū)域劃分為第一多個子區(qū)域;計算第一多個子區(qū)域簽名,每個子區(qū)域簽名與第一多個子區(qū)域的不同子區(qū)域相對應(yīng);以及聯(lián)接第一多個子區(qū)域簽名;基于視頻饋送的第二視頻幀的內(nèi)容,計算針對第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內(nèi)的第一視頻幀之后,第二區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對象相關(guān)聯(lián),其中計算第二簽名包括:將第二區(qū)域劃分為第二多個子區(qū)域;計算第二多個子區(qū)域簽名,每個子區(qū)域簽名與第二多個子區(qū)域中的不同子區(qū)域相對應(yīng);以及聯(lián)接第二多個子區(qū)域簽名;確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對象檢測。
4、本
技術(shù)實現(xiàn)要素:
被提供以便以簡化形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本發(fā)明內(nèi)容不旨在標(biāo)識所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在被用于幫助確定所要求保護(hù)的主題的范圍。
1.一種在處理系統(tǒng)處實現(xiàn)的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中計算所述第一簽名包括:
3.根據(jù)權(quán)利要求2所述的方法,針對所述多個子區(qū)域簽名的每個子區(qū)域簽名,其中計算所述多個子區(qū)域簽名包括:
4.根據(jù)權(quán)利要求3所述的方法,其中每個像素組簽名基于相對于像素的邊緣角度指示所述像素的強(qiáng)邊緣。
5.根據(jù)前述權(quán)利要求中的任一項所述的方法,其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域與所述所檢測的感興趣的對象的邊界框相對應(yīng)。
6.根據(jù)權(quán)利要求1至權(quán)利要求4中的任一項所述的方法,其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域包括超過所述所檢測的感興趣的對象的邊界框的擴(kuò)展區(qū)域。
7.根據(jù)前述權(quán)利要求中的任一項所述的方法,還包括:基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,觸發(fā)基于定向的對象檢測。
8.根據(jù)前述權(quán)利要求中的任一項所述的方法,還包括:基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,在所述視頻饋送的整個幀上生成簽名。
9.根據(jù)前述權(quán)利要求中的任一項所述的方法,其中觸發(fā)對所述視頻饋送的所述基于簽名的對象檢測包括:使用人工智能模型或者機(jī)器學(xué)習(xí)模型來觸發(fā)面部檢測。
10.根據(jù)前述權(quán)利要求中的任一項所述的方法,還包括:在觸發(fā)在所述視頻饋送上的所述基于簽名的對象檢測之后,觸發(fā)在所述視頻饋送上的基于間隔的對象檢測。
11.一種計算機(jī)系統(tǒng),包括:
12.根據(jù)權(quán)利要求11的所述的計算機(jī)系統(tǒng),其中計算所述第一簽名包括:
13.根據(jù)權(quán)利要求11或者權(quán)利要求12所述的計算機(jī)系統(tǒng),其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域與所述所檢測的感興趣的對象的邊界框相對應(yīng)。
14.根據(jù)權(quán)利要求11或者權(quán)利要求12所述的計算機(jī)系統(tǒng),其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域包括超過所述所檢測的感興趣的對象的邊界框的擴(kuò)展區(qū)域。
15.根據(jù)權(quán)利要求11至權(quán)利要求14中的任一項所述的計算機(jī)系統(tǒng),所述計算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,觸發(fā)基于定向的對象檢測。
16.根據(jù)權(quán)利要求11至權(quán)利要求15中的任一項所述的計算機(jī)系統(tǒng),所述計算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,在所述視頻饋送的整個幀上生成簽名。
17.根據(jù)權(quán)利要求11至權(quán)利要求16中的任一項所述的計算機(jī)系統(tǒng),其中觸發(fā)對所述視頻饋送的所述基于簽名的對象檢測包括:使用人工智能模型或者機(jī)器學(xué)習(xí)模型來觸發(fā)面部檢測。
18.一種計算機(jī)程序產(chǎn)品,包括存儲計算機(jī)可執(zhí)行指令的計算機(jī)存儲介質(zhì),所述計算機(jī)可執(zhí)行指令由處理系統(tǒng)可執(zhí)行以至少:
19.根據(jù)權(quán)利要求18所述的計算機(jī)程序產(chǎn)品,所述計算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少:基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,觸發(fā)基于定向的對象檢測。
20.根據(jù)權(quán)利要求18或者權(quán)利要求19所述的計算機(jī)程序產(chǎn)品,所述計算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少:在觸發(fā)對所述視頻饋送上所述基于簽名的對象檢測之后,觸發(fā)在所述視頻饋送上的基于間隔的對象檢測。