shanghai security defense & alarm association 愛建網(wǎng)">
多模態(tài)大模型
為安防行業(yè)帶來重大技術(shù)革新
基于觀瀾大模型技術(shù)體系
海康威視將大參數(shù)量、大樣本量的
圖文多模態(tài)大模型
與嵌入式智能硬件深度融合
發(fā)布多模態(tài)大模型文搜存儲系列產(chǎn)品
——文搜NVR、文搜CVR

海康威視文搜存儲系列產(chǎn)品
利用多模態(tài)大模型
實現(xiàn)自然語言與視頻圖像的
跨模態(tài)信息檢索應(yīng)用
輸入一句話、一個詞就能秒級檢索目標圖像
目標檢索變得更廣、更準、更快、更易
讓安防錄像回溯不再局限于
傳統(tǒng)時空、報警等檢索方式
大幅提升目標和事件的查找效率
讓安防業(yè)務(wù)管理更高效、更智能
1、搜得廣
開放式語義檢索,搜人搜車搜物
基于多模態(tài)大模型,文搜存儲產(chǎn)品實現(xiàn)了海量視圖數(shù)據(jù)的開放式語義檢索,不再局限于傳統(tǒng)的錄像回放及固定屬性查找。
根據(jù)需求,在搜索框內(nèi)輸入文字描述(一句話或一個詞等),例如輸入“打電話”、“白色面包車”、 “騎電瓶車未戴頭盔”、“自行車”、“小推車”、“小狗”等開放文字語義描述,即可搜索出相關(guān)目標。
搜索范圍廣,既支持人、機動車、非機動車等安防場景的高頻目標搜索 ,也廣泛支持特定物品、異常行為等特征搜索。 
2、搜得準
文字與圖像精準匹配
利用多模態(tài)大模型技術(shù),提取圖像與擬搜索語言的特征,并將圖像特征與搜索語言中關(guān)鍵語義特征對齊,實現(xiàn)高精度搜索。
如能夠理解 “穿紅色衣服”、“黑色背包”、“戴帽子”、“拉桿箱”、“棍棒”等對目標的文字描述,精準搜索出相關(guān)目標。針對常見目標的檢索,TOP20命中率可達90%以上。(數(shù)據(jù)來自海康威視實驗室)
3、搜得快
秒級出搜索結(jié)果
采用數(shù)據(jù)三級緩存、均衡抽樣、異步加載等創(chuàng)新技術(shù),實現(xiàn)文本搜索結(jié)果的秒級顯示。
4、搜得易
極簡操作,輕松搜索
除了手動輸入文本進行檢索外,貼合用戶常用情景,增設(shè)找人、找機動車、找非機動車、找寵物、找常用物品等快捷搜索入口,還支持用戶自定義編輯搜索慣語,讓操作更簡單,使用更便捷。

基于觀瀾大模型技術(shù)體系,推進產(chǎn)品創(chuàng)新
文搜存儲系列產(chǎn)品基于海康威視觀瀾大模型技術(shù)體系,實現(xiàn)智能化應(yīng)用的變革。觀瀾大模型中的圖文多模態(tài)大模型,在大語言模型的基礎(chǔ)上,使用圖文多模態(tài)數(shù)據(jù)進行持續(xù)預(yù)訓(xùn)練,獲得視覺感知和視覺認知能力。受益于圖文多模態(tài)大模型強大的感知能力和跨任務(wù)泛化能力,視覺智能業(yè)務(wù)的應(yīng)用門檻被顯著降低。
文搜存儲系列產(chǎn)品是多模態(tài)大模型算法與嵌入式智能硬件結(jié)合的應(yīng)用突破,通過面向平臺的模型設(shè)計、大小模型蒸餾、跨層混合精度量化等大模型部署技術(shù)與嵌入式智能硬件創(chuàng)新設(shè)計,實現(xiàn)多模態(tài)大模型在輕量化嵌入式硬件平臺上落地,讓多模態(tài)大模型技術(shù)實現(xiàn)普惠應(yīng)用,使更多行業(yè)和用戶享受大模型帶來的智能與便捷。
滬公網(wǎng)安備 31011202001934號