隨著以深度學習為代表的人工智能技術的成熟,國內眾多行業都在基于人工智能技術推進行業變革與創新,積極探尋有效、有價值的應用場景進行商業化落地,其中尤以安防行業表現最為活躍。如災害監控、人流量監控、施工安全監控、吸煙檢測、口罩檢測等。
雖然深度學習發展取得了不錯的成績,但是在產業落地時仍然面臨諸多問題:訓練數據獲取難、模型泛化能力差、性能或效率達不到生產要求等。為此,百度飛槳結合實際經驗,選取了火災煙霧檢測、人流量統計、安全帽檢測這3個經典的場景,提供了從數據準備、模型訓練優化,到模型部署的全流程可復用方案,降低產業落地門檻。
接下來我們就一起看下這三個案例吧:
火災煙霧檢測
2020年,全國共接報火災25.2萬起,死亡1183人,受傷775人,直接財產損失40.09億元。傳統的火災煙霧檢測存在監管難度大、人員管理難、工地數量多且分散等問題。針對以上問題,我們與普宙科技針對城市和森林兩大場景,基于開源數據集和自研數據集進行煙霧和火災檢測的合作研發。
為了讓模型結果更具說服力,我們重新定義了評價指標:
1)圖片級別的召回率:只要在有目標的圖片上檢測出目標(不論框的個數),該圖片被認為召回。批量有目標圖片中被召回圖片所占的比例,即為圖片級別的召回率。2)圖片級別的誤檢率:只要在無目標的圖片上檢測出目標(不論框的個數),該圖片被認為誤檢。批量無目標圖片中被誤檢圖片所占的比例,即為圖片級別的錯誤率。
本案例分別選用了單階段檢測模型YOLOV3、PPYOLOV1、PPYOLOV2進行實驗。模型優化策略包括數據增強、可變形卷積、加入背景圖片等,下表詳細展示了不同實驗結果(單卡NVIDIA Tesla V100下同):
注:
aug:RandomHorizontalFlip + RandomDistort + RandomCrop + RandomExpand+MixupImage
aug1:RandomResizeByShort + RandomHorizontalFlip
根據上述實驗數據,我們的方案降低了錯誤率、提高了召回率。推薦使用backbone為ResNet101的PPYOLOV2模型,通過使用數據增強、加入背景圖、COCO預訓練、空間金字塔池化(SPP)等優化策略,實現96%召回率,2.2%的誤檢率。更多優化策略詳解請關注我們的直播課。
將我們AI模型裝入無人機,可以實現無人機森林智能巡檢,及時發現火情。此外,借力AI也可以發現非法越境、販毒等違法犯罪行為,便于及時取證調查。
人流量統計
在商場或火車站等人流量較大的公開場合,其管理者可能需要進行動態人流量統計來監控商場/火車站每天的客流量數。因為人員基數較大、流動性較高,通過人工來進行流量統計并不現實。針對該問題,本項目與上海音智達公司合作,智能高效地實現動態場景下的人流量統計。
本案例技術的實現采用目前精度和速度都表現很好的多目標跟蹤算法FairMOT,全部實驗結果如下表所示(單卡NVIDIA Tesla V100)。通過嘗試不同的優化策略,更改優化器、損失函數、使用數據增強、增加可變形卷積(dcn)、開啟跨卡同步batch normalization(syncbn)、使用指數移動平均(EMA)、更換主干網絡等,模型的最高跟蹤準確度(MOTA)達到71.7。更多優化策略細節可以關注我們的直播課程。
用戶可以直接使用我們開源的高精度行人檢測跟蹤模型進行fine-tuning或完成其他任務,如靜態場景下的人員計數任務,助力公開場合的人員管理工作。該技術方案還可以用于車流量統計、嫌疑人跟蹤等更多任務場景中。更多場景將在直播中解鎖~
安全帽檢測
在施工現場,對于來往人員以及工作人員而言,安全問題至關重要。而安全帽更是保障施工現場在場人員安全的第一防線,因此需要對場地中的人員進行安全提醒。當人員未佩戴安全帽進入施工場所時,人為監管耗時耗力,而且不易實時監管,過程繁瑣、消耗人力且實時性較差。
針對以上問題,上海天覆科技有限公司基于百度同學自研、工業界表現超高性價比的PP-YOLOV2模型進行實驗,獲得如下數據。
推薦使用backbone為ResNet50的PPYOLOV2模型,添加可變形卷積dcn、輸入圖像大小為608的情況下,安全帽ap高達96.83%,推理速度達到13.7fps。使用NV-Jetson進行部署,實現很好的檢測效果。
2025-06-03 18:34
2025-06-03 18:32
2025-06-03 18:32
2025-06-03 18:31
2025-06-03 18:30
2025-06-03 17:10
2025-06-03 17:09
2025-06-03 17:09
2025-06-03 17:09
2025-06-03 17:09