深度學(xué)習(xí)是一種在表達(dá)能力上靈活多變,同時(shí)又允許計(jì)算機(jī)不斷嘗試,直到最終逼近目標(biāo)的一種機(jī)器學(xué)習(xí)方法。從數(shù)學(xué)本質(zhì)上說(shuō),深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)方法并沒(méi)有實(shí)質(zhì)性差別,都是希望在高維空間中,根據(jù)對(duì)象特征,將不同類(lèi)別的對(duì)象區(qū)分開(kāi)來(lái)。但深度學(xué)習(xí)的表達(dá)能力,與傳統(tǒng)機(jī)器學(xué)習(xí)相比,卻有著天壤之別。
簡(jiǎn)單地說(shuō),深度學(xué)習(xí)就是把計(jì)算機(jī)要學(xué)習(xí)的東西看成一大堆數(shù)據(jù),把這些數(shù)據(jù)丟進(jìn)一個(gè)復(fù)雜的、包含多個(gè)層級(jí)的數(shù)據(jù)處理網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò)),然后檢查經(jīng)過(guò)這個(gè)網(wǎng)絡(luò)處理得到的結(jié)果數(shù)據(jù)是不是符合要求——如果符合,就保留這個(gè)網(wǎng)絡(luò)作為目標(biāo)模型,如果不符合,就一次次地、鍥而不舍地調(diào)整網(wǎng)絡(luò)的參數(shù)設(shè)置,直到輸出滿(mǎn)足要求為止。
由圖可以明顯看出DL在從06年崛起之前經(jīng)歷了兩個(gè)低谷,這兩個(gè)低谷也將神經(jīng)網(wǎng)絡(luò)的發(fā)展分為了三個(gè)不同的階段。
我們換一種更直觀的講法
假設(shè)深度學(xué)習(xí)要處理的數(shù)據(jù)是信息的“水流”,而處理數(shù)據(jù)的深度學(xué)習(xí)網(wǎng)絡(luò)是一個(gè)由管道和閥門(mén)組成的巨大的水管網(wǎng)絡(luò)。網(wǎng)絡(luò)的入口是若干管道開(kāi)口,網(wǎng)絡(luò)的出口也是若干管道開(kāi)口。這個(gè)水管網(wǎng)絡(luò)有許多層,每一層有許多個(gè)可以控制水流流向與流量的調(diào)節(jié)閥。根據(jù)不同任務(wù)的需要,水管網(wǎng)絡(luò)的層數(shù)、每層的調(diào)節(jié)閥數(shù)量可以有不同的變化組合。對(duì)復(fù)雜任務(wù)來(lái)說(shuō),調(diào)節(jié)閥的總數(shù)可以成千上萬(wàn)甚至更多。水管網(wǎng)絡(luò)中,每一層的每個(gè)調(diào)節(jié)閥都通過(guò)水管與下一層的所有調(diào)節(jié)閥連接起來(lái),組成一個(gè)從前到后,逐層完全連通的水流系統(tǒng)(這里說(shuō)的是一種比較基本的情況,不同的深度學(xué)習(xí)模型,在水管的安裝和連接方式上,是有差別的)。
那么,計(jì)算機(jī)該如何使用這個(gè)龐大的水管網(wǎng)絡(luò),來(lái)學(xué)習(xí)識(shí)字呢?
比如,當(dāng)計(jì)算機(jī)看到一張寫(xiě)有“田”字的圖片時(shí),就簡(jiǎn)單將組成這張圖片的所有數(shù)字(在計(jì)算機(jī)里,圖片的每個(gè)顏色點(diǎn)都是用“0”和“1”組成的數(shù)字來(lái)表示的)全都變成信息的水流,從入口灌進(jìn)水管網(wǎng)絡(luò)。
我們預(yù)先在水管網(wǎng)絡(luò)的每個(gè)出口都插一塊字牌,對(duì)應(yīng)于每一個(gè)我們想讓計(jì)算機(jī)認(rèn)識(shí)的漢字。這時(shí),因?yàn)檩斎氲氖恰疤铩边@個(gè)漢字,等水流流過(guò)整個(gè)水管網(wǎng)絡(luò),計(jì)算機(jī)就會(huì)跑到管道出口位置去看一看,是不是標(biāo)記有“田”字的管道出口流出來(lái)的水流最多。如果是這樣,就說(shuō)明這個(gè)管道網(wǎng)絡(luò)符合要求。如果不是這樣,我們就給計(jì)算機(jī)下達(dá)命令:調(diào)節(jié)水管網(wǎng)絡(luò)里的每一個(gè)流量調(diào)節(jié)閥,讓“田”字出口“流出”的數(shù)字水流最多。
這下,計(jì)算機(jī)可要忙一陣子了,要調(diào)節(jié)那么多閥門(mén)呢!好在計(jì)算機(jī)計(jì)算速度快,暴力計(jì)算外加算法優(yōu)化(其實(shí),主要是精妙的數(shù)學(xué)方法了,不過(guò)我們這里不講數(shù)學(xué)公式,大家只要想象計(jì)算機(jī)拼命計(jì)算的樣子就可以了),總是可以很快給出一個(gè)解決方案,調(diào)好所有閥門(mén),讓出口處的流量符合要求。
下一步,學(xué)習(xí)“申”字時(shí),我們就用類(lèi)似的方法,把每一張寫(xiě)有“申”字的圖片變成一大堆數(shù)字組成的水流,灌進(jìn)水管網(wǎng)絡(luò),看一看,是不是寫(xiě)有“申”字的那個(gè)管道出口流出來(lái)的水最多,如果不是,我們還得再次調(diào)整所有的調(diào)節(jié)閥。這一次,要既保證剛才學(xué)過(guò)的“田”字不受影響,也要保證新的“申”字可以被正確處理。
如此反復(fù)進(jìn)行,直到所有漢字對(duì)應(yīng)的水流都可以按照期望的方式流過(guò)整個(gè)水管網(wǎng)絡(luò)。這時(shí),我們就說(shuō),這個(gè)水管網(wǎng)絡(luò)已經(jīng)是一個(gè)訓(xùn)練好的深度學(xué)習(xí)模型了。
瑕疵品檢測(cè)
在工業(yè)生產(chǎn)過(guò)程中,瑕疵檢測(cè)是很多產(chǎn)品質(zhì)量檢測(cè)環(huán)節(jié)及其重要的步驟。瑕疵檢測(cè)裝置將工業(yè)相機(jī)采集到的產(chǎn)品表面圖像經(jīng)過(guò)圖像處理軟件進(jìn)行瑕疵識(shí)別處理,找出瑕疵,同時(shí)對(duì)瑕疵進(jìn)行有效的分類(lèi)及后續(xù)處理。傳統(tǒng)的圖像處理軟件存在幾個(gè)方面問(wèn)題:
一、圖像處理軟件開(kāi)放參數(shù)多,需投入大量精力調(diào)試才能到達(dá)較好檢測(cè)性能。
二、圖像處理軟件底層算法通用性及功能拓展性弱,對(duì)于新產(chǎn)品及其客戶(hù)新需求,需要人員來(lái)重新開(kāi)發(fā)。
我司案例
磁片檢測(cè)
我司研發(fā)的磁片合格檢測(cè)系統(tǒng)通過(guò)搭建深度神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練圖片中的合格及NG圖進(jìn)行學(xué)習(xí),并利用學(xué)習(xí)收斂后的模型對(duì)新的磁片圖進(jìn)行分類(lèi)。
磁片的合格鑒定是一個(gè)比較復(fù)雜的視覺(jué)檢測(cè)任務(wù),這是因?yàn)榇牌砻娴募y理,污漬,水滴及光線(xiàn)導(dǎo)致的陰影都可能對(duì)識(shí)別產(chǎn)生影響。難以用有限且明確的特征描述磁片的合格與否。利用傳統(tǒng)匹配及輪廓提取等算法很容易導(dǎo)致將大量合格品鑒定為不合格,使得誤檢率極高,而假設(shè)算法放松對(duì)合格品的標(biāo)準(zhǔn),則會(huì)導(dǎo)致判定的合格品中包含不合格品,引起更為致命的漏檢。
我司在傳統(tǒng)視覺(jué)算法的基礎(chǔ)上引入深度學(xué)習(xí)技術(shù),搭建深度神經(jīng)網(wǎng)絡(luò)對(duì)大量人工標(biāo)注的圖片進(jìn)行學(xué)習(xí)訓(xùn)練,自動(dòng)提取特征并進(jìn)行不斷的迭代計(jì)算直至模型收斂。經(jīng)過(guò)驗(yàn)證,基于深度學(xué)習(xí)的檢測(cè)系統(tǒng)可以實(shí)現(xiàn)對(duì)磁片圖片更為精準(zhǔn)、穩(wěn)定的檢測(cè)。
下圖為合格磁片
下圖為NG磁片
注:Ans為真實(shí)值
Pr為神經(jīng)網(wǎng)絡(luò)計(jì)算結(jié)果
輪轂凸臺(tái)檢測(cè)
我司研發(fā)的輪轂凸臺(tái)定位系統(tǒng)通過(guò)搭建深度神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練圖片中的輪轂凸臺(tái)位置進(jìn)行學(xué)習(xí),并利用學(xué)習(xí)收斂后的模型對(duì)新的輪轂圖進(jìn)行定位檢測(cè)。
如下圖所示,自動(dòng)化車(chē)間的生產(chǎn)環(huán)境很難保證圖片特征一致且良好,因此利用傳統(tǒng)視覺(jué)匹配算法抗干擾性較差,會(huì)出現(xiàn)模板匹配不上導(dǎo)致的凸臺(tái)識(shí)別失敗。而利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)對(duì)大量圖片特征及標(biāo)注進(jìn)行自主學(xué)習(xí)和模型迭代,會(huì)使檢測(cè)系統(tǒng)具有更高的魯棒性和抗干擾能力。我司研發(fā)的深度學(xué)習(xí)系統(tǒng)能夠?qū)μ卣鞑幻黠@或有損壞的凸臺(tái)進(jìn)行精準(zhǔn)定位,如第二張圖所示。
注:圖中黑色圓為神經(jīng)網(wǎng)絡(luò)對(duì)新輪轂圖片進(jìn)行凸臺(tái)定位的結(jié)果
2025-05-22 13:40
2025-05-22 13:34
2025-05-22 13:33
2025-05-22 13:32
2025-05-22 13:32
2025-05-22 13:31
2025-05-22 13:31
2025-05-22 13:29
2025-05-22 13:29
2025-05-22 13:25