速感科技CEO陳震在機器人大會的演講
陳震:謝謝安冉的介紹,謝謝今天大會在創新創業論壇有機會可以向大家來介紹一下分享一下過去我們做的事情。我是速感科技的創始人陳震,今天分享的題目“為機器賦能‘看得懂’的智慧”。我們本身定位而言不是做像智行者還有納恩博做toC級的消費機器人,我們是做關鍵的部件,剛才介紹服務級的機器人的時候都提到關于行動移動決策的時候如何為機器人和無人駕駛汽車做多傳感器融合的定位和導航方案。其實這里面最關鍵的核心,我們認為其實我們在做的事情就是給現在的機器人加了一雙眼睛,主要用今天的視覺為主的低成本高效的視覺融合方法來幫助這些設備解決在三維空間當中的定位、感知、導航、避障和路徑規劃,所以起了這樣一個名字。
速感科技2014年10月份成立,主要致力于幫助下游的行業客戶包括今天的VR/AR設備公司,包括今天的服務機器人公司,還有掃地機器人、自動化叉車企業解決它們的智能設備在實際過程實際作業當中如何去進行自主決策、自主移動和自主定位和感知。今天上午有嘉賓提到,在今天的高校而言,我們這場論壇更偏向青年的創新創業論壇,里面有老師提出,現在很多的高校對于研究生培養計劃,對于博士、碩士培養計劃里面提到雙導師制。很榮幸從2014年慢慢成立公司走到今天,感謝在創新創業的環境下高校包括北航、清華給了我們這樣的機會,我在研究生剛入學有兩位雙導師制,上午老師提到一位導師是學術導師,在整個研究生入學一年到兩年時間里面對我們進行學術性的指導,包括我的主攻方向是關于機器人視覺計算機人機交互,如何探討機器和人之間的交互方式和視覺的交互進程的演進。第二位導師來自微軟亞洲研究院的許老師,主要幫助我們通過在清華、北航、微軟進行合作間的項目型的建立,我主要擔任的課題就是特種飛行器和特種機器人,包括服務機器人、火場救援機器人、掃地機器人和清潔家電機器人,利用整體的視覺感知系統來達到實時的常規性作業。基于這樣的環境下,2014年成立速感科技致力于幫助下游的用戶解決相關問題。
今年的WRC看到工業、消費兩個大的展區,分別展示了今天的服務機器人包括無人機包括快遞機器人、掃地機器人,還有AR/VR設備。我們看到在過去的三到五年時間已經不斷融入我們的生活,通過一代兩代三代不斷迭代,讓它們更好滿足我們之間的用戶體驗。在這些體驗過程當中,大家可能沒有意識到在整個體驗過程當中視覺技術在里面起到非常關鍵和決定性的作用,它決定了在整個用戶體驗當中包括我們的掃地機器人產品,包括AR/VR設備如何更好地滿足用戶端在使用防暈眩、更智能的行走這樣一些相關問題。
提到視覺技術不得不說在過去的30多年將近40年時間里面,視覺技術的起源和發展的關系。30多年時間機器人行業一個重要性的里程碑事件,美國斯坦福機器人研究嚴在1980年提出來智能移動機器人shakey,當時搭載了幾乎所有市面上電子行業能看到的傳感器,包括電子攝像頭、微博測距、接近傳感器,整個完成了自底向上的頂層設計分層設計的智能機器人。這套機器人在當時可以完成局部的環境數據采集,達到局部的路徑規劃,在當時應該是這樣一套自底層向頂層。我們分析底層有機器人的移動層、決策控制層,中間層有系統中間件,頂層有機器人的交互系統,基本這套系統在今天所有的智能設備里面一直是在沿用。1980年shakey機器人的發明自此拉開智能移動機器人研究的大幕。
2004年美國發射了兩顆火星探測車,機遇號、勇氣號,當時應該是全球最早搭載多目立體視覺傳感器的探測車,視覺領域應用的這些設備都是最典型的軍轉民甚至是航空器轉民的過程。最早搭載的好奇號的火星探測車上通過雙目電子攝像機模擬人眼拿到深度信息,就是今天的距離信息,更好地幫助它在未知的環境下進行移動和決策。在這個時間點2004年提出了一套視覺的同步定位與地圖構建算法VSLAM,今天被應用到各種各樣的智能設備里面。2013年中國的第一臺月球探測車玉兔號發射升空,搭載了更為先進的技術,2013年在軍方包括航空器里面已經開始應用結構光技術的傳感器,利用雙目立體視覺特別是主動光源的結構光和TOF光源進行未知環境下的探測。在2013年之后的2015年、2016年明星創業公司深圳大疆發布SLAM雙目立體視覺定位導航系統,可以實時提取出前端人的信息、環境信息,讓環境和前景進行分離。我們大家都玩過大疆最新的精靈4,上面有自動跟隨的系統,主要應用這樣一套立體視覺的成像方法,幫助鎖定移動物體進行跟蹤。
2015年GOOGLE發布了Tango手機,美國的創新公司發布了結構光傳感器,2016年微軟發布了HoloLens傳感器,在今天的VR/AR設備,結合最先進的視覺傳感器以及視覺傳感器背后的溶融合視覺方法,解決地圖構建和環境自身定位的相關問題。整個發展過程當中可以看到,傳統的計算機視覺領域CV領域在幾何學上一直分有兩個重要的研究方向,就是今天的學習幾何和非學習幾何。學習幾何過去五年為機器學習深度學習為代表的,包括今天的卷積神經網絡,還有搭載的淺層和深層的深度學習,可以幫助我們解決識別感知、場景語義相關的方式。今天可以看到的最早把字符通過16線的分割來進行模式識別,通過搭載一個淺層的深度學習網絡,可以幫助它進行更好提取到高層的語義特征,進行整個特征識別。在今天人臉識別物體識別做得非常好了,特別是人臉識別前段時間Image.Net宣布結束它的時代任務已經完成。今天大的明星創業公司包括商湯、曠視做的事情已經把人臉識別包括今天的學習和感知的算法提升到一個堪比人甚至超過人的高度。
過去三年時間里面ICCV包括CVPR大會上更關注的一點和更新的起點,在非學習多面幾何里面的實時性的SLAM,同步定位與地圖構建的算法原理。今年國際的計算機視覺大會上,我們看到戴文森教授提出深度學習和實時SLAM結合幫助我們進行整體的場景語義和同步定位的理解。SLAM系統究竟是什么?為什么過去五年當中可以說是一夜爆火,幾乎看到的所有智能硬件里面都應用到這樣一個SLAM算法技術。簡單來說,同步定位和地圖構建智行者剛剛提到,很長一段時間里面被人們認為是一個雞生蛋和蛋生雞的問題,達到一個精度的實時定位需要高精度的地圖,依據地圖能夠知道在環境當中的具體位置。第二,我只有知道了具體位置才能對一個未知的環境地圖進行更好的拼接地圖構件,需要同步地位和地圖構建不斷相互補充融合迭代,達到非常理想的實時定位效果。舉個簡單的例子,讓一個機器人在執行任務的過程當中讓它看到冰箱并且去抓取冰箱里面的牛奶,這時候用的是學習幾何里面的識別和感知。第二點,我如何讓機器人從我現在的位置到達冰箱的位置,在到達過程當中選取最簡單最直接的路徑,并且在過程當中如果有人阻擋有障礙物要學會躲避障礙物躲開人。在這個過程當中應用的是SLAM技術。
在SLAM技術里面,我們認為它有三個關鍵式的里程碑,最為關鍵的里程碑2003年英國帝國理工學院的安卓戴維森教授是當時最早提出來MonoSLAM系統,它的誕生到今天影響了很多服務機器人廠商。全球的家電領導者戴森推出的唯一一款掃地機器人應用的就是戴維森教授在2003年提出的MonoSLAM系統。軟銀最近一段時間增持了IROBOT5%的股份,IROBOT最近五年股價從30塊錢到110塊錢/股,整個過程當中體現出SLAM系統朝著實時性、低成本、高效的視覺融合的方案演進。基于SLAM系統和基于圖形圖象的視覺VSLAM當中可以延伸出來不同跟機器人的決策相關算法,包括融合定位、路徑規劃、檢測跟蹤和自主導航,速感科技在過去三年多的時間里面,基于核心的VSLAM系統四個不同方向進行更深一步的研究,為下游的工業和消費類的客戶體了四個方向上的算法和相關解決方案。
在2012年,我在實驗室跟著師兄師姐一起做項目,用當時2010年以色列的PrimeSense和微軟發布了第一代Kinect傳感器,我們在實驗室進行系統性搭建用了這樣一套傳感器結合英特爾的嵌入式計算機。當時搭載這樣一套視覺系統整個的功耗還有當時的實時運算處理效果,在機器人無人機上考慮它的有效載荷,整個成本報價,在去年年底把整個前端的視覺采集裝置和后面的嵌入式計算融合到一起推出了傳感器M32,今年推出M01,可以達到1瓦以內的實時功耗,整個定位采集的數據可以達到90赫茲,整個傳感器的重量只有20克。現在面向下游的企業推出來的這款傳感器的價格是200塊錢左右。在2012、2013年國內也好包括國際市場也好,在各個大會上已經看到,所有的算法所有的圖形圖樣的算法一直朝著小型化、模塊化和前端化的趨勢上走。
今天也看到非常非常多的前端傳感器公司在開發FPGA,包括在DSP還有自己的SOC上進行開發,都是朝著芯片的專用化包括算法的專用化和模塊化方向上做。在整個VSLAM系統里面如何去選取到不同的市場特征點,作為整個坐標原點,我們的視覺算法和單純的依靠成績碼盤的服務機器人做的整個視覺效果的對比,對于SLAM系統里面分了前端后端兩塊。最主要的一塊是后端進行回還檢測,整個服務機器人里面剛剛蒲立學長講過,我們遇到即使是今天的會場環境下,有非常非常多的環境問題,包括毛毯、地毯、上下斜坡,這樣過程當中我們所用到的貫導儀器失靈的程度非常大,我們必須依賴其它傳感器的融合來幫助服務機器人進行作業和執行任務過程當中解決定位精度和零偏漂移的問題,我們應用的是視覺的辦法。藍色的線是我們今天看到的視覺,除了進行回還檢測,在局部特征的時候基于所有的市場特征進行全部回還的優化。
速感科技推出的掃地機器人視覺傳感器
作為今天而言,現在的云計算成立更多成為大家所用的功能,在今年的6月份美國IROBOT掃地機器人廠商發布最新的如何利用深度學習,后端云計算和前端服務機器人進行更好地有機結合。首先在第一步可以利用視覺SLAM算法對家庭地圖進行構建,視覺加載了比其它二維線狀、激光、雷達,慣性測量單元更具備的圖象信息,所以在地圖構建過程當中可以進行嵌入式本地化的特征場景識別,包括識別到家庭里面的沙發、家庭里面的電視。第三步,可以基于這些特征點把這些高維的特征點通過深度學習的方式上傳到我的云端進行云端的更深層次的理解,包括場景語義的理解,場景的分割和地圖標簽的標注。
最后一點,服務機器人可以基于云端深度學習的理解,對家庭場景進行更深層次的理解,從而對家庭場景達到特定任務的執行。今天的掃地機器人按下開關進行全覆蓋式的路徑規劃,今天以后在Irobot可以有針對性進行特定點、特定場景的工作和作業。我們在今年的5月份面向全部的下游客戶推出來掃地機器人視覺關鍵部件,剛剛提到對于掃地機器人從過去的17年左右的時間一共分為三代掃地機器人。第一代掃地機器人做類布朗形式的亂撞,不會搭載任何傳感器,碰到墻壁就會旋轉135度進行下一個位置的清掃和作業。第二代掃地機器人,隨著工作時間的累計和增加,陀螺儀、碼盤的數據隨著飄移的程度越來越大,我們在今年5月份推出第三代掃地機器人關鍵傳感器,讓整個掃地機器人和未來服務的服務機器人達到更低功耗的智能行走,有效降低漏掃率和重復清掃。
在工業的場景里面,WSC會議上也有一些下游的合作廠商利用我們的SLAM定位控制器幫助現在的做HV的廠商解決在物料運輸過程當中HV的自然導航和有特征點和有mark點的相關信息,SLAM最核心的應用場景基于消費核工業的兩個場景。
最后介紹一下我們的整個產品系列,我們是做一家toB的解決方案廠商,面向下游的客戶提供了包括消費級的核心傳感器、工業級的導航定位控制器,我們和英特爾合作的服務機器人開發控制平臺,這樣一個開發控制平臺在過去一年多的時間里面已經幫助國內的30多家服務機器人廠商解決了它們服務機器人商用具體場景里面的場景對接和場景落地問題。
謝謝!
(以上講演內容為速感科技供稿,中國AGV網整理編寫)
北京辰天科技有限公司(原速感(北京)科技有限公司事業部)專注于工業AGV的核心技術即工業定位導航設備及相關軟硬件技術的研發和實施。公司核心技術人員是國內最早從事工業定位導航算法研發的技術團隊,自2017年起,國內已有數十家用戶采用本公司產品,獲得了市場的高度認可,合作客戶目前處于快速增長階段。辰天科技與多個高校、研究機構和知名企業深度合作,在產品研發的過程中,吸收了大量先進的技術和理念,開發了基于反光標的工業激光定位器、基于SLAM的激光定位導航器和基于激光和視覺雙SLAM的工業級高精度、高可靠的定位導航設備,并采用AI技術實現了徹底解決行業痛點的完美方案。
辰天科技致力于成為智能制造核心技術的領跑者,為行業客戶提供先進可靠的產品和優質的服務,全力為“中國制造2025”貢獻出自己的一份力量。
2025-04-29 22:24
2025-04-29 22:23
2025-04-29 22:22
2025-04-29 22:22
2025-04-29 22:21
2025-04-29 22:20
2025-04-29 22:19
2025-04-29 22:18
2025-04-29 22:17
2025-04-29 22:16