2018年11月28日,清華大學大數據研究中心舉辦“2018清華工業大數據技術論壇”,安筱鵬博士在論壇上就數字+算法定義的世界進行了發言。下面是安筱鵬博士演講的重點摘錄:
幾千年來,人類如何進行決策?
幾千年來,人類社會一直面臨的重大挑戰是,如何在不確定性的環境中進行決策?兩千年前,夏商周的首領要開打一場戰爭(猶如當年的貿易戰),是通過占卜來進行決策。面對一觸即發的部落戰爭,出征前面對戰爭結果的無常,部落首領、諸侯國王們,求助龜殼裂紋、星象占卜,以預測等各種重大事件的走向,指導重大決策。
五百多年前,西歐封建制度開始解體,宗教改革步伐不斷加快。馬克斯·韋伯在《新教倫理與資本主義精神》指出,企業家認為世俗經濟行為的成功不是為了創造可供于享受和揮霍的財富,而是為了證明自己是上帝的一個選民。
在這一種情況下,當企業家們面對各種不確定性進行決策的時候,他們的依據是什么,是新教思想影響著他們的決策,宗教是人類面在不確定性的環境中進行選擇的依靠。
一百年前,愛迪生經過幾千次試驗發明了電燈,1969年美國人把人類送到了月球,同年也研發出波音747并實現首飛。人類送上月球的每一個決策、飛機研發的每一次重大決策的背后是基于什么?是科學。
今天,我們有了認識世界和進行決策的新的方法論。
我們清華大學工業大數據中心在青海有一個風電功率預測項目,能夠對未來(明天、后天)風機的風力發電量進行準確預測;美國Uptake公司,需要對卡特彼勒工程機械運行狀態進行預估,實現產品全生命周期的服務;新零售企業盒馬鮮生,它只賣當天新鮮的產品;我們的手機用戶,每天瀏覽的今日頭條、淘寶看到的首頁都是千人千面。這是一種新的決策方式,這種決策方式叫做“數據+算法”。
“數據+算法”的決策機制,不是對已有決策機制的一種替代,是增加了一種新的決策方式。
并非因為有了宗教,我們就不去占卜(許多現代人仍在用占卜的方式進行決策),占卜的方法在今天仍然很適用。我們用科學方法、科技的規律指導人們決策,但是宗教在很多時候仍然在發揮很重要的作用。現在我們又有了一種新的應對不確定性的方式,就是“數據+算法”。
應對不確定性是人類永恒的挑戰,關于如何理解和認識不確定性,我們有三個基本結論:一是只有深刻認識不確定性,才能理解數字經濟的本質;二是對不確定性的恐懼是人類社會認知的動力;三是不確定性源于信息約束條件下人們有限的認知能力。
化解不確定性需要經過“三部曲”
我們都面臨著在不確定性的環境中如何進行決策的問題。這些決策正確與否會導致事情的成敗、得失、利弊、對錯、好壞、優劣等結果。而這些結果又會影響我們個人的幸福(我跟他結婚我是不是很幸福我不知道),部落的興衰,企業的成長,國家的繁榮,歷史的走向。
那么,如何來化解這些不確定性,需要經過“三部曲”。第一,我們首先要理解這個世界,理解和認知這個規律,這是我們化解不確定性的邏輯起點;第二,理解之后我們要預測將會發生什么,這是做出決策的基礎和依據;第三,我們要去控制,是將決策付諸行動的具體路徑。所以我們剛才講的所有,無論是占卜也好,科學、宗教、哲學、科學也好,從本質上來說,都是來告訴我們如何化解在決策的時候面對的種種不確定性。
對不確定性認知的分野:從哲學到科學
我們如何來認知不確定性,從哲學來看,在古希臘一開始就分成了兩種不同的學派,到了近代形成了以笛卡爾為代表的確定性世界,認為這個世界是有序的、統一的、必然的、精確的及可預見的;而尼采、康德認為這個世界是無序的、差異的、隨機的、模糊的不確定性世界。
從科學來看,由哥白尼“日心說”到伽利略再到牛頓三大定律,近現代科學成就不斷強化人們基于確定性邏輯規律的認知,使得我們認為所有的世界,都可以用確定性據描述。然而,海森堡的“測不準”原理、哥德爾的不完全定理,阿羅社會選擇理論不可能性定理,并稱為二十世紀不確定性的三大發現。我們發現很多時候,這個世界并不是像牛頓定律所描述的那樣是確定可預測的。
從經濟學來看,對于不確定性的認知,始于芝加哥學派創始人奈特,將不確定性引入到經濟學,打破了經濟學研究中此前一般均衡分析為核心的對確定性環境的假設。對不確定性我們認為是信息經濟學、行為經濟學、制度經濟學、演化經濟學的一個基礎理論。
最后我們大家熟悉的,從信息論來看,信息是干什么的,克勞德·香農定義“信息是用來減少隨機不確定性的東西,信息的價值是確定性的增加”,信息最重要就是要減少不確定性而增加確定性。
什么是企業?企業的本質是什么?
我們今天討論的是工業大數據,那么我們回到企業,什么是企業?企業的本質是什么?我認為在不確定性的世界中進行決策是企業最本質的屬性。
面臨這些問題,企業有各種各樣的決策,在信息不完備、不確定性的環境中決策,包括:新品開發是決策,客戶定位是決策,營銷策略是決策,研發組織是決策,供應鏈選擇是決策,交付周期是決策,庫存管理是決策,排產計劃是決策,商業模式是決策,所有的都是決策。
那么企業如何進行決策,對于應用工業大數據來說,怎么支撐企業決策?就是要將正確的數據,在正確的時間,以正確的方式傳遞給正確的人和機器。這就是基于工業大數據,在不確定性的環境中如何形成決策。
談一個紅領的例子,青島紅領是一家個性化定制服裝企業,是國家智能制造的試點示范企業,有些企業高管參觀后感到非常失望,因為沒有想象中一排排機器人、一條條先進生產線、忙亂而有序的AGV小車,而是一排排的工人在用手工的方式加工衣服,是一個典型的勞動密集型企業生產場景。
企業家們感到困惑的是,這樣一個典型的勞動密集型企業為什么是智能制造的試點示范企業?有人說他跟富士康沒有區別,不是沒有區別,而是根本就比不上富士康,富士康的自動化生產線、切片機、機器人是非常先進,紅領跟富士康有什么不同呢?
我認為自動化分為兩種。一種自動化是生產裝備自動化,叫做看得見自動化,機器換人,立體倉庫,忙碌而有序的AGV小車。還有一種叫做看不見的自動化,就是數據融合在物理世界里面自動地去流動,把正確的數據在正確的時間傳遞給正確的人和機器。當你采集一個人上身的18個部位,22個指標之后,這一個指標首先自動生成一個適合這個人體型的一個版形,自動生成一個數控機床的加工指令,自動生成200個工序的加工工藝,定制化生產跟規模化生產相比,其復雜度、面臨的不確定性遠遠地超出幾個量級。
算法:將不確定性轉化為確定性的最優路徑
軟件如何解決這一個問題,我想最基本的一個語言就是“if…then…”,將不確定性轉化為確定性。“if:A”“if:B”是不確定性的,而“Then A1”“Then B1”就變成了一個確定性,這一轉變過程就需要算法。那么把不確定性轉變為確定性是否準確呢?這取決于你的數據及時性、準確性、完整性。
在過去的一兩百年已經完美地解決了產品的成本質量效率問題,而個性化定制出現的時候,過去已經解決了成本質量效率問題又重新冒出來的。不確定性又重新增加了,怎么解決?需要“數據+算法”。美國國家標準與技術研究院,對智能制造有一個定義,這個定義的核心詞,我認為就是要對不確定性系統增加它的確定性。
做一個總結,如何能夠把正確的數據在正確的時間,以正確的方式傳遞給正確的人和機器,需要具備兩個條件:一是隱性數據的顯性化,實現數據的完整性、及時性、準確性,把大量蘊含在生產制造過程、經營管理、客戶行為、全生命周期服務的隱性數據不斷被采集、匯聚、加工。二是隱性知識的顯性化,就是對工業研發技術、生產工藝、業務流程、員工技能、管理理念等知識的邏輯化、數字化和模型化,使得大量隱性工業知識被固化在各類軟件和信息系統中。
一方面,我們有及時、完整、準確的數據,另一方面,我們有大量的隱性知識顯性化的軟件,不斷將這些數據輸送到這些軟件中間,進而將數據轉化為信息、信息轉化為知識、知識轉化為決策,再用決策去優化我們所看到的物理世界。
在這一過程中軟件是核心。那么,軟件是什么?軟件的本質是事物運行規律的代碼化,構造了數據自動流動的一套規則體系,無論是愛因斯坦的質能方程,還是牛頓的三大規律,都是我們認識這個物理世界的方式。我們把規律模型化、模型算法化、算法代碼化、代碼軟件化,再用軟件化去優化,我們構建了三個世界,物理世界、意識世界、數字世界。
過去,人類直接面對這一個物理世界,而今天,我們找了一個代理人,這一個代理人是誰呢?就是賽博空間。就像無人駕駛,過去我們要自己開車,現在你不需要自己開,你找一個代理人,這一個人叫無人駕駛,幫助你去感知、決策、執行。
數字經濟的本質:數據+模型=服務
兩年多前,我曾去過達索公司,達索公司有一個科學家給我們講心臟的構造,講心臟中離子濃度梯度穿過心肌細胞的脈沖變化,講心臟的某一塊肌肉的拉力極限是多少。
這樣一個我們認為的軟件公司,跟很多醫院一起研究心臟的構造、機理,他們要研究心臟的運動規律,物理的、化學的、生物的運動規律,他們把這一個運動規律模型化、模型算法化、算法代碼化,最終是要構建一個數字心臟。
研發這一個數字心臟的科學家就是達索公司的部門高級總監(Steve Levine)史蒂夫·勒溫博士,原因是他的女兒杰西(Jesse),一出生就被發現主動脈和心室存在異位的情況。在她兩歲時,由于心臟生理系統發生故障,杰西便安裝了心臟起搏器,并且每年需要做心臟手術。每次手術之前,醫生都需要讓史蒂夫簽字,并告訴他你的女兒推進手術室之后有可能會失去生命,史蒂夫每一次都深受煎熬,他夢想有一天能研發這樣一個數字心臟。
這一個數字心臟有什么價值呢?用我的話說,就是“數據+算法=服務”,構建了一個數字心臟,首先對心臟做了一個造影,造影是干什么?采集數據,建立了一個數字模型,實現四類功能:一是描述,這一個物理世界發生了什么在虛擬世界去描述,心臟的血管哪一個地方堵了,堵了多少,可以360度去觀察。二是診斷,為什么會堵,是什么樣的原因造成了心臟血管堵塞;三是預測,如果沒有人為去干預,半年之后、一年之后、兩年之后,這一個血管從堵到30%發展到70%,另外一個旁支血管也會堵,它會告訴你將會發生什么;四是決策,最后怎么辦,是采取保守治療,還是去做搭橋手術,給醫生提供一個解決方案供參考。
在這一過程中,數字心臟可以幫助我們改進醫療設備的研發效率、預測器械植入心臟的功能、進行心臟復雜醫學教學、加快科研創新轉化為臨床醫學實踐。
所以“數據+模型”,或者“數據+算法”構造了我們認識這一個世界新的方法。
如果說我們把過去人類社會認識客觀世界的方法論做一個總結的話,可以有四個階段。一是理論推理,天才科學家通過“觀察+抽象”去認識這個世界,比如牛頓的定律,愛因斯坦的相對論;二是實驗驗證,愛迪生發明電燈泡,我們現在發明汽車做二三十次碰撞實驗,飛機做風洞實驗驗證;三是模擬擇優,在虛擬世界里面去實驗發現物理世界的規律,再反饋到現實世界指導人們的實踐,高鐵、飛機不用做幾千幾萬小時的風洞試驗,汽車不用做幾十次碰撞實驗,這些都可以在虛擬世界去完成,通過數字世界的模擬選擇最優化的結果;四是大數據分析,就是通過大數據發現物理世界新的規律。無論是模擬還是大數據分析,它背后的邏輯都在用“數據+算法”的模式。
過去你整天在實驗室做實驗,現在有一部分實驗可以在計算機里面去做。對于制造業也是一樣,過去架飛機從立項到交付需要二十多年的設計制造過程,現在只需要五六年的時間,因為人們構建了一個新的認識和改造世界方法論。高鐵可以通過虛擬的高鐵在虛擬的京滬線上跑起來,運行到兩百公里、三百公里、五百公里時速,來測它的穩定性,通過快速迭代,構造了一個改造和認識世界的方法論即“數據+模型”這一新方法論。
數字化的邏輯殊途同歸:數字孿生
可以設想一下,未來十年、二十年、三十年之后,或者我們思考一個問題:數字化的終極版圖是什么?從未來看現在,我們今天所看到的物聯網、大數據、云計算、人工智能、工業軟件等技術,都是未來數字化終極版圖的一個碎片,ICT技術發展及應用的過程,就是我們不斷把這個碎片化的模塊拼一個幅完整版圖過程,我們都是拼圖人。
那么形成的最終圖景是什么呢?答案就是數字孿生,就是我們不斷地把碎片化物理世界數字化后,在CYBER空間構造成一個碎片化的數字孿生體,然后把這個碎片化的孿生體拼成一個完整的數字孿生體,直至構造一個數字孿生的世界,從我剛才講的數字孿生的心臟,數字孿生的飛機,數字孿生的建筑,到數字孿生的城市,我們都走在構造數字孿生世界的大道上。
我們在虛擬世界構造一個數字孿生,并且不斷的與物理世界進行交互、優化,這樣的一個過程將會經歷三個階段,即局部的數字的孿生階段,靜態的數字孿生階段和動態的數字孿生階段。
那么動態的數字卵生階段需要什么時候實現,可能需要二十年或者更長的時間,現在我們僅僅處于一個局部的數字孿生階段,而靜態的數字孿生,就是在虛擬世界里構造一個物理世界,但數據不是實時的,需要一個周期。
最后做一個總結,數字經濟的本質,就是“數據+算法=服務”。這數據來自于機器數據、業務數據、產品模型數據,需要物聯網、傳感器等不斷獲取。算法部署在云端,包括兩種形式。一種是機理模型、一種是人工智能模型或者叫做大數據模型。“數據+”,“+”是什么?“+”就是網絡,5G、NB-IoT、TSN、以太網等等,數據+算法帶來了服務,這個服務包括四個層次:一是描述這個世界(發生了什么?),二是診斷這個世界(為什么發生),三是預測這個世界(將會發生什么?),四是進行決策(應該怎么辦?),最后實現優化資源配置效率。這是一種全新的認識和改造這個世界的方法論。
2025-06-06 12:38
2025-06-05 11:44
2025-06-03 18:34
2025-06-03 18:33
2025-06-03 18:30
2025-05-28 21:29
2025-05-28 21:24
2025-05-28 21:20
2025-05-26 18:37
2025-05-26 18:35