【劉建志談 IoT】物聯網時代兩種不可或缺的人才:資料科學家、物聯網服務運營商
最近讀了一篇 2015年的文章,標題是“ The top 5 new jobs created by industrial IoT",作者Kund Lasse Lueth預測未來有五種工作會因為工業物聯網的興起而有大量的需求:Industrial data scientist, Robot coordinator, IT/IoT solution architect, Industrial computer engineer/programmer, Industrial UI/UX designer。
看看這五種職業,哪幾種工作未來會是獨立作業,有哪些工作適合在使用工業物聯網的公司內任職呢? 30年前電腦剛興起時,懂得使用計算機的工程師鳳毛麟角,簡直神人一般。加上當時只有大型電腦,多數電腦工程師都只能供職研究機構。直到個人電腦興起,中間還有以工作站揚威的 Sun等公司,然後當一般大學都有計算機工程或資訊工程系後,配合著個人電腦的普及,逐步演進到今天許多公司都有 IT 部門或至少配備 IT人員。
物聯網獨立服務運營商
筆者有一個在心中反覆思索了很久的問題, 10年後的物聯網應用方案會讓使用的企業內都設置物聯網維運部門,還是會有獨立的運營商專責運營,或是中間會有過渡型態?物聯網從業人員與傳統 IT 工程師的區別在於, IT從出生開始就獨樹一幟,一直是一門專門的學科,然而 物聯網則是 IT與 OT交織的科技 ,不同的產業、甚至是同產業內不同的公司,需要的 IT /OT專才各不相同。
試想台積電與聯電的獨家製程決不相同,就算是寶成與豐泰鞋業的製程也必有因為獨到的管理哲學導致相異的產業管理模式,遑論懂半導體製程的 I oT computer engineer/programmer是否做得來製鞋業的 IoT computer programming,本身就是一個很有趣的命題。
物聯網架構雖然萬變不離其宗,都是南向( south bound)的 edge tier,中間的平台層(platform tier)負責串連裝置並做基本的資料處理,北向(north bound)的應用層則運用平台收集、分析資料,進而利用分析結果控制 edge tier的裝置。但是不同的產業或不同的任務,牽涉到不同的應用場景,因而需要收集的物理性資料(machine log)或使用者行為(behavior log),可能南轅北轍,安裝的位置與建模使用的演算法也定然迥異。
因此所謂的 IoT solution architect與 IoT computer engineer/programmer ,其實是個很廣義的泛稱。未來的技職與大學教育如果不能配合推出跨領域的學程,讓在學學子適當地調整學習內容與模式,物聯網推廣初期將嚴重受制於 IoT人才不足 。基此,除了個別行業巨擘外,物聯網發展初期很難期待在每個採用物聯網應用方案的使用者(政府或企業)都網羅上述五種人才,在體制內建立完整的物聯網部門編制。
廣告
然而,獨立存在的物聯網應用方案服務運營商是否就是大勢所趨呢?個別產業的熟稔程度、資料所有權、資安、客戶信賴度等等都是需要克服的挑戰。在智慧城市(路燈、交通、空污監測等)的應用場景中,因為涉及的專業知識相較於工業、商業、醫療等行業相對較少,專業的服務運營商切入困難度較低,而且因為智慧城市覆蓋範圍較大,又需要大量維修或巡邏人力,收集的資料往往都是公開資料(open data),非常適合電信或有線電視運營商投入。
但在工廠內外的物聯網應用,縱算獨立的服務運營商對於相關行業經營運作足夠熟悉,若非有整組專責人力在現場支援,以工廠內低時延高可靠度要求的工作環境,恐怕沒有一個公司願意將涉及工廠運作的工業物聯網運作交付給外人。更不用說每個公司都認為自己的生產資料都是營業機密,讓一個第三者在運作過程中知悉,甚至保管或相關資料,對於許多老闆來說顯然是個無法想像的情形。
至於資料安全性的討論則往往來自於是否將物聯網應用方案收集到的數據放在雲端,以便第三人監控管理。大部份的人聽到資料放在雲端,往往覺得不如放在自己家安全。然而實情是,這與將現金放在家裏的保險箱或床底下,與放在銀行保險箱中,兩者哪一種比較安全一樣。固然,報紙有時會報導銀行遭到搶劫或銀行保險箱遭竊,我們更應該比較的是兩者機率孰低。 畢竟,銀行保險箱業務受金融監督管理委員會的規範,銀行有義務將銀行保險箱設計到一定地安全程度,放在家裏的保險箱的保障程度則是見仁見智。
在公司自行負責所有物聯網應用方案運營與交給第三方獨立運營商服務之間,是否有妥協的空間?畢竟大部份公司很難具備完整的物聯網應用方案裝置維護與精進能力,若想要維持物聯網方案正常運作或有緊急狀況時能快速回復, 在不觸及數據的前提下,適當地將方案經營維運外包給第三人,將是確保物聯網方案穩定而正常運作不得不考慮的狀況。
另一種有趣的現象,B osch在其工業 4.0宣傳影片中強調,他們管控全球不同工廠內超過 5000部機器設備,用以累積所有設備的運作數據,形成他們的專家支援系統的基礎。同樣的情形,除了同一企業內將全球各工廠內生產與機器設備資料累積成未來運作的參佐數據外,未來可以想像每一個電腦控制工具機(CNC)製造商針對同一型號的工具機遠端監控,以求做好 遠距維修與運作狀況監控 。
藉由這種遠端的數據收集及持續性數據分析,工具機製造商將累積出強有力的資料庫,除了可以更精確更及時地提供遠端維修諮詢外,還可以提供運用累積的數據 提供預防性維護(preventive maintenance),甚至做為未來改進工具機的依據。隨著愈來愈多的設備加值或優化服務(app)的出現,更多的數據將被收集分析,筆者預測將來更將因此出現另一種型態的顧問諮詢服務由設備製造商提供。
資料科學家
經過過去兩年的宣傳與普及,很多人都了解 物聯網的核心在於數據分析與回饋。 但大部份的人還一知半解的是,目前的數據分析還不是電影裡演的智腦,它的核心還是機器學習 (machine learning) 。在平台層的裝置管理平台(device management platform)雖然負責串連裝置(connect device)並將數據收集回來(collect data)數據分析引擎(data analytics engine, DA),但平台層的 DA 的主要功能是串流 實時資料聚集 (streaming data aggregation) 與串流資料事件處理 (streaming event processing)。
要發揮想像中的智慧功能,還要結合企業層( enterprise tier,或稱應用層)內的各種應用方案訴求的各種功能,進一步透過 data modeling及 predictive analytics才能達到。其中, data modeling與 predictive analytics往往靠方案設計初始時內建的演算法達成,然而同樣的應用方案在不同的工廠內,可能因為產線的佈置、加工的工件大小或材質等等原因不同而需調整演算法,也可能因為不同的業態(例如:零售業中 hyper market或 convenient store)使得同一套為了智慧零售而研發的數據分析引擎必須做適當地調整。
更不用說促銷期收集到的數據,是否需要在權重上適當地調整,以免影響數據解釋的效度(不論是整體或對個別顧客行為)等原因而必須適時地與公司討論,根據特定行業特定客戶的特性進而隨時調整演算法。
與前一角色的討論類似,在未來十年或更久以後,當學制調整成大部份學生都具備跨領域的專長,亦即主修資訊工程的學生兼修數學與機械,否則不是隨便大學資訊工程學系畢業生就當然能夠成為資料科學家,更不當然是個熟稔機械製造業或零售業的資料科學家。
再者,資料科學家團隊內,除了精通程式語言與數學,能夠選擇演算法並撰寫程式者外,還有另一種與產業更靠近的 資料解讀與產業分析師(interpreter)。沒有產業分析師在客戶與撰擬演算模型的資料科學家之間來回溝通,並協助客戶精熟運用各式各樣裝置收集回來的各種資料源交錯分析後可能代表的涵義,工廠內設備或機器人不會自己思考改進。
智慧零售方案中各式裝置因為更加廉價,更不可能具備足夠的運算單元,裝置本身更不可能有智慧思考的能力。因此需要外來的資料科學家運用各種演算法協助分析,並適時調整演算法,以求與時俱進及因地制宜。
然則,現況資料科學家嚴重不足,資策會每半年一期的大數據人才培訓班僅僅以半年時間速成的「人才」,距離真正上場實戰效果,以筆者觀察遠遠不如人意。要想在幾年內填補資料科學家的需求缺口,明顯不可能。所以, 有產業經驗的資料科學家在可預見的幾年內將是炙手可熱的「戰略物資」。
於此情形下,當物聯網應用方案開始普及時,獨立的資料科學家團隊,必將是各方爭搶,筆者認為這個行業人員很容易形成獨立的諮詢顧問機構,專責協助應用方案開發商開發各種「 智慧」的分析模組,或者協助實際導入應用方案的客戶逐步落實並提高物聯網應用方案的智慧程度。
有趣的是,本文討論的這兩種角色,尤其是獨立服務運營商這種行業,筆者在國內外文獻或報導中幾乎從未看過相關討論。然而,筆者認為這兩種角色,絕不只是討論個人未來可能因為物聯網興起而出現的職業,更可能因為物聯網應用方案實際運作的需求,進而形成獨立的行業,值得所有有志於物聯網產業的業者觀察與積極投入。