AI 人工智能其實大家都聽了很多年,但礙於以往先天條件不足,例如:硬件配置不足夠推動 AI 運算、機器深度學習的樣本不足、大數據分析能力欠佳等原因,一直以來都只停留在科研層面,不過近年來很多雲端服務,例如是 Azure和Google 等服務供應商,她們都將收集多年 的樣本以 「Pay As You Go」 的方式向開發者提供,此舉不但解決了深度學習所需要的樣本問題,同時亦可以將 AI 的運行環境要求降低。
又 AI 又機器學習又深度學習?
AI 與機器學習、深度學習關係密不可分,機器學習通過演算法來分析資料並進行學習,最後作出相關的決定,而在這過程之中,它需要大量資料以及演算法以完成學習的過程,愈準確的結果便需要愈大量的樣本讓它進行學習及演算。在早期的機器學習技術之中,它只可以在有限的預先定義範圍內行動,沒有自我意識以及智慧,因此背後採用機器學習的人工智能會被稱之為 Weak AI,現時 iPhone Siri 以及人臉辨識等技術,都是 Weak AI 的實用例子。
Weak AI 應用:AI 防火牆
Weak AI 未必適合應用在廣泛的資安防禦問題上,因為Weak AI 本身只可以在預先定義的範圍內行動,儘管如此,採用 Weak AI 已經可用來針對資安防禦之中狹窄的範圍,例如:判斷網絡設備之中的 In/Out 流量是否可疑、判斷風險高低並自行定立規則等,從而成為一款 AI Managed Firewall 產品。
另一個 Weak AI 的例子就是人臉辨識,現今人臉辨識已可以通過機器學習後,懂得準確地區分出人類的性別、年紀、心情、動作以及特定的 Object,例如我們可通過臉孔作為安全登入或進出大廈的憑證。
深度學習最強 AI?
接下來說說深度學習,原理很簡單,其實就是依照人類對生物大腦的理解而成。在大腦之中,所有神經元在一定的距離內均可連接到其他神經元,而人工的神經網絡會先將一個目標,好像是影象進行抽離,例如是顏色、數字、是否移動中、高度等,抽離後的每個項目都會儲存到不同的單一神經元之中,每個單一神經元會有各自的分配權重,最終輸出的決定是綜合了所有神經元的決定而得出來。
基於這種設計,深度學習同樣需要像人類一樣,參考大量樣本以學懂某一樣事情。然而它會將一個物件自動抽離成多個部份,因此當該目標物件的其中一部份被遮蓋時,亦可照常辨識到該物件,加上每一個神經元都有獨立的思考模式,因此相比起 Weak AI,基於深度學習的 AI 本身將擁有更強的靈活性、更準確的判斷能力,而且更可通過不斷學習而令其判斷比人類更為準確,其中一個例子就是 Google 的 AlphaGo。
這種超強 AI 暫時仍未被應用到資安防禦範圍,現時很大程度上各家資安廠商都是以 Weak AI 的方式,開發針對指定範圍的 AI 防禦功能!未來採用深度學習的強 AI,將會製造出一種前所未見的方式以針對資安防禦,例如:一個與真人無異的機械人,以鍵盤配合上滑鼠以每秒數千次的方式檢視網絡各種活動;又或者通過採用一種 AI 封包隨時或更快一步得知可疑行為從而作出破壞。雖然以上純粹推測,不過未來科技,甚麼都有可能;不過2018 年將會是 AI 以及深度學習,由研究轉向真正應用的重要一年,敬請期待!