智能手機竊聽再派廣告? 小實驗自行拆解都市傳說

智能電話長久以來都有一個都市傳說,當某人對朋友談到某東西後,那件東西就在智能電話內的廣告中出現!到底是真有其事還是完全巧合?與其等人解答,不如親身做過小實驗,大家可以參考以下方法自行拆解都市傳說的真相。

實驗:告訴你的智能電話預期過的東西
實驗的設定如下,首先與一班朋友聚會,把電話放在桌上,然後進行平常的對話中加入你自己也從來沒想過需要的東西,例如:水泵,在溝通中講出「哪裡有便宜的水泵可以購買?」。筆者以此為例子,大家應該考慮合適自己的東西,直接採用「水泵」可能會因為大家看過此文章而影響實驗結果。

以上設計的要點是不要選一件自己想要的東西作為實驗品,要加一點天馬行空的創意使,想出一件與自己生活習慣完全沒有關連的東西。而另一個要點是不要搜尋實驗使用的東西,包括文字和語文搜索,例如:Siri、Alexa、Cortana 或 Google,大家可以在這裡查看今天被收集了甚麼資料。

與朋友談天的部份完結後一星期,都要持續提及實驗選揀了的物件,例如:我想買新水泵。(Kaspersky 研究人員進行了類似的實驗,結果在文章末段公開!)

智能電話中的廣告:神奇的巧合?
以下就是都市傳說拆解的部份,關於為何搜尋引擎有時候能「命中目標」,在不牽涉利用通話筒竊聽的陰謀論前提下,其實可以有幾種解釋。

解釋一:互聯網服務建立準確的模型
一名前 Google 員工在一篇文章中提到,Google 和 Facebook 利用機器學習的方法,基本上有一個試圖複製用戶行為的數碼分身,到某些時候,數碼分身變得與用戶變得十分相似,而且開始預計用戶想要的東西。

關於 Facebook,有人曾經說過它能通過女事主在社交網絡內容中滑動的速率,在當事人知道自己懷孕之前確定。這種心靈感應般的能力當然無法令人信服,但是當中的機器學習部份在近年日益受到重用,Kaspersky 其中一種威脅偵測方式行為模型也以類似的方式操作,其基本概念是,如果這東西的叫聲像鴨,牠可能就是一隻鴨,如果某可疑檔案行為像惡意程式,它就可能懷有惡意。

解釋二:意外啟動語音輔助
另一個解釋令搜索引擎變得無所不知,可能是因為意外啟動了語音輔助,有時候電話「以為」用戶講出 Alexa、OK Google、Hey Siri 或 Cortana,而事實上用戶並沒有講。用戶無需準確地發音,有時候類似也能夠同樣觸發輔助,如此一來電話真的「聆聽」所有說話,然後開始提供相關的建議。

在待機模式,即使獨立的語音輔助系統不會持續接收用戶的說話,它們等著被呼喚,所以為了捕捉到啟動的指令,裝置使用小量緩衝 (數秒聲音儲存)、專用 (相對弱) 的處理器、和調校至指定字句的語音識別運算。它會一直長時間運作,低耗電量和無需連接互聯網,只在偵測到觸發的字句才完全啟動裝置、連接伺服器、傳送記錄的資料以作識別。

解釋三:用戶域
如果用戶跟朋友或配偶談及需要某東西,即使自己沒有開始進行搜尋,但在對話之後出現該東西的廣告,其實也能夠解釋。如果用戶經常和朋友在相同地方見面,互聯網服務可能已經懷疑兩個帳號 (用戶反自的帳號) 有某程度的關連,可能使用相同的 Wi-Fi 網絡、或者使用相同裝置反複登入兩個帳號,這樣搜索引擎就會把兩名用戶放入「域」」內,展示某些相同的產品,因為兩人可能會一起進行購買的決定。

雖然無法完全肯定以上的方法,但以上做法作為互聯網服務的一部份其實相當符合邏輯。

解釋四:猜中了 (幸運地)
大部份時間大家看到的廣告都與你的興趣不符,但大部份人士都會使用搜索引擎,所以在用戶與朋友講過某東西後,該東西的廣告在某一天突然出現在眼前,然後就開始在網上談論智能手機竊聽,同另一方面,有人看見相同廣告,但他沒有講過該東西,所以沒有在網上談論甚麼,從而只看見有人在談論智能手機竊聽,事實其實是樣本數量夠大,都只是機會率。

結論
先回到實驗部份,Kaspersky 的研究人員在持續一星期「發功」後,雖然出現了很多廣告,但沒有任何一人的智能手機出現實驗項目的廣告。不過研究人員的人數不多,通常實驗人數越多結果越準確,所以歡迎大家一起測試。

Kaspersky 的研究人員其實還進行了另一個實驗,一班員工在傳送給某位同事 Gmail 的工作電郵中,都以白色字體加入「spoons spoons spoons spoons spoons」,結果那位同事看到大量匙子的廣告,這看起來十分可疑。

如果對以上存有疑慮的話,大家可以安裝 Kaspersky Internet Security 並啟動 Anti-Banner 和 Private Browsing 功能,能對大量網絡追跡行為加以攔截。