回顧2019年9月,Google已先行開放differential privacy基礎程式庫的C++、Java及Go的原始碼。所謂的差分隱私,是一個資料共享方法,僅分享描述資料庫的一些統計特徵,而不公開具體個人資訊,其精神是如果隨機修改資料庫中的一個記錄造成的影響夠小,所求得的統計特徵,就不能被用來反推出單一記錄的內容,即在保留統計學特徵的前提之下,能夠去除個體特徵以保護使用者隱私。

Google產品經理Miguel Guevara指出,differential-privacy這項開源專案的目的是希望提供公開透明的方式,讓研究人員可檢查當中程式碼。去年的專案引發迴響,例如開發醫療資料隱私分析工具的開發商Arkhn等,以及希望透過可證實的私有資料來加速科學發現的澳洲開發者。

因此Google進一步和開源界開發商OpenMined合作,經過一年的努力,今年1月28日舉行的資料隱私日,兩家公司共同宣布新的差分隱私工具PipelineDP,讓Python開發商可以在差分隱私保護下處理資料。這也讓這家軟體大廠的差分隱私程式庫擴及占全球半數的Python開發族群。

目前已有單位利用這套Python程式庫實驗新的應用情境,像是以集結、匿名方式顯示每個網站當中各國造訪次數最高的網頁。這個程式庫可配合大型資料處理最主流的兩個引擎:Spark和Beam框架使用,為使用及實作提供更大的彈性。

Google也會持續發展新的差分隱私工具,供開發人員執行數據的圖解呈現,以及調校產生差別隱私資訊的參數。此外他們也會發布論文,公開將差分隱私擴充到超過1 PB規模的資料集。

目前,Google內部也正在訓練開發差分隱私方案的團隊,這當中包括人流報告(Mobility Reports)與Google Maps「最受歡迎次數」功能幕後的基礎架構,他們也將協助OpenMined建立專家團隊,提供差分隱私技術部署的學習資源。Google也鼓勵開發人員加入實驗差分隱私應用情境,像是統計分析、機器學習,並提供回饋意見。

熱門新聞

Advertisement