Google宣布在雲端資料倉儲BigQuery添加差分隱私(Differential Privacy)技術,使得用戶可以在各種應用中提升敏感資料的隱私安全性。目前所有BigQuery版本都已經支援差分隱私,用戶能夠使用的聚合函式包括SUM、COUNT、AVG和PERCENTILE_CONT。

差分隱私是一個隱私安全的特徵共享方法,透過僅分享資料庫中的一些統計特徵,而不公開特定實體資訊,來達到保護隱私安全的目的。差分隱私這項匿名化技術,能夠應用在機器學習推理和共享資料用例上,包括廣告、金融、醫療保健和教育產業應用,皆會使用差分隱私進行資料分析,並免暴露個人紀錄。

Google在2019年發表將差分隱私技術應用在資料庫的重要研究,其目標是希望差分隱私能夠確保資料庫查詢的結果,不會洩漏資料庫中任何個體的過多資訊。這項研究的重要性在於,過去差分隱私都僅停留在科學研究階段,真正完整的差分隱私查詢引擎很少,而Google的這項研究則將差分隱私帶進實際應用中。

差分隱私用於實際系統之所以存在挑戰,在於差分隱私系統常假設每個個體最多只與一條資料庫記錄相關聯,但在資料庫實際應用上並非如此,Google提出在資料庫中進行差分隱私聚合的方法,這是一個通用且可擴展的方法,每個個體可以和任意行數的資料相關聯。

Google在發表差分隱私論文的同時,也開源了自家核心產品中所使用的差分隱私函式庫,包括Google的廣告資料中心,以及COVID-19社區人流趨勢報告,都使用了這個函式庫。

現在Google進一步擴展自家產品對差分隱私的支援,利用差分隱私函式庫,在BigQuery加入這項隱私保護功能,優點除了提升資料應用隱私保護之外,也能協助企業符合法遵要求,而且因為差分隱私與其他隱私保護技術相比,更能保留資料的統計特性和可用性,因此企業在保護用戶隱私的同時,仍可以對資料進行分析,挖掘有價值的資訊。

Google提到,之後他們還會在BigQuery資料無塵室(Clean Room)中整合差分隱私,使企業能夠以更具隱私安全的方式共享敏感資料。

熱門新聞

Advertisement