《計算機應用研究》|Application Research of Computers

面向結構化數據集的敏感屬性識別與分級算法

Sensitive attribute recognition and classification algorithm for structure dataset

免費全文下載 (已被下載 次)  
獲取PDF全文
作者 何文竹,彭長根,王毛妮,丁興,樊玫玫,丁紅發
機構 貴州大學 計算機科學與技術學院;貴州大學 公共大數據國家重點實驗室;貴州大學 數學與統計學院;貴州財經大學
統計 摘要被查看 次,已被下載
摘要 如何對生產環境中經代碼混淆的結構化數據集的敏感屬性(字段)進行自動化識別、分類分級,已成為對結構化數據隱私保護的瓶頸。提出一種面向結構化數據集的敏感屬性自動化識別與分級算法,利用信息熵定義了屬性敏感度,通過對敏感度聚類和屬性間關聯規則挖掘,將任意結構化數據集的敏感屬性進行識別和敏感度量化;通過對敏感屬性簇中屬性間的互信息相關性和關聯規則分析,對敏感屬性進行分組并量化其平均敏感度,實現敏感屬性的分類分級。實驗表明,該算法可識別、分類分級任意結構化數據集的敏感屬性,效率和精確率更高;對比分析表明,該算法可同時實現敏感屬性的識別與分級,無需預知屬性特征、敏感特征字典,兼顧了屬性間的相關性和關聯關系。
關鍵詞 隱私保護;敏感屬性識別與分級;最大熵;關聯規則;互信息
基金項目 國家自然科學基金資助項目(U1836205,61662009,61772008,11761020)
貴州省科技計劃項目(黔科合重大專項字[2018]3001,黔科合重大專項字[2018]3007,黔科合重大專項字[2017]3002,黔科合支撐[2019]2004,黔科合支撐[2018]2162,黔科合基礎[2019]1049,黔科合基礎[2017]1045)
貴州財經大學科研基金資助項目(2017XJC01)
本文URL http://www.ziusle.tw/article/02-2020-10-006.html
收稿日期
修回日期
頁碼 -
中圖分類號 TP309
文獻標志碼
中超外援名额