去識別化是什麼意思

去識別化(De-identification)是指從數據集中刪除或更改敏感信息,以保護個人隱私。這通常涉及從醫療記錄、輿論數據、基因數據等個人信息中移除可以直接或間接識別個人的信息。去識別化的目的是為了允許數據的公開和使用,同時保護個人的隱私權。

去識別化的方法可以包括:

  1. 刪除直接識別信息:如姓名、地址、身份證號碼等。
  2. 更改間接識別信息:如性別、年齡、職業等,這些信息雖然不直接識別個人,但可能與其他數據結合使用來識別個人。
  3. 數據泛化:將詳細信息泛化為更廣泛的類別,例如將具體的地址轉換為更廣泛的地理區域。
  4. 假名化:用假名或編號替換真實姓名。
  5. 混淆技術:對數據進行隨機化或加噪,使其難以追溯到原始數據提供者。

去識別化並不是完全消除所有識別個人的風險,而是將風險降低到可接受的範圍內。然而,即使數據已經去識別化,仍然有可能通過數據挖掘、統計分析或其他技術重新識別個人,尤其是在與其他數據源結合使用時。因此,去識別化應當與其他隱私保護措施結合使用,以確保個人隱私得到充分保護。