Spis treści
Przykładów anonimizacji danych:
- Zmiana wartości: Prosta metoda polegająca na zastąpieniu wartości w zbiorze danych innymi, nieidentyfikującymi informacjami. Na przykład, zamiana imion na pseudonimy lub numery identyfikacyjne.
- Generalizacja: Polega na przekształceniu danych w bardziej ogólną formę. Przykładem może być zamiana dokładnych wieków na przedziały wiekowe (np. “18-24 lata”).
- Supresja: Usunięcie pewnych danych, aby uniemożliwić identyfikację. Na przykład, usuwanie kolumny z danymi adresowymi.
- Pseudonimizacja: Przypisanie unikalnych, losowych identyfikatorów do danych osobowych. To pozwala na analizę, ale nie umożliwia bezpośredniego powiązania z konkretną osobą.
- Hashowanie: Przekształcenie danych w unikalny ciąg znaków (hash). To przydatne w przypadku haseł lub identyfikatorów.
Pamiętaj, że wybór metody zależy od rodzaju danych, celu anonimizacji i przepisów prawnych:
Przykłady anonimizacji danych w języku Python
Pamiętaj, że wybór metody zależy od rodzaju danych, celu anonimizacji i przepisów prawnych.
Funkcje anonimowe (lambda)
Jeśli masz nieustrukturyzowany tekst (np. z e-maili lub transkrypcji rozmów telefonicznych) oraz listy imion i nazwisk, możesz zastosować pseudonimizację, np. zamieniając imiona i nazwiska na losowe pseudonimy.
Przykład użycia:
add = lambda x, y: x + y
print(add(2, 3)) # Wynik: 5
Anonimizacja danych tekstowych
Przykładem anonimizacji danych tekstowych w języku Python może być zamazanie wybranych informacji, takich jak imiona i nazwiska. Przykład użycia:
def anonymize_name(name):
# Zamazujemy imię i nazwisko
return "*****"
original_name = "John Smith"
anonymized_name = anonymize_name(original_name)
print(f"Oryginalne imię: {original_name}")
print(f"Anonimizowane imię: {anonymized_name}")
W wyniku tego kodu otrzymamy:
Oryginalne imię: John Smith
Anonimizowane imię: *****
Hash-owanie
Przekształcenie danych w unikalny ciąg znaków (hash). Hashowanie jest przydatne np. do zabezpieczania haseł lub identyfikatorów.
Przykład użycia:
import hashlib
def hash_data(data):
return hashlib.sha256(data.encode()).hexdigest()
original_data = "Tajne hasło"
hashed_data = hash_data(original_data)
print(f"Oryginalne hasło: {original_data}")
print(f"Hash: {hashed_data}")