Przykłady kodu do anonimizacji

a close up of a computer screen with a lot of text on it

Przykładów anonimizacji danych:

  1. Zmiana wartości: Prosta metoda polegająca na zastąpieniu wartości w zbiorze danych innymi, nieidentyfikującymi informacjami. Na przykład, zamiana imion na pseudonimy lub numery identyfikacyjne.
  2. Generalizacja: Polega na przekształceniu danych w bardziej ogólną formę. Przykładem może być zamiana dokładnych wieków na przedziały wiekowe (np. “18-24 lata”).
  3. Supresja: Usunięcie pewnych danych, aby uniemożliwić identyfikację. Na przykład, usuwanie kolumny z danymi adresowymi.
  4. Pseudonimizacja: Przypisanie unikalnych, losowych identyfikatorów do danych osobowych. To pozwala na analizę, ale nie umożliwia bezpośredniego powiązania z konkretną osobą.
  5. Hashowanie: Przekształcenie danych w unikalny ciąg znaków (hash). To przydatne w przypadku haseł lub identyfikatorów.

Pamiętaj, że wybór metody zależy od rodzaju danych, celu anonimizacji i przepisów prawnych:

Przykłady anonimizacji danych w języku Python

Pamiętaj, że wybór metody zależy od rodzaju danych, celu anonimizacji i przepisów prawnych.

Funkcje anonimowe (lambda)

Jeśli masz nieustrukturyzowany tekst (np. z e-maili lub transkrypcji rozmów telefonicznych) oraz listy imion i nazwisk, możesz zastosować pseudonimizację, np. zamieniając imiona i nazwiska na losowe pseudonimy.

Przykład użycia:

add = lambda x, y: x + y
print(add(2, 3))  # Wynik: 5

Anonimizacja danych tekstowych

Przykładem anonimizacji danych tekstowych w języku Python może być zamazanie wybranych informacji, takich jak imiona i nazwiska. Przykład użycia:

def anonymize_name(name):
    # Zamazujemy imię i nazwisko
    return "*****"

original_name = "John Smith"
anonymized_name = anonymize_name(original_name)
print(f"Oryginalne imię: {original_name}")
print(f"Anonimizowane imię: {anonymized_name}")

W wyniku tego kodu otrzymamy:

Oryginalne imię: John Smith
Anonimizowane imię: *****

Hash-owanie

Przekształcenie danych w unikalny ciąg znaków (hash). Hashowanie jest przydatne np. do zabezpieczania haseł lub identyfikatorów.

Przykład użycia:

import hashlib

def hash_data(data):
    return hashlib.sha256(data.encode()).hexdigest()

original_data = "Tajne hasło"
hashed_data = hash_data(original_data)
print(f"Oryginalne hasło: {original_data}")
print(f"Hash: {hashed_data}")

Więcej przykładów kodu Opensource (python)

https://mostly.ai/blog/data-anonymization-in-python?_gl=1okuhot_upMQ.._gaMjAwNDAwNDkzLjE3MjEyMzY0MTM._ga_8NGESMV97J*MTcyMTIzNjQxMi4xLjAuMTcyMTIzNjQxMi4wLjAuMA..

5/5 - (2 votes)

O autorze

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *