Privasi dalam Pembelajaran Mesin

Aspek penting dari penggunaan AI yang bertanggung jawab adalah memastikan bahwa model ML dicegah dari mengekspos informasi yang berpotensi sensitif, seperti informasi demografis atau atribut lain dalam set data pelatihan yang dapat digunakan untuk mengidentifikasi orang. Salah satu cara untuk mencapai ini adalah dengan menggunakan penurunan gradien stokastik pribadi diferensial (DP-SGD), yang merupakan modifikasi dari algoritma penurunan gradien stokastik standar (SGD) dalam pembelajaran mesin.

Model yang dilatih dengan DP-SGD memiliki peningkatan privasi diferensial (DP) terukur, yang membantu mengurangi risiko tereksposnya data pelatihan sensitif. Karena tujuan DP adalah untuk membantu mencegah titik data individu diidentifikasi, model yang dilatih dengan DP tidak boleh terpengaruh oleh satu pun contoh pelatihan dalam kumpulan data pelatihannya. Teknik DP-SGD juga dapat digunakan dalam pembelajaran gabungan untuk memberikan privasi diferensial tingkat pengguna. Anda dapat mempelajari lebih lanjut tentang pembelajaran mendalam pribadi yang berbeda di makalah asli .

import tensorflow as tf
from tensorflow_privacy.privacy.optimizers import dp_optimizer_keras

# Select your differentially private optimizer
optimizer = tensorflow_privacy.DPKerasSGDOptimizer(
    l2_norm_clip=l2_norm_clip,
    noise_multiplier=noise_multiplier,
    num_microbatches=num_microbatches,
    learning_rate=learning_rate)

# Select your loss function
loss = tf.keras.losses.CategoricalCrossentropy(
    from_logits=True, reduction=tf.losses.Reduction.NONE)

# Compile your model
model.compile(optimizer=optimizer, loss=loss, metrics=['accuracy'])

# Fit your model
model.fit(train_data, train_labels,
  epochs=epochs,
  validation_data=(test_data, test_labels),
  batch_size=batch_size)
  

Privasi TensorFlow

Tensorflow Privacy (TF Privacy) adalah library open source yang dikembangkan oleh tim di Google Research. Pustaka menyertakan implementasi Pengoptimal TensorFlow yang umum digunakan untuk melatih model ML dengan DP. Tujuannya adalah untuk memungkinkan praktisi ML menggunakan API Tensorflow standar untuk melatih model pelestarian privasi dengan hanya mengubah beberapa baris kode.

Pengoptimal pribadi yang berbeda dapat digunakan bersama dengan API tingkat tinggi yang menggunakan kelas Pengoptimal, terutama Keras. Selain itu, Anda dapat menemukan implementasi pribadi yang berbeda dari beberapa model Keras. Semua Pengoptimal dan model dapat ditemukan di Dokumentasi API .