Làm thế nào có thể bảo mật khác biệt bảo vệ dữ liệu của bạn? Marco Verch / Flickr, CC BY 

Các công ty công nghệ có thể sử dụng quyền riêng tư khác biệt để thu thập và chia sẻ dữ liệu tổng hợp về thói quen của người dùng, trong khi vẫn duy trì quyền riêng tư cá nhân.

Không có gì bí mật rằng các công ty công nghệ lớn như Facebook, Google, Apple và Amazon đang ngày càng thâm nhập vào các tương tác cá nhân và xã hội của chúng tôi để thu thập lượng lớn dữ liệu về chúng tôi mỗi ngày. Đồng thời, vi phạm quyền riêng tư trong không gian mạng thường xuyên đưa ra tin tức trên trang nhất.

Vậy làm thế nào để bảo mật sự riêng tư trong một thế giới nơi dữ liệu được thu thập và chia sẻ với tốc độ và sự khéo léo ngày càng tăng?

Quyền riêng tư khác biệt là một mô hình mới về bảo mật mạng mà những người đề xuất tuyên bố có thể bảo vệ dữ liệu cá nhân tốt hơn nhiều so với các phương pháp truyền thống.

Các toán học mà nó dựa trên đã được phát triển 10 từ nhiều năm trước và phương pháp này đã được Apple áp dụng và Google trong những năm gần đây.


đồ họa đăng ký nội tâm


Quyền riêng tư khác biệt là gì?

Quyền riêng tư khác biệt giúp các công ty công nghệ có thể thu thập và chia sẻ thông tin tổng hợp về thói quen của người dùng, trong khi vẫn duy trì quyền riêng tư của người dùng cá nhân.

Ví dụ: giả sử bạn muốn hiển thị các tuyến đường phổ biến nhất mà mọi người đi bộ qua công viên. Bạn theo dõi các tuyến đường của những người 100 thường xuyên đi bộ qua công viên và cho dù họ đi trên đường hay qua bãi cỏ.

Nhưng thay vì chia sẻ những người cụ thể đi theo từng tuyến đường, bạn chia sẻ dữ liệu tổng hợp được thu thập theo thời gian. Những người đang xem kết quả của bạn có thể biết rằng 60 trong số 100 mọi người thích cắt ngắn qua cỏ, nhưng không phải là người 60.

Tại sao chúng ta cần nó?

Nhiều chính phủ trên thế giới có chính sách nghiêm ngặt về cách các công ty công nghệ thu thập và chia sẻ dữ liệu người dùng. Các công ty không tuân theo các quy tắc có thể phải đối mặt với tiền phạt rất lớn. Một Tòa án Bỉ gần đây đã ra lệnh Facebook để ngừng thu thập dữ liệu về thói quen duyệt web của người dùng trên các trang web bên ngoài hoặc đối mặt với khoản tiền phạt € 250,000 mỗi ngày.

Đối với nhiều công ty, đặc biệt là các công ty đa quốc gia hoạt động ở các khu vực pháp lý khác nhau, điều này khiến họ rơi vào tình thế tế nhị khi nói đến việc thu thập và sử dụng dữ liệu khách hàng.

Một mặt, các công ty này cần dữ liệu của người dùng để họ có thể cung cấp các dịch vụ chất lượng cao có lợi cho người dùng, chẳng hạn như các đề xuất được cá nhân hóa. Mặt khác, họ có thể phải đối mặt với các khoản phí nếu họ thu thập quá nhiều dữ liệu người dùng hoặc nếu họ cố gắng di chuyển dữ liệu từ khu vực này sang khu vực khác.

Các công cụ bảo vệ quyền riêng tư truyền thống như mật mã học không thể giải quyết vấn đề nan giải này vì nó ngăn cản các công ty công nghệ truy cập dữ liệu. Và ẩn danh làm giảm giá trị của dữ liệu - một thuật toán không thể phục vụ bạn các đề xuất được cá nhân hóa nếu nó không biết thói quen của bạn là gì.

Học như thế nào?

Hãy tiếp tục ví dụ về các tuyến đường đi bộ qua một công viên. Nếu bạn biết danh tính của những người được đưa vào nghiên cứu, nhưng bạn không biết ai đã đi theo con đường nào thì bạn có thể cho rằng quyền riêng tư được bảo vệ. Nhưng đó có thể không phải là trường hợp.

Giả sử ai đó đang xem dữ liệu của bạn muốn xác định xem Bob có thích đi bộ qua cỏ hay trên đường không. Họ đã thu được thông tin cơ bản về những người 99 khác trong nghiên cứu, điều này cho họ biết rằng người 40 thích đi trên đường và 59 thích đi bộ qua cỏ. Do đó, họ có thể suy luận rằng Bob, người là 100th trong cơ sở dữ liệu, là người 60th thích đi bộ qua cỏ.

Kiểu tấn công này được gọi là một cuộc tấn công khác biệt, và khá khó để chống lại vì bạn không thể kiểm soát lượng kiến ​​thức cơ bản mà ai đó có thể có được. Quyền riêng tư khác biệt nhằm bảo vệ chống lại kiểu tấn công này.

Ai đó suy luận về tuyến đường đi bộ của bạn có vẻ không quá nghiêm trọng, nhưng nếu bạn thay thế các tuyến đường đi bộ bằng kết quả xét nghiệm HIV, thì bạn có thể thấy có khả năng xâm phạm quyền riêng tư nghiêm trọng.

Mô hình bảo mật khác biệt đảm bảo rằng ngay cả khi ai đó có thông tin đầy đủ về 99 của người 100 trong một tập dữ liệu, họ vẫn không thể suy ra thông tin về người cuối cùng.

Cơ chế chính để đạt được điều đó là thêm nhiễu ngẫu nhiên vào dữ liệu tổng hợp. Trong ví dụ về đường dẫn, bạn có thể nói số người thích băng qua cỏ là 59 hoặc 61, chứ không phải là số lượng chính xác của 60. Con số không chính xác có thể bảo vệ quyền riêng tư của Bob, nhưng nó sẽ có rất ít tác động đến mô hình: khoảng 60% mọi người thích cắt ngắn.

Tiếng ồn được thiết kế cẩn thận. Khi Apple sử dụng quyền riêng tư khác biệt trong iOS 10, nó đã thêm tiếng ồn vào đầu vào của người dùng cá nhân. Điều đó có nghĩa là nó có thể theo dõi, ví dụ, biểu tượng cảm xúc được sử dụng thường xuyên nhất, nhưng việc sử dụng biểu tượng cảm xúc của bất kỳ người dùng cá nhân nào đều bị che.

Cynthia Dwork, người phát minh ra sự riêng tư, đã đề xuất bằng chứng toán học tuyệt vời về mức độ nhiễu là đủ để đạt được yêu cầu về quyền riêng tư khác biệt.

Ứng dụng thực tế của nó là gì?

Quyền riêng tư khác biệt có thể được áp dụng cho mọi thứ, từ hệ thống khuyến nghị đến các dịch vụ dựa trên vị trí và mạng xã hội. táo sử dụng quyền riêng tư khác biệt để thu thập thông tin chi tiết về việc sử dụng ẩn danh từ các thiết bị như iPhone, iPad và Mac. Phương pháp này thân thiện với người dùng và rõ ràng hợp pháp.

Quyền riêng tư khác biệt cũng sẽ cho phép một công ty như Amazon truy cập các tùy chọn mua sắm được cá nhân hóa của bạn trong khi ẩn thông tin nhạy cảm về danh sách mua hàng lịch sử của bạn. Facebook có thể sử dụng nó để thu thập dữ liệu hành vi cho quảng cáo được nhắm mục tiêu mà không vi phạm chính sách bảo mật của quốc gia.

Làm thế nào nó có thể được sử dụng trong tương lai?

Các quốc gia khác nhau có chính sách bảo mật khác nhau và các tài liệu nhạy cảm hiện phải được kiểm tra thủ công trước khi họ chuyển từ quốc gia này sang quốc gia khác. Điều này là tốn thời gian và tốn kém.

Gần đây, một nhóm từ Đại học Deakin đã phát triển công nghệ bảo mật khác biệt để tự động hóa các quy trình bảo mật trong cộng đồng chia sẻ đám mây trên khắp các quốc gia.

ConversationHọ đề xuất sử dụng các công thức toán học để mô hình hóa luật riêng tư của mỗi quốc gia có thể được dịch sang phần mềm trung gian trực tuyến (phần mềm) để đảm bảo dữ liệu phù hợp. Sử dụng quyền riêng tư khác biệt theo cách này có thể bảo vệ quyền riêng tư của người dùng và giải quyết vấn đề đau đầu chia sẻ dữ liệu cho các công ty công nghệ.

Giới thiệu về Tác giả

Tianqing Zhu, Giảng viên An ninh mạng, Khoa Khoa học, Kỹ thuật & Môi trường xây dựng, Đại học Deakin

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách liên quan

at Thị trường InnerSelf và Amazon