Hầu hết mọi người không nhận ra những gì các công ty có thể dự đoán từ dữ liệu của họ

Hầu hết mọi người không nhận ra những gì các công ty có thể dự đoán từ dữ liệu của họ
Điện thoại của bạn biết gì về bạn? Rawpixel.com / Shutterstock.com

Sáu mươi bảy phần trăm người dùng điện thoại thông minh dựa vào Google Maps để giúp họ đến nơi họ đang đi nhanh chóng và hiệu quả.

Một tính năng chính của Google Maps là khả năng dự đoán các tuyến điều hướng khác nhau sẽ mất bao lâu. Điều đó là có thể bởi vì điện thoại di động của mỗi người sử dụng Google Maps sẽ gửi dữ liệu về vị trí của nó và quay trở lại máy chủ của Google, nơi nó được phân tích để tạo dữ liệu mới về tình trạng giao thông.

Thông tin như thế này rất hữu ích cho việc điều hướng. Nhưng cùng một dữ liệu được sử dụng để dự đoán các mẫu lưu lượng truy cập cũng có thể được sử dụng để dự đoán các loại thông tin khác - thông tin mọi người có thể không thoải mái với việc tiết lộ.

Ví dụ: dữ liệu về vị trí di động và các mẫu di chuyển trong quá khứ có thể được sử dụng để dự đoán nơi một người sống, chủ nhân của họ là ai, nơi họ tham gia các dịch vụ tôn giáo và độ tuổi của con cái họ dựa trên nơi họ đưa họ đến trường.

Những dự đoán này ghi nhãn bạn là người như thế nào và đoán xem bạn có khả năng sẽ làm gì trong tương lai. Nghiên cứu cho thấy rằng mọi người phần lớn không biết rằng những dự đoán này là có thể, và, nếu họ thực sự nhận thức được nó, không thích nó. Theo quan điểm của tôi, khi một người nghiên cứu các thuật toán dự đoán ảnh hưởng đến quyền riêng tư của mọi người, đó là một vấn đề lớn đối với quyền riêng tư kỹ thuật số ở Hoa Kỳ

Làm thế nào là tất cả có thể?

Mọi thiết bị bạn sử dụng, mọi công ty bạn kinh doanh, mọi tài khoản trực tuyến bạn tạo hoặc chương trình khách hàng thân thiết mà bạn tham gia và thậm chí chính phủ cũng thu thập dữ liệu về bạn.

Nền tảng loại dữ liệu họ thu thập bao gồm những thứ như Tên, địa chỉ, tuổi, An sinh xã hội hoặc số bằng lái xe, lịch sử giao dịch mua hàng, hoạt động duyệt web, thông tin đăng ký cử tri, cho dù bạn có con sống với bạn hay nói tiếng nước ngoài, ảnh bạn đã đăng lên phương tiện truyền thông xã hội, danh sách giá nhà của bạn, cho dù gần đây bạn có một sự kiện cuộc sống như kết hôn, điểm tín dụng của bạn, loại xe bạn lái, bạn chi bao nhiêu cho cửa hàng tạp hóa, bạn có bao nhiêu nợ thẻ tín dụng và lịch sử vị trí từ điện thoại di động của bạn điện thoại.

Hầu hết mọi người không nhận ra những gì các công ty có thể dự đoán từ dữ liệu của họ


Nhận thông tin mới nhất từ ​​Nội tâm


Sẽ không có vấn đề gì nếu những bộ dữ liệu này được thu thập riêng bởi các nguồn khác nhau và không chứa tên của bạn. Vẫn dễ dàng kết hợp chúng theo thông tin khác về bạn mà chúng chứa.

Ví dụ: có các số nhận dạng trong cơ sở dữ liệu hồ sơ công cộng, như tên và địa chỉ nhà của bạn, có thể được khớp với dữ liệu vị trí GPS từ một ứng dụng trên điện thoại di động của bạn. Điều này cho phép bên thứ ba liên kết địa chỉ nhà của bạn với địa điểm nơi bạn dành phần lớn thời gian buổi tối và ban đêm - có lẽ là nơi bạn sống. Điều này có nghĩa là nhà phát triển ứng dụng và các đối tác của nó có quyền truy cập vào tên của bạn, ngay cả khi bạn không trực tiếp cung cấp cho họ.

Tại Hoa Kỳ, các công ty và nền tảng bạn tương tác với sở hữu dữ liệu họ thu thập về bạn. Điều này có nghĩa là họ có thể bán thông tin này một cách hợp pháp cho các nhà môi giới dữ liệu.

Các nhà môi giới dữ liệu là các công ty kinh doanh mua và bán bộ dữ liệu từ nhiều nguồn khác nhau, bao gồm cả dữ liệu vị trí từ nhiều nhà mạng điện thoại di động. Các nhà môi giới dữ liệu kết hợp dữ liệu để tạo hồ sơ chi tiết của từng người, họ bán cho các công ty khác.

Các bộ dữ liệu kết hợp như thế này có thể được sử dụng để dự đoán những gì bạn sẽ muốn mua để nhắm mục tiêu quảng cáo. Ví dụ: một công ty đã mua dữ liệu về bạn có thể thực hiện những việc như kết nối tài khoản truyền thông xã hội và lịch sử duyệt web của bạn với tuyến đường bạn đi khi bạn đang làm việc vặt và lịch sử mua hàng tại cửa hàng tạp hóa địa phương.

Nhà tuyển dụng sử dụng bộ dữ liệu lớn và thuật toán dự đoán để đưa ra quyết định về việc phỏng vấn ai cho công việc và dự đoán ai có thể bỏ thuốc lá. Các sở cảnh sát lập danh sách những người có thể nhiều khả năng phạm tội bạo lực. FICO, cùng một công ty tính điểm tín dụng, cũng tính toán một Điểm tuân thủ thuốc men dự đoán ai sẽ ngừng dùng thuốc theo toa của họ.

Làm thế nào nhận thức được mọi người về điều này?

Mặc dù mọi người có thể biết rằng điện thoại di động của họ có GPS và tên và địa chỉ của họ nằm trong cơ sở dữ liệu hồ sơ công cộng ở đâu đó, nhưng rất ít khả năng họ nhận ra làm thế nào dữ liệu của họ có thể được kết hợp để đưa ra dự đoán mới. Đó là bởi vì chính sách bảo mật thường chỉ bao gồm Ngôn ngữ mơ hồ về cách dữ liệu được thu thập sẽ được sử dụng.

Trong một cuộc khảo sát tháng một, dự án Pew Internet và American Life đã hỏi người dùng Facebook trưởng thành ở Mỹ về những dự đoán mà Facebook đưa ra về đặc điểm cá nhân của họ, dựa trên dữ liệu được thu thập bởi nền tảng và các đối tác. Ví dụ: Facebook chỉ định danh mục mối quan hệ đa văn hóa của người Viking cho một số người dùng, đoán xem họ giống với những người thuộc chủng tộc hoặc dân tộc khác nhau như thế nào. Thông tin này được sử dụng để nhắm mục tiêu quảng cáo.

Cuộc khảo sát cho thấy phần trăm 74 của mọi người không biết về những dự đoán này. Khoảng một nửa cho biết họ không thoải mái với thông tin dự đoán của Facebook như thế này.

Trong nghiên cứu của tôi, Tôi thấy rằng mọi người chỉ biết về các dự đoán được hiển thị cho họ trong giao diện người dùng của ứng dụng và điều đó hợp lý với lý do họ quyết định sử dụng ứng dụng. Ví dụ: Nghiên cứu 2017 của người dùng theo dõi thể dục cho thấy mọi người biết rằng thiết bị theo dõi của họ thu thập vị trí GPS của họ khi họ đang tập thể dục. Nhưng điều này không chuyển thành nhận thức rằng công ty theo dõi hoạt động có thể dự đoán nơi họ sống.

Trong một nghiên cứu khác, tôi thấy rằng người dùng Google Tìm kiếm biết rằng Google thu thập dữ liệu về lịch sử tìm kiếm của họ và người dùng Facebook biết rằng Facebook biết bạn bè của họ là ai. Nhưng mọi người không biết rằng Facebook của họ thích lượt dùng có thể được sử dụng để dự đoán chính xác liên kết đảng chính trị hoặc khuynh hướng tình dục của họ.

Cách bảo vệ quyền riêng tư của bạn3 1 9

Có thể làm gì về điều này?

Internet ngày nay chủ yếu dựa vào những người quản lý quyền riêng tư kỹ thuật số của riêng họ.

Các công ty yêu cầu mọi người lên trước để đồng ý với các hệ thống thu thập dữ liệu và đưa ra dự đoán về chúng. Cách tiếp cận này sẽ hoạt động tốt để quản lý quyền riêng tư, nếu mọi người từ chối sử dụng các dịch vụ có chính sách quyền riêng tư mà họ không thích và nếu các công ty không vi phạm chính sách quyền riêng tư của họ.

Nhưng nghiên cứu cho thấy rằng không ai đọc hay hiểu những chính sách bảo mật. Và, ngay cả khi các công ty phải đối mặt với hậu quả vì phá vỡ lời hứa về quyền riêng tư của họ, điều đó cũng không ngăn họ khỏi làm lại.

Yêu cầu người dùng đồng ý mà không hiểu dữ liệu của họ sẽ được sử dụng như thế nào cũng cho phép các công ty chuyển sự đổ lỗi lên người dùng. Nếu người dùng bắt đầu cảm thấy như dữ liệu của họ đang được sử dụng theo cách mà họ không thực sự thoải mái, họ không có chỗ để phàn nàn, vì họ đồng ý, phải không?

Theo quan điểm của tôi, không có cách nào thực tế để người dùng nhận thức được các loại dự đoán có thể. Mọi người thường tự nhiên mong đợi các công ty chỉ sử dụng dữ liệu của họ theo những cách liên quan đến lý do họ có tương tác với công ty hoặc ứng dụng ngay từ đầu. Nhưng các công ty thường không bắt buộc về mặt pháp lý để hạn chế cách họ sử dụng dữ liệu của mọi người chỉ vào những điều mà người dùng mong đợi.

Một ngoại lệ là Đức, nơi Văn phòng Cartel Liên bang cai trị vào ngày 2 tháng 2 rằng Facebook phải đặc biệt yêu cầu người dùng của mình cho phép kết hợp dữ liệu được thu thập về họ trên Facebook với dữ liệu được thu thập từ bên thứ ba. Phán quyết cũng tuyên bố rằng nếu mọi người không cho phép điều này, họ vẫn có thể sử dụng Facebook.

Tôi tin rằng Hoa Kỳ cần các quy định liên quan đến quyền riêng tư mạnh mẽ hơn, để các công ty sẽ minh bạch hơn và có trách nhiệm với người dùng về không chỉ dữ liệu họ thu thập, mà cả các loại dự đoán mà họ tạo ra bằng cách kết hợp dữ liệu từ nhiều nguồn.Conversation

Giới thiệu về Tác giả

Emilee Rader, Phó Giáo sư Truyền thông và Thông tin, Michigan State University

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.

Sách liên quan

{amazonWS: searchindex = Books; Keywords = bảo vệ quyền riêng tư của bạn; maxresults = 3}

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

theo dõi Nội bộ trên

facebook-iconbiểu tượng twitterbiểu tượng rss

Nhận tin mới nhất qua email

{Emailcloak = off}

ĐỌC MOST