Nhiều bên thứ ba biết bạn làm gì trực tuyến

Trong hơn hai thập kỷ, mọi người đã sử dụng internet để nghiên cứu, mua sắm, kết bạn, tìm ngày tháng và tìm hiểu về thế giới. Và các bên thứ ba đã theo dõi — và học hỏi.

Khi bạn mở một trang web, trình duyệt của bạn không chỉ nói chuyện với trang web bạn định truy cập. Trang web này có thể chứa các bên thứ ba, một trong những trang web nhúng mà các trình duyệt của bạn cũng nói chuyện với nhau như nhà quảng cáo, công cụ phân tích trang web hoặc các tiện ích truyền thông xã hội có thể quan sát hành vi duyệt web của bạn.

Thông thường các công ty này sử dụng thông tin này cho các ứng dụng vô tội, mặc dù đôi khi xâm nhập vào các ứng dụng như quảng cáo được nhắm mục tiêu hoặc nội dung được cá nhân hóa. Nhưng trình theo dõi web của bên thứ ba đặt ra câu hỏi về quyền riêng tư của người dùng, vì họ có thể xác định người dùng khi họ truy cập nhiều trang web, chọn dấu vết của một người và có khả năng xây dựng hồ sơ toàn diện dựa trên hành vi web.

Các nhà nghiên cứu từ Đại học Washington đã tạo ra phân tích toàn diện đầu tiên về theo dõi web của bên thứ ba trong ba thập kỷ và một công cụ mới, TrackExcavator, họ đã phát triển để trích xuất và phân tích các hành vi theo dõi trên một trang web nhất định.

Họ đã thấy sự gia tăng gấp bốn lần theo dõi của bên thứ ba trên các trang web hàng đầu từ 1996 đến 2016 và lập bản đồ về sự phức tạp ngày càng tăng của các trình theo dõi kéo dài hàng thập kỷ.


đồ họa đăng ký nội tâm


Adam Lerner, một sinh viên tốt nghiệp tại khoa kỹ thuật và khoa học máy tính, người đã trình bày phát hiện của nhóm vào tuần trước tại Hội nghị bảo mật USENIX ở Austin, Texas cho biết: “Theo dõi của bên thứ ba bắt đầu khá sớm trong lịch sử của web. “Mọi người ngày càng lo lắng hơn về tác động tiềm tàng của việc theo dõi web của bên thứ ba, nhưng chúng tôi thiếu lịch sử toàn diện về cách các trình theo dõi — và các loại thông tin họ thu thập — đã phát triển theo thời gian”.

Ngoài cửa sổ bật lên

Lerner và nghiên cứu sinh tiến sĩ Anna Kornfeld Simpson đã đặt ra những lỗ hổng trong cách hiểu của chúng tôi về việc theo dõi, làm việc với giáo sư khoa học máy tính và kỹ sư Franziska Roesner và phó giáo sư Tadayoshi Kohno của Phòng thí nghiệm bảo mật và bảo mật của Đại học Washington.

Roesner và Kohno trước đây đã nghiên cứu các kỹ thuật theo dõi web của bên thứ ba, bao gồm phát triển phân loại sớm các phương pháp cơ bản mà nhiều trình theo dõi dựa trên cookie sử dụng.

Hành vi theo dõi của phạm vi từ phạm vi 'bắt buộc', như cửa sổ bật lên, đến thứ gì đó 'vanilla' giống như cookie của bên thứ ba theo dõi người dùng, theo ông Kohno. Cho đến bây giờ, chúng tôi không có công cụ để hiểu cách các phương pháp này đã thay đổi kể từ những ngày đầu tiên của web. Bây giờ chúng ta có thể thấy số lượng và sự đa dạng của các trình theo dõi đã tăng lên như thế nào và một số cách tiếp cận đã không được ủng hộ trong khi các phương pháp khác đang gia tăng.

Dự án là một kỳ công không nhỏ, vì không ai thu thập được thông tin một cách có hệ thống về việc theo dõi theo thời gian. Để khắc phục hạn chế này, Theo dõiExcavator thu thập dữ liệu từ kho lưu trữ truy cập mở, rộng rãi của các trang web được gọi là Wayback Machine, bảo tồn nội dung trang web từ thời 1996.

Kornfeld Simpson cho biết, việc tái cấu trúc hành vi theo dõi từ Wayback Machine rất khó khăn vì nó được thiết kế để lưu trữ nội dung web chứ không phải kỹ thuật theo dõi. Chúng tôi đã phải phát triển các kỹ thuật để trích xuất thông tin theo dõi từ kho lưu trữ. Ví dụ: chúng tôi đã thu thập cookie theo dõi từ các tiêu đề HTTP được lưu trữ và Javascript và sau đó mô phỏng các hành vi lưu trữ cookie của trình duyệt để phát hiện hành vi theo dõi.

Nhiều trang web đang được xem

Việc tái cấu trúc phức tạp này chiếm phần lớn thời gian của nhóm trong năm qua, nhưng kết quả cuối cùng là một tổng quan lịch sử về xu hướng theo dõi của bên thứ ba cho các trang web hàng đầu từ 1996 đến 2016. Họ đã định lượng sự gia tăng của theo dõi web của bên thứ ba và minh họa sự xuất hiện của các kỹ thuật theo dõi khác nhau theo thời gian.

Trong 1996, số lượng yêu cầu của bên thứ ba trung bình trên các trang web hàng đầu ít hơn một. Mười năm sau, con số đó tăng lên khoảng 1.5. Ngày nay, trang web hàng đầu trung bình có trung bình ít nhất bốn trình theo dõi của bên thứ ba nhìn vào hoạt động của người dùng. Nhóm nghiên cứu nhấn mạnh rằng những con số này có khả năng bị đánh giá thấp, vì không phải tất cả các trang web đều được lưu trữ đầy đủ.

Họ cũng nhận thấy rằng ngày nay các trình theo dõi riêng lẻ chiếm một phần lớn hơn nhiều trên web.

Trước năm 2003, không một trình theo dõi nào có thể quan sát hành vi duyệt web trên khoảng 5% các trang web phổ biến nhất. Con số đó đã tăng lên 10 phần trăm vào năm 2007. Ngày nay, nhiều trình theo dõi phổ biến đã mở rộng phạm vi phủ sóng của họ lên ít nhất 20 phần trăm các trang web, trong khi một bên thứ ba — Google Analytics — có trên hơn một phần ba các trang web phổ biến nhất.

Những phát hiện này rất quan trọng để hiểu được ảnh hưởng của việc theo dõi đối với quyền riêng tư, vì theo dõi người dùng trên nhiều trang web hơn cho phép người theo dõi phát triển một bức tranh chi tiết và gần gũi hơn về hành vi của họ.

Quyền riêng tư cảnh giác

Viễn cảnh lịch sử năm 20 này vẽ ra một bức tranh rõ ràng về cách theo dõi của bên thứ ba đã phát triển với sự phát triển của các kỹ thuật khác nhau, tiến bộ trong công nghệ và sự phụ thuộc ngày càng tăng của chúng tôi vào web trong cuộc sống. Nói chung, các bên thứ ba đang xem và thu thập thông tin. Làm thế nào chúng ta có thể cảm thấy về điều đó vẫn còn được nhìn thấy.

Không có bối cảnh hóa các hành vi theo dõi ngày nay trong lịch sử web, chúng tôi không biết liệu người dùng có nên lo ngại về quyền riêng tư của mình hay liệu những người ủng hộ quyền riêng tư có khóc sói không. Hơn nữa, chúng tôi không thể đánh giá liệu các phương tiện truyền thông, các cuộc thảo luận chính sách hoặc thay đổi mặc định của trình duyệt có ảnh hưởng hay không, Roesner nói.

Công việc của chúng tôi cung cấp cho chúng tôi các công cụ để trả lời những câu hỏi này. Và những phát hiện của chúng tôi cho thấy rằng theo dõi web nên vẫn là một lĩnh vực quan tâm đối với những người ủng hộ quyền riêng tư.

nguồn: Đại học Washington

Sách liên quan

at

phá vỡ

Cảm ơn đã ghé thăm Nội địa.com, ở đâu có 20,000 + những bài báo thay đổi cuộc sống quảng bá "Thái độ mới và những khả năng mới". Tất cả các bài viết được dịch sang Hơn 30 ngôn ngữ. Theo dõi đến Tạp chí Nội tâm, xuất bản hàng tuần và Cảm hứng hàng ngày của Marie T Russell. Tạp chí InsideSelf đã được xuất bản từ năm 1985.