Đã đến lúc tỏa sáng những thuật toán có sức mạnh lớn

Sắp xếp theo các thuật toán đặt chúng ta trong hộp. Làm thế nào để chúng ta biết họ là những người chính xác? được tạo, CC BYSắp xếp theo các thuật toán đặt chúng ta trong hộp. Làm thế nào để chúng ta biết họ là những người chính xác? được tạo, CC BY

Xã hội dường như đặt ra một khóa học đến một điểm mà cuộc sống của chúng ta phải chịu sự giám sát của các thuật toán máy tính. Dữ liệu chúng tôi tạo ra được phân tích và phân tích, cho dù chính phủ vì an ninh quốc gia hay công ty vì lợi nhuận, và điều này khó có thể thay đổi - sức mạnh và sự hấp dẫn của phân tích dữ liệu, một khi được tìm thấy, sẽ không dễ dàng từ bỏ.

Nhưng trong thực tế, tôi tự hỏi liệu tôi có quan tâm nhiều hơn rằng dữ liệu của chúng tôi đang được thu thập hay thực tế là chúng tôi không biết gì về các thuật toán phát âm phán đoán chúng tôi.

Mức độ chi tiết về cuộc sống và thói quen của chúng ta có thể được bỏ qua từ dữ liệu chúng ta để lại đã được thảo luận trước đây và đang được phát sóng mới như một phần của cuộc tranh luận xung quanh dự thảo của Vương quốc Anh Điều tra Powers Bill. Chúng tôi biết ít nhất một cái gì đó về dữ liệu được thu thập và thời gian lưu trữ trong bao lâu, một số dữ liệu được điều chỉnh bởi luật pháp của Vương quốc Anh và Châu Âu.

trong văn bản dự thảo luật, ví dụ, chúng tôi biết rằng chính phủ Vương quốc Anh sẽ chỉ truy cập nhu cầu (không chính đáng) vào dữ liệu truyền thông, tiêu đề và chủ đề của email và hồ sơ cuộc gọi điện thoại. Nhưng chúng ta cũng biết cách tiết lộ siêu dữ liệu một mình có thể: hãy nhìn vào Dự án ngâm của MIT Media Lab cho một ví dụ mạnh mẽ về việc có bao nhiêu chi tiết có thể được xác định từ nó. Chắc chắn rồi hoàn toàn không thể so sánh với một hóa đơn điện thoại được ghi thành từng khoản, như đã tuyên bố.

Vì vậy, dù tốt hay xấu, chúng ta, công chúng, có một số manh mối về những gì được ghi lại. Nhưng chúng tôi hoàn toàn không biết những công cụ và kỹ thuật phân tích nào đang được áp dụng cho dữ liệu này - và tầm quan trọng của việc này không nên bị đánh giá thấp.

Những gì Crunches số?

Chúng ta có thể đoán Các cơ quan an ninh quốc gia có thể sử dụng siêu dữ liệu của chúng tôi để tạo các mạng xã hội giữa người và địa điểm, trong số những thứ khác, liên kết chúng tôi lại với nhau. Các mạng lưới mối quan hệ này sau đó sẽ được phân tích để xác định xem chúng tôi có phải là người quan tâm hay không, được xác định bằng cách bạn so sánh với những người quan tâm khác và cách bạn kết nối với những người quan tâm hiện tại hoặc những người có liên quan đến họ.

Các nhà nghiên cứu sử dụng các kỹ thuật này hiểu được những hạn chế của họ và rằng các thuật toán cung cấp năng lượng cho chúng có thể chứa lỗi hoặc các giả định cơ bản có ảnh hưởng sâu sắc đến đầu ra của chúng. Trong trường hợp này, điều đó có thể có nghĩa là bạn có bị gắn mác khủng bố hay không, hoặc liệu bạn có đủ điều kiện để vay hoặc thế chấp hay không.


Nhận thông tin mới nhất từ ​​Nội tâm


Nó cũng không chính xác rõ ràng ở đâu trong khu vực biên giới mờ, sự tồn tại của mối quan hệ được xác định. Có phải chỉ đơn giản là truy cập cùng một trang web như một kẻ khủng bố ngụ ý các giá trị được chia sẻ, hoặc đi trên cùng một tuyến xe buýt mỗi ngày cho thấy bạn thường xuyên trò chuyện với những kẻ khủng bố? Hoàn toàn có thể truy cập các trang web thường xuyên của những kẻ khủng bố được biết đến vì nhiều lý do chính đáng. Nếu bạn nhận được tin tức từ các trang web giống như những kẻ khủng bố, bạn có nhiều khả năng là một kẻ khủng bố? Phân biệt đối xử và thiên vị có thể được giới thiệu tại điểm thu thập dữ liệu và sau đó một lần nữa khi các quyết định được đưa ra về cách phân tích dữ liệu đó. Các thuật toán có thể phân biệt đối xử, quá.

Ranh giới mờ

Khả năng các thuật toán đưa ra sự thiên vị không mong muốn là rất thực tế. Ví dụ, những người được sử dụng bởi các dịch vụ an ninh được đào tạo trên bộ dữ liệu của những kẻ khủng bố đã biết và những kẻ không phải là khủng bố đã biết. Điều này có nghĩa là, vì hầu hết những kẻ khủng bố được biết đến là những người đàn ông ở độ tuổi 20-30, nhiều khả năng bạn sẽ được phân loại là một kẻ khủng bố vì chỉ đơn thuần là nam giới và có độ tuổi đại khái là 20-30, bất kể thuộc tính nào khác của bạn?. Nếu vậy, điều này có ảnh hưởng đáng kể đến cách sử dụng dữ liệu không?

Vấn đề bắt nguồn từ việc tôi và các nhà nghiên cứu hàn lâm khác sử dụng phân tích mạng phức tạp, học máy, khớp mẫu hoặc kỹ thuật trí tuệ nhân tạo đã sử dụng các kỹ thuật đó được xem xét công khai để xác định sức mạnh của các kỹ thuật và tính hợp lệ của kết luận; dịch vụ an ninh chính phủ và các tổ chức khu vực tư nhân thì không. Chúng tôi không có ý tưởng về chất lượng của các phương pháp của họ và cách họ triển khai chúng. Có một giải pháp cho điều này?

Những người từ một lĩnh vực bảo mật khác, mật mã học, đã học được từ lâu rằng cách tốt nhất để cải thiện chất lượng và do đó bảo mật cho các thuật toán của nó là công khai chúng. Việc triển khai mật mã và mật mã được công bố, và các nhà nghiên cứu khuyến khích cố gắng tìm ra lỗi hoặc sai sót, để cải thiện bảo mật cho tất cả những ai sử dụng chúng. Ngoài ra, nói chung, bất kỳ triển khai thuật toán mã hóa nguồn đóng (không công khai) nào nói chung nghi ngờ. Nếu họ phát âm các phán đoán thay đổi cuộc sống theo chúng tôi - cho dù chúng tôi bị gắn mác là khủng bố hay không xứng đáng về tài chính - thì mô hình tương tự nên được áp dụng cho các thuật toán bảo mật.

Một lập luận chống lại một động thái như vậy là các thuật toán mở và minh bạch có thể khiến những kẻ khủng bố sửa đổi hành vi trong thế giới thực của chúng để tránh bị phát hiện. Điều này có nghĩa là thay đổi những thứ như tương tác, liên kết, thói quen duyệt web và các phong trào có khả năng của họ. Nhưng điều này, nếu các thuật toán hoạt động tốt, có nghĩa là về cơ bản chúng sẽ ngừng hoạt động như những kẻ khủng bố. Nếu bảo mật, tự do và an toàn trong tương lai của chúng ta sẽ phụ thuộc vào các thuật toán này, chúng ta phải được đảm bảo chính xác cách thức - và điều đó - chúng hoạt động.

Giới thiệu về Tác giảConversation

Philip Garnett, Giảng viên, Đại học York.

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách liên quan:

{amazonWS: searchindex = Books; Keywords = 0393244814; maxresults = 1}

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

theo dõi Nội bộ trên

facebook-iconbiểu tượng twitterbiểu tượng rss

Nhận tin mới nhất qua email

{Emailcloak = off}

ĐỌC MOST