Các thuật toán của YouTube có thể cấp tiến hóa con người - Nhưng vấn đề thực sự là chúng tôi không biết họ làm việc như thế nào Mr Tempter / Shutterstock

YouTube có tạo ra những kẻ cực đoan không? Một nghiên cứu gần đây gây ra tranh luận giữa các nhà khoa học bằng cách lập luận rằng các thuật toán cung cấp năng lượng cho trang web không giúp triệt để mọi người bằng cách đề xuất các video cực đoan hơn, như Đã được đề xuất trong những năm gần đây.

Bài viết, được gửi tới tạp chí truy cập mở vào thứ Hai đầu tiên nhưng chưa được chính thức xem xét, phân tích các đề xuất video được nhận bởi các loại kênh khác nhau. Nó tuyên bố rằng thuật toán của YouTube ủng hộ các kênh truyền thông chính thống hơn nội dung độc lập, kết luận rằng sự triệt để có liên quan nhiều hơn đến những người tạo ra nội dung có hại hơn thuật toán của trang web.

Các chuyên gia trong lĩnh vực này đã nhanh chóng trong đáp ứng với nghiên cứu, với một số chỉ trích phương pháp của bài báo và những người khác tranh luận thuật toán là một trong một số yếu tố quan trọng và khoa học dữ liệu đó thôi sẽ không cho chúng tôi câu trả lời.

Vấn đề với cuộc thảo luận này là chúng tôi thực sự không thể trả lời câu hỏi về vai trò của thuật toán YouTube trong việc triệt để mọi người vì chúng tôi không hiểu cách thức hoạt động của nó. Và đây chỉ là một triệu chứng của một vấn đề rộng lớn hơn nhiều. Các thuật toán này đóng một vai trò ngày càng tăng trong cuộc sống hàng ngày của chúng tôi nhưng thiếu bất kỳ loại minh bạch nào.

Thật khó để tranh luận rằng YouTube không đóng vai trò triệt để. Điều này lần đầu tiên được chỉ ra bởi nhà xã hội học công nghệ Zeynep Tufekci, người đã minh họa cách các video được đề xuất dần dần thúc đẩy người dùng hướng tới nội dung cực đoan hơn. Theo lời của Tufekci, các video về chạy bộ dẫn đến các video về chạy ultramarathons, video về vắc-xin dẫn đến các thuyết âm mưu và các video về chính trị dẫn đến sự từ chối của hề Holocaust và các nội dung gây rối khác.


đồ họa đăng ký nội tâm


Điều này cũng đã được viết về chi tiết bởi nhân viên cũ của YouTube, Guillaume Chaslot, người đã làm việc với thuật toán đề xuất của trang web. Kể từ khi rời công ty, Chaslot đã tiếp tục cố gắng đưa ra những khuyến nghị đó Minh bạch hơn. Ông nói rằng các đề xuất của YouTube thiên về thuyết âm mưu và video thực tế không chính xác, tuy nhiên mọi người sẽ dành nhiều thời gian hơn trên trang web.

Trong thực tế, tối đa hóa thời gian xem là toàn bộ thuật toán của YouTube và điều này khuyến khích những người tạo video đấu tranh để thu hút sự chú ý bằng mọi cách có thể. Công ty tuyệt đối thiếu minh bạch về chính xác làm thế nào điều này làm cho nó gần như không thể chống lại sự cực đoan trên trang web. Rốt cuộc, không có sự minh bạch, thật khó để biết những gì có thể được thay đổi để cải thiện tình hình.

Các thuật toán của YouTube có thể cấp tiến hóa con người - Nhưng vấn đề thực sự là chúng tôi không biết họ làm việc như thế nào Cách thức hoạt động của thuật toán YouTube vẫn còn là một bí ẩn. Daniel / Shutterstock là ai

Nhưng YouTube không phải là bất thường về mặt này. Sự thiếu minh bạch về cách thức hoạt động của các thuật toán thường xảy ra bất cứ khi nào chúng được sử dụng trong các hệ thống lớn, cho dù bởi các công ty tư nhân hoặc các cơ quan công cộng. Cũng như quyết định video nào sẽ cho bạn xem tiếp theo, thuật toán học máy hiện được sử dụng để đặt trẻ em trong trường học, quyết định về án tù, mục đích điểm tín dụnggiá bảo hiểm, cũng như số phận của Những người nhập cư, Ứng cử viênứng viên đại học. Và thông thường chúng ta không hiểu làm thế nào các hệ thống này đưa ra quyết định của họ.

Các nhà nghiên cứu đã tìm ra những cách sáng tạo để chỉ ra tác động của các thuật toán này đối với xã hội, cho dù bằng cách kiểm tra sự nổi lên của quyền phản động hoặc là truyền bá thuyết âm mưu trên YouTube hoặc bằng cách hiển thị công cụ tìm kiếm phản ánh sự thiên vị phân biệt chủng tộc của những người tạo ra chúng.

Các hệ thống máy học thường lớn, phức tạp và mờ đục. Phù hợp, chúng thường được mô tả là hộp đen, nơi thông tin đi vào, và thông tin hoặc hành động xuất hiện, nhưng không ai có thể thấy những gì xảy ra ở giữa. Điều này có nghĩa là, vì chúng tôi không biết chính xác các thuật toán như hệ thống đề xuất YouTube hoạt động như thế nào, cố gắng tìm ra cách trang web hoạt động sẽ giống như cố gắng hiểu một chiếc xe mà không cần mở nắp ca-pô.

Đổi lại, điều này có nghĩa là cố gắng viết luật để điều chỉnh những thuật toán nào nên hoặc không nên làm trở thành một quá trình mù hoặc thử và sai. Đây là những gì đang xảy ra với YouTube và với rất nhiều thuật toán học máy khác. Chúng tôi đang cố gắng để có tiếng nói trong kết quả của họ, mà không có sự hiểu biết thực sự về cách họ thực sự làm việc. Chúng ta cần mở ra những công nghệ được cấp bằng sáng chế này, hoặc ít nhất là làm cho chúng đủ minh bạch để chúng ta có thể điều chỉnh chúng.

Giải thích và kiểm tra

Một cách để làm điều này sẽ là các thuật toán cung cấp giải thích ngược cùng với quyết định của họ. Điều này có nghĩa là tìm ra các điều kiện tối thiểu cần thiết để thuật toán đưa ra quyết định khác nhau, mà không mô tả logic đầy đủ của nó. Chẳng hạn, một thuật toán đưa ra quyết định về các khoản vay ngân hàng có thể tạo ra một đầu ra nói rằng, nếu bạn trên 18 tuổi và không có khoản nợ nào trước đó, bạn sẽ chấp nhận khoản vay ngân hàng của mình. Nhưng điều này có thể khó thực hiện với YouTube và các trang web khác sử dụng thuật toán đề xuất, vì về lý thuyết, bất kỳ video nào trên nền tảng này đều có thể được đề xuất tại bất kỳ thời điểm nào.

Một công cụ mạnh mẽ khác là kiểm tra và kiểm toán thuật toán, đặc biệt hữu ích trong chẩn đoán các thuật toán sai lệch. Trong một trường hợp gần đây, một công ty sàng lọc sơ yếu lý lịch chuyên nghiệp đã phát hiện ra rằng thuật toán của nó là ưu tiên hai yếu tố như những dự đoán tốt nhất về hiệu suất công việc: liệu tên của ứng cử viên có phải là Jared hay không và liệu họ có chơi lacrosse ở trường trung học hay không. Đây là những gì xảy ra khi máy không được giám sát.

Trong trường hợp này, thuật toán sàng lọc sơ yếu lý lịch đã nhận thấy những người đàn ông da trắng có cơ hội được tuyển dụng cao hơn và đã tìm thấy các đặc điểm proxy tương quan (như được đặt tên là Jared hoặc chơi lacrosse) trong các ứng cử viên được tuyển dụng. Với YouTube, kiểm toán thuật toán có thể giúp hiểu loại video nào được ưu tiên cho đề xuất - và có thể giúp giải quyết cuộc tranh luận về việc liệu các đề xuất của YouTube có góp phần triệt để hay không.

Giới thiệu các giải thích chính xác hoặc sử dụng kiểm toán thuật toán là một quá trình khó khăn, tốn kém. Nhưng nó quan trọng, bởi vì sự thay thế là tồi tệ hơn. Nếu các thuật toán không được kiểm soát và không được kiểm soát, chúng ta có thể thấy một nhóm các nhà lý luận âm mưu và cực đoan dần dần vào phương tiện truyền thông của chúng ta và sự chú ý của chúng ta được kiểm soát bởi bất cứ ai có thể tạo ra nội dung có lợi nhất.Conversation

Lưu ý

Chico Q. Camargo, nhà nghiên cứu sau tiến sĩ về Khoa học dữ liệu, Đại học Oxford

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.