Đó không chỉ là một vấn đề về truyền thông xã hội - Cách các công cụ tìm kiếm lan truyền thông tin sai lệchCác công cụ tìm kiếm thường đưa ra một hỗn hợp thông tin xuyên tạc và thông tin sai lệch. Crispin la valiente / Khoảnh khắc qua Getty Images, CC BY-NĐ

Công cụ tìm kiếm là một trong những cổng chính của xã hội đến thông tin và con người, nhưng chúng cũng là ống dẫn thông tin sai lệch. Tương tự với các thuật toán truyền thông xã hội có vấn đề, các công cụ tìm kiếm học cách phục vụ bạn những gì bạn và những người khác đã nhấp vào trước đây. Bởi vì mọi người bị thu hút bởi sự giật gân, sự nhảy múa này giữa các thuật toán và bản chất con người có thể thúc đẩy sự lan truyền của thông tin sai lệch.

Các công ty công cụ tìm kiếm, giống như hầu hết các dịch vụ trực tuyến, kiếm tiền không chỉ bằng cách bán quảng cáo mà còn bằng cách theo dõi người dùng và bán dữ liệu của họ thông qua đặt giá thầu thời gian thực trên đó. Mọi người thường bị dẫn đến thông tin sai lệch do họ ham muốn những tin tức giật gân và giải trí cũng như những thông tin gây tranh cãi hoặc xác nhận quan điểm của họ. Một nghiên cứu cho thấy rằng các video YouTube phổ biến hơn về bệnh tiểu đường là ít có khả năng có thông tin hợp lệ về mặt y tế chẳng hạn như các video ít phổ biến hơn về chủ đề này.

Các công cụ tìm kiếm theo hướng quảng cáo, như các nền tảng truyền thông xã hội, được thiết kế để thưởng cho việc nhấp chuột vào các liên kết hấp dẫn vì nó giúp các công ty tìm kiếm tăng chỉ số kinh doanh của họ. Là một nhà nghiên cứu, người nghiên cứu hệ thống tìm kiếm và đề xuất, Tôi và các đồng nghiệp của tôi cho thấy rằng sự kết hợp nguy hiểm này giữa động cơ lợi nhuận của công ty và tính nhạy cảm của cá nhân làm cho vấn đề khó sửa chữa.

Kết quả tìm kiếm sai như thế nào

Khi bạn nhấp vào một kết quả tìm kiếm, thuật toán tìm kiếm sẽ biết rằng liên kết bạn nhấp vào có liên quan đến truy vấn tìm kiếm của bạn hay không. Đây được gọi là phản hồi về mức độ liên quan. Phản hồi này giúp công cụ tìm kiếm đưa ra trọng số cao hơn cho liên kết đó cho truy vấn đó trong tương lai. Nếu có đủ người nhấp vào liên kết đó đủ lần, do đó đưa ra phản hồi về mức độ liên quan mạnh mẽ, trang web đó sẽ bắt đầu xuất hiện cao hơn trong kết quả tìm kiếm cho trang web đó và các truy vấn có liên quan.


đồ họa đăng ký nội tâm


Mọi người nhiều khả năng nhấp vào các liên kết hiển thị cao hơn trên danh sách kết quả tìm kiếm. Điều này tạo ra một vòng phản hồi tích cực - một trang web hiển thị càng cao thì càng có nhiều nhấp chuột và điều đó làm cho trang web đó tăng cao hơn hoặc giữ vị trí đó cao hơn. Các kỹ thuật tối ưu hóa công cụ tìm kiếm sử dụng kiến ​​thức này để tăng khả năng hiển thị của các trang web.

Có hai khía cạnh đối với vấn đề thông tin sai lệch này: cách đánh giá thuật toán tìm kiếm và cách con người phản ứng với các tiêu đề, tiêu đề và đoạn trích. Công cụ tìm kiếm, giống như hầu hết các dịch vụ trực tuyến, được đánh giá bằng cách sử dụng một loạt các số liệu, một trong số đó là mức độ tương tác của người dùng. Lợi ích tốt nhất của các công ty công cụ tìm kiếm là cung cấp cho bạn những thứ mà bạn muốn đọc, xem hoặc chỉ cần nhấp vào. Do đó, khi một công cụ tìm kiếm hoặc bất kỳ hệ thống đề xuất nào tạo danh sách các mục để trình bày, nó sẽ tính toán khả năng bạn sẽ nhấp vào các mục đó.

Theo truyền thống, điều này nhằm mục đích đưa ra những thông tin phù hợp nhất. Tuy nhiên, khái niệm về mức độ liên quan đã trở nên mờ nhạt vì mọi người đã sử dụng tìm kiếm để tìm kết quả tìm kiếm giải trí cũng như thông tin thực sự có liên quan.

Hãy tưởng tượng bạn đang tìm kiếm một bộ chỉnh đàn piano. Nếu ai đó cho bạn xem một đoạn video về một con mèo đang chơi đàn piano, bạn có nhấp vào nó không? Nhiều người sẽ thích, ngay cả khi điều đó không liên quan gì đến việc điều chỉnh piano. Dịch vụ tìm kiếm cảm thấy được xác thực với phản hồi tích cực về mức độ liên quan và biết rằng việc hiển thị một con mèo chơi piano khi mọi người tìm kiếm bộ chỉnh piano là điều hoàn toàn phù hợp.

Trên thực tế, nó thậm chí còn tốt hơn việc hiển thị các kết quả có liên quan trong nhiều trường hợp. Mọi người thích xem các video vui nhộn về mèo và hệ thống tìm kiếm nhận được nhiều nhấp chuột và tương tác của người dùng hơn.

Điều này có vẻ vô hại. Vì vậy, điều gì sẽ xảy ra nếu mọi người thỉnh thoảng bị phân tâm và nhấp vào các kết quả không liên quan đến truy vấn tìm kiếm? Vấn đề là mọi người bị thu hút bởi những hình ảnh thú vị và những tiêu đề giật gân. Họ có xu hướng nhấp vào các thuyết âm mưu và tin tức giật gân, không chỉ mèo chơi piano, và làm như vậy nhiều hơn là nhấp vào tin tức thực sự hoặc thông tin liên quan.

Người nhện giả nhưng nổi tiếng

Vào năm 2018, các tìm kiếm cho "loài nhện chết người mới" tăng vọt trên Google sau một bài đăng trên Facebook tuyên bố một con nhện chết chóc mới đã giết chết một số người ở nhiều bang. Các đồng nghiệp của tôi và tôi đã phân tích 100 kết quả hàng đầu từ tìm kiếm của Google cho “con nhện chết chóc mới” trong tuần đầu tiên của truy vấn thịnh hành này.

Đó không chỉ là một vấn đề về truyền thông xã hội - Cách các công cụ tìm kiếm lan truyền thông tin sai lệchHai trang đầu tiên trong kết quả tìm kiếm của Google cho 'con nhện chết chóc mới' vào tháng 2018 năm XNUMX (khu vực bóng mờ) có liên quan đến bài đăng tin tức giả mạo ban đầu về chủ đề đó, không tiết lộ hoặc thông tin thực tế. Chirag Shah, CC BY-NĐ

Hóa ra câu chuyện này là giả, nhưng những người tìm kiếm nó phần lớn đã tiếp xúc với thông tin sai lệch liên quan đến bài đăng giả mạo ban đầu. Khi mọi người tiếp tục nhấp vào và chia sẻ thông tin sai lệch đó, Google tiếp tục cung cấp các trang đó ở đầu kết quả tìm kiếm.

Kiểu câu chuyện ly kỳ và chưa được xác minh này đang nổi lên và mọi người nhấp vào chúng tiếp tục, với những người dường như không quan tâm đến sự thật hoặc tin rằng nếu một dịch vụ đáng tin cậy như Google Tìm kiếm đang hiển thị những câu chuyện này cho họ thì những câu chuyện đó phải là sự thật. Gần đây hơn, một báo cáo bác bỏ tuyên bố Trung Quốc đã để cho virus coronavirus rò rỉ từ một phòng thí nghiệm đã thu hút được sức hút trên các công cụ tìm kiếm vì vòng luẩn quẩn này.

Phát hiện thông tin sai lệch

Để kiểm tra mức độ phân biệt của mọi người giữa thông tin chính xác và thông tin sai lệch, chúng tôi đã thiết kế một trò chơi đơn giản có tên là “Google hay không. ” Trò chơi trực tuyến này hiển thị hai bộ kết quả cho cùng một truy vấn. Mục tiêu rất đơn giản - chọn tập hợp đáng tin cậy, đáng tin cậy hoặc phù hợp nhất.

Đó không chỉ là một vấn đề về truyền thông xã hội - Cách các công cụ tìm kiếm lan truyền thông tin sai lệchTrong các thử nghiệm, khoảng một nửa thời gian mọi người không thể phân biệt được sự khác biệt giữa kết quả tìm kiếm của Google chứa thông tin sai lệch và những kết quả chỉ có kết quả đáng tin cậy. Chirag Shah, CC BY-NĐ

Một trong hai bộ này có một hoặc hai kết quả hoặc được xác minh và dán nhãn là thông tin sai lệch hoặc một câu chuyện bị lật tẩy. Chúng tôi đã cung cấp trò chơi công khai và quảng cáo thông qua các kênh truyền thông xã hội khác nhau. Nhìn chung, chúng tôi đã thu thập được 2,100 câu trả lời từ hơn 30 quốc gia.

Khi chúng tôi phân tích kết quả, chúng tôi thấy rằng khoảng một nửa thời gian mọi người chọn nhầm là tập hợp đáng tin cậy với một hoặc hai kết quả thông tin sai lệch. Thử nghiệm của chúng tôi với hàng trăm người dùng khác qua nhiều lần lặp lại đã dẫn đến những phát hiện tương tự. Nói cách khác, khoảng một nửa thời gian mọi người chọn các kết quả có chứa thuyết âm mưu và tin tức giả mạo. Khi nhiều người chọn những kết quả không chính xác và gây hiểu lầm này, các công cụ tìm kiếm sẽ biết rằng đó là những gì mọi người muốn.

Đặt câu hỏi về quy định của Công nghệ lớn và tự điều chỉnh sang một bên, điều quan trọng là mọi người phải hiểu cách các hệ thống này hoạt động và cách họ kiếm tiền. Nếu không, các nền kinh tế thị trường và khuynh hướng tự nhiên của con người bị thu hút bởi các liên kết bắt mắt sẽ khiến vòng luẩn quẩn tiếp diễn.

Giới thiệu về Tác giả

Chirag Shah, Phó Giáo sư Khoa học Thông tin, Đại học Washington

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.