nói dối trực tuyến 6 29

Có ba điều bạn có thể chắc chắn trong cuộc sống: cái chết, thuế - và dối trá. Điều thứ hai chắc chắn dường như đã được đưa ra bởi cuộc trưng cầu dân ý Brexit gần đây của Vương quốc Anh, với một con số của Rời khỏi chiến dịch cam kết tìm kiếm nhiều hơn Lượt thích bánh nướng hơn sự thật vững chắc.

Nhưng từ quảng cáo trên internet, đơn xin thị thực và bài báo học thuật đến blog chính trị, yêu cầu bảo hiểm và hồ sơ hẹn hò, có vô số nơi chúng ta có thể nói dối kỹ thuật số. Vì vậy, làm thế nào một người có thể đi về phát hiện các sợi trực tuyến? Chà, Stephan Ludwig từ Đại học Westminster, Ko de Ruyter từ Trường Kinh doanh Cass của Đại học Thành phố Luân Đôn, Mike Friedman của Đại học Công giáo Louvain, và bạn thực sự đã phát triển một máy phát hiện nói dối kỹ thuật số - và nó có thể phát hiện ra toàn bộ mạng internet không đúng sự thật .

Trong nghiên cứu mới của chúng tôi, chúng tôi đã sử dụng các tín hiệu ngôn ngữ để so sánh hàng chục ngàn email được xác định trước là dối trá với những người được biết là trung thực. Và từ so sánh này, chúng tôi đã phát triển một thuật toán phân tích văn bản có thể phát hiện sự lừa dối. Nó hoạt động trên ba cấp độ.

KHAI THÁC. Sử dụng từ

Tìm kiếm từ khóa có thể là một cách tiếp cận hợp lý khi xử lý một lượng lớn dữ liệu kỹ thuật số. Vì vậy, trước tiên chúng tôi phát hiện ra sự khác biệt trong cách sử dụng từ giữa hai bộ tài liệu. Những khác biệt này xác định văn bản có khả năng chứa một lời nói dối. Chúng tôi thấy rằng những người nói dối thường sử dụng ít đại từ nhân xưng, chẳng hạn như tôi, bạn và anh ấy / cô ấy và nhiều tính từ hơn, chẳng hạn như thông minh, không sợ hãi và cao siêu. Họ cũng sử dụng ít đại từ số ít ngôi thứ nhất, chẳng hạn như tôi, tôi, của tôi, với các từ không nhất quán, như có thể, cũng như, cũng như nhiều đại từ nhân xưng thứ hai (bạn, của bạn) với các từ thành tích (kiếm, anh hùng , thắng lợi).

Ít đại từ nhân xưng cho thấy nỗ lực phân tách bản thân khỏi lời nói của một tác giả, trong khi sử dụng nhiều tính từ hơn là một nỗ lực để đánh lạc hướng khỏi lời nói dối thông qua một loạt các mô tả thừa. Ít đại từ số ít ngôi thứ nhất kết hợp với các từ không nhất quán cho thấy sự thiếu tinh tế và hình ảnh bản thân tích cực, trong khi nhiều đại từ ngôi thứ hai kết hợp với các từ thành tích cho thấy nỗ lực tâng bốc người nhận. Do đó, chúng tôi bao gồm các kết hợp các thuật ngữ tìm kiếm trong thuật toán của chúng tôi.


đồ họa đăng ký nội tâm


KHAI THÁC. Rà soát cấu trúc

Một phần khác của giải pháp nằm trong việc phân tích phương sai của các từ quá trình nhận thức, chẳng hạn như nguyên nhân, bởi vì, biết và nên - và chúng tôi đã xác định mối quan hệ giữa các từ cấu trúc và lời nói dối.

Những kẻ nói dối không thể tạo email lừa đảo từ bộ nhớ thực tế để chúng tránh sự tự phát để trốn tránh sự phát hiện. Điều đó không có nghĩa là những người nói dối sử dụng nhiều từ quá trình nhận thức hơn so với những người đang nói sự thật, nhưng họ bao gồm những từ này một cách nhất quán hơn. Ví dụ, họ có xu hướng kết nối mọi câu với câu tiếp theo - chúng tôi biết điều này xảy ra vì điều này, bởi vì điều này nên là trường hợp khắc phục. Thuật toán của chúng tôi phát hiện việc sử dụng các từ quá trình như vậy trong giao tiếp.

KHAI THÁC. Cách tiếp cận qua email

Chúng tôi cũng nghiên cứu những cách mà người gửi email thay đổi phong cách ngôn ngữ của họ trong khi trao đổi một số email với người khác. Phần này của nghiên cứu đã tiết lộ rằng khi trao đổi diễn ra, người gửi càng có xu hướng sử dụng các từ chức năng mà người nhận đang sử dụng.

Các từ chức năng là các từ đóng góp vào cú pháp hoặc cấu trúc, thay vì nghĩa của câu - ví dụ: an, am, to. Và người gửi đã sửa đổi phong cách ngôn ngữ của tin nhắn của họ để phù hợp với phong cách của người nhận. Kết quả là, thuật toán của chúng tôi xác định và thu thập kết hợp như vậy.

Ứng dụng thú vị

Các cơ quan giám sát người tiêu dùng có thể sử dụng công nghệ này để gán điểm số có thể nói dối về các quảng cáo có tính chất đáng ngờ. Các công ty bảo mật và lực lượng biên giới quốc gia có thể sử dụng thuật toán để đánh giá các tài liệu, chẳng hạn như đơn xin thị thực và thẻ hạ cánh, để giám sát tốt hơn việc tuân thủ các quy tắc và quy tắc truy cập và nhập cảnh. Thư ký của ủy ban kiểm tra giáo dục đại học và biên tập viên của các tạp chí học thuật có thể cải thiện các công cụ kiểm chứng của họ để tự động kiểm tra luận văn của sinh viên và các bài báo học thuật cho đạo văn.

Trong thực tế, các ứng dụng tiềm năng đi và về. Các blog chính trị có thể theo dõi thành công các tương tác trên phương tiện truyền thông xã hội của họ để tìm sự bất thường về văn bản, trong khi các trang web hẹn hò và đánh giá có thể phân loại các tin nhắn được gửi bởi người dùng trên cơ sở điểm số của họ có thể nói dối. Các công ty bảo hiểm có thể sử dụng tốt hơn thời gian và nguồn lực của họ để kiểm toán yêu cầu bồi thường. Kế toán, cố vấn thuế và chuyên gia pháp y có thể điều tra báo cáo tài chính và khiếu nại thuế và tìm súng hút thuốc thông qua thuật toán của chúng tôi.

Con người thật đáng kinh ngạc khi phát hiện ra sự lừa dối có ý thức. Thật, độ chính xác của con người khi phát hiện ra lời nói dối chỉ là 54%, hầu như không tốt hơn cơ hội. Trong khi đó, máy phát hiện nói dối kỹ thuật số của chúng tôi là 70% chính xác. Nó có thể được sử dụng để chống gian lận bất cứ khi nào nó xuất hiện trong nội dung trên máy vi tính và khi công nghệ phát triển, các cảnh báo Pinocchio của nó có thể hoàn toàn tự động và độ chính xác của nó sẽ còn tăng hơn nữa. Giống như mũi của Pinocchio theo phản xạ báo hiệu sự giả dối, máy dò nói dối kỹ thuật số của chúng tôi cũng vậy. Xơ coi chừng.

Giới thiệu về Tác giả

ConversationTom van Laer, Giảng viên cao cấp về Marketing, City University London

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách liên quan

at Thị trường InnerSelf và Amazon