Suỵt, họ đang lắng nghe - Bên trong cuộc cách mạng cấu hình giọng nói sắp tới
Các công ty có thể sớm điều chỉnh những gì họ cố gắng bán cho bạn dựa trên tâm trạng được truyền tải bởi âm thanh giọng nói của bạn.
CSA-Printstock qua Getty Images

Bạn quyết định gọi đến một cửa hàng bán một số giày đi bộ đường dài mà bạn đang nghĩ đến để mua. Khi bạn quay số, máy tính của một công ty trí tuệ nhân tạo được cửa hàng thuê sẽ được kích hoạt. Nó truy xuất phân tích của nó về phong cách nói mà bạn đã sử dụng khi bạn gọi điện cho các công ty khác về dịch vụ của công ty phần mềm. Máy tính đã kết luận bạn là "thân thiện và nói nhiều."

Sử dụng định tuyến dự đoán, nó kết nối bạn với một đại lý dịch vụ khách hàng mà nghiên cứu của công ty đã xác định là đặc biệt giỏi trong việc thu hút những khách hàng thân thiện và hay nói mua các phiên bản đắt tiền hơn của hàng hóa mà họ đang cân nhắc.

Tình huống giả định này nghe như thể nó đến từ một tương lai xa xôi nào đó. Nhưng các hoạt động tiếp thị có hướng dẫn bằng giọng nói tự động như thế này đang xảy ra mọi lúc.

Nếu bạn nghe thấy “Cuộc gọi này đang được ghi lại để đào tạo và kiểm soát chất lượng” thì đó không chỉ là đại diện dịch vụ khách hàng mà họ đang theo dõi.


đồ họa đăng ký nội tâm


Nó cũng có thể là bạn.

Khi tiến hành nghiên cứu cho cuốn sách sắp xuất bản của tôi, “The Voice Catchers: Cách các nhà tiếp thị lắng nghe để khai thác cảm xúc, quyền riêng tư của bạn và ví của bạn, ”Tôi đã xem qua hơn 1,000 tạp chí thương mại và tin tức về các công ty có liên quan đến các hình thức hồ sơ bằng giọng nói khác nhau. Tôi đã xem xét hàng trăm trang luật của Hoa Kỳ và EU áp dụng cho giám sát sinh trắc học. Tôi đã phân tích hàng chục bằng sáng chế. Và bởi vì có rất nhiều điều về ngành công nghiệp này đang phát triển, tôi đã nói chuyện với 43 người đang làm việc để định hình nó.

Tôi nhanh chóng nhận ra rằng chúng ta đang ở giai đoạn đầu của cuộc cách mạng lập hồ sơ bằng giọng nói mà các công ty coi là không thể thiếu đối với tương lai của tiếp thị.

Nhờ sự đón nhận của công chúng đối với loa thông minh, màn hình ô tô thông minh và điện thoại phản hồi bằng giọng nói - cùng với sự gia tăng của trí thông minh giọng nói trong các trung tâm cuộc gọi - các nhà tiếp thị cho biết họ đang trên đà có thể sử dụng công nghệ phân tích giọng nói do AI hỗ trợ để đạt được thành tựu chưa từng có. thông tin chi tiết về danh tính và khuynh hướng của người mua sắm. Khi làm như vậy, họ tin rằng họ sẽ có thể tránh được các lỗi và gian lận liên quan đến quảng cáo nhắm mục tiêu truyền thống.

Mọi người không chỉ có thể được mô tả bằng cách nói của họ, mà còn có thể được đánh giá qua âm thanh của giọng nói của họ - điều này, theo một số nhà nghiên cứu, là duy nhất và có thể tiết lộ cảm xúc, tính cách và thậm chí cả đặc điểm cơ thể của họ.

Flaws trong quảng cáo được nhắm mục tiêu

Các giám đốc điều hành tiếp thị hàng đầu mà tôi đã phỏng vấn nói rằng họ mong đợi các tương tác với khách hàng của họ sẽ bao gồm việc lập hồ sơ bằng giọng nói trong vòng một thập kỷ hoặc lâu hơn.

Một phần của điều thu hút họ đến với công nghệ mới này là niềm tin rằng hệ thống kỹ thuật số hiện tại đang tạo hồ sơ khách hàng độc đáo - và sau đó nhắm mục tiêu họ bằng các thông điệp, ưu đãi và quảng cáo được cá nhân hóa - có nhược điểm lớn.

Một nỗi lo âm ỉ giữa các nhà quảng cáo internet, một cái đã bùng nổ trong những năm 2010, đó là dữ liệu khách hàng thường không được cập nhật, hồ sơ có thể dựa trên nhiều người dùng một thiết bị, tên có thể bị nhầm lẫn và mọi người nói dối.

Các nhà quảng cáo cũng không thoải mái về chặn quảng cáonhấp chuột gian lận, điều này xảy ra khi một trang web hoặc ứng dụng sử dụng bot hoặc công nhân được trả lương thấp để nhấp vào quảng cáo được đặt ở đó để nhà quảng cáo phải trả tiền.

Đây là tất cả những rào cản để hiểu người mua hàng cá nhân.

Mặt khác, phân tích giọng nói được coi là một giải pháp khiến mọi người gần như không thể che giấu cảm xúc hoặc trốn tránh danh tính của mình.

Xây dựng cơ sở hạ tầng

Hầu hết các hoạt động trong hồ sơ giọng nói đang diễn ra tại các trung tâm hỗ trợ khách hàng, những trung tâm này phần lớn không được công chúng quan tâm.

Nhưng cũng có hàng trăm triệu của Amazon Echoes, Google Nests và các loa thông minh khác hiện có. Điện thoại thông minh cũng chứa công nghệ như vậy.

Tất cả đều đang lắng nghe và nắm bắt tiếng nói riêng của mọi người. Họ đáp ứng yêu cầu của bạn. Nhưng các trợ lý cũng gắn liền với học máy nâng cao và các chương trình mạng nơ-ron sâu phân tích những gì bạn nói và cách bạn nói nó

Các trung tâm cuộc gọi có thể sử dụng công nghệ thoại có sự hỗ trợ của AI để xác định xem có bán thêm cho một số khách hàng nhất định hay không.Các trung tâm cuộc gọi có thể sử dụng công nghệ thoại có sự hỗ trợ của AI để xác định xem có bán thêm cho một số khách hàng nhất định hay không. Ralf Hiemisch qua Getty Images

Amazon và Google - những nhà cung cấp loa thông minh hàng đầu bên ngoài Trung Quốc - dường như đang thực hiện rất ít phân tích giọng nói trên các thiết bị đó ngoài khả năng nhận biết và phản hồi của từng chủ sở hữu. Có lẽ họ sợ rằng việc đẩy công nghệ đi quá xa vào thời điểm này sẽ dẫn đến những dư luận không tốt.

Tuy nhiên, các thỏa thuận người dùng của Amazon và Google - cũng như Pandora, Bank of America và các công ty khác mà mọi người truy cập thường xuyên qua ứng dụng điện thoại - cho họ quyền sử dụng trợ lý kỹ thuật số của mình hiểu bạn theo cách bạn phát âm.

Ứng dụng công khai nhất của Amazon về cấu hình giọng nói cho đến nay là thiết bị đeo tay Halo, trong đó tuyên bố biết cảm xúc bạn đang truyền tải khi bạn nói chuyện với người thân, bạn bè và nhà tuyển dụng. Công ty đảm bảo với khách hàng rằng họ không sử dụng dữ liệu Halo cho các mục đích riêng của mình. Nhưng nó rõ ràng là một bằng chứng về khái niệm - và một cái gật đầu hướng tới tương lai.

Bằng sáng chế hướng tới tương lai

Các bằng sáng chế từ các công ty công nghệ này đưa ra tầm nhìn về những gì sắp tới.

Trong một bằng sáng chế của Amazon, một thiết bị có trợ lý Alexa sẽ phát hiện những bất thường trong giọng nói của phụ nữ ngụ ý cảm lạnh thông qua việc sử dụng “phân tích cao độ, nhịp đập, giọng nói, tiếng nói lắp bắp và / hoặc độ hài hòa của giọng nói của người dùng, được xác định từ việc xử lý dữ liệu giọng nói”. Từ kết luận đó, Alexa hỏi liệu người phụ nữ có muốn một công thức nấu súp gà hay không. Khi cô ấy nói không, họ sẽ bán thuốc ho cho cô ấy với thời gian giao hàng trong một giờ.

Một bằng sáng chế khác của Amazon đề xuất một ứng dụng giúp nhân viên bán hàng của cửa hàng giải mã giọng nói của người mua hàng để ngăn chặn phản ứng vô thức đối với sản phẩm. Sự tranh cãi là cách mọi người nghe được cho là hoạt động tốt hơn cho thấy mọi người thích gì hơn là lời nói của họ.

Và một trong những phát minh độc quyền của Google liên quan đến việc theo dõi các thành viên trong gia đình trong thời gian thực bằng cách sử dụng các micrô đặc biệt được đặt trong nhà. Dựa trên độ cao của chữ ký giọng nói, hệ thống mạch của Google cung cấp thông tin về giới tính và độ tuổi - ví dụ: một nam giới trưởng thành và một trẻ em nữ - và gắn thẻ chúng là các cá thể riêng biệt.

Bằng sáng chế của công ty khẳng định rằng theo thời gian, “người quản lý chính sách hộ gia đình” của hệ thống sẽ có thể so sánh các mô hình cuộc sống, chẳng hạn như thời gian và thời gian các thành viên trong gia đình ăn các bữa ăn, thời gian trẻ em xem tivi và khi nào các thiết bị trò chơi điện tử hoạt động - và sau đó có hệ thống đề xuất lịch ăn uống tốt hơn cho trẻ em hoặc đề nghị kiểm soát việc xem TV và chơi trò chơi của chúng.

Giám sát quyến rũ

Ở phương Tây, con đường dẫn đến tương lai quảng cáo này bắt đầu với việc các công ty khuyến khích người dùng cho phép họ thu thập dữ liệu thoại. Các công ty giành được sự cho phép của khách hàng bằng cách dụ họ mua các công nghệ thoại rẻ tiền.

Khi các công ty công nghệ phát triển hơn nữa phần mềm phân tích giọng nói - và mọi người ngày càng phụ thuộc vào các thiết bị thoại - tôi hy vọng các công ty sẽ bắt đầu lập hồ sơ và tiếp thị rộng rãi dựa trên dữ liệu giọng nói. Nếu không phải là tinh thần của bất kỳ luật bảo mật nào tồn tại, tôi mong đợi các công ty sẽ tiến lên trước những hóa thân mới của họ, ngay cả khi hầu hết người dùng của họ đã tham gia trước khi mô hình kinh doanh mới này tồn tại.

Mồi và công tắc cổ điển này đã đánh dấu sự nổi lên của cả Google và Facebook. Chỉ khi số lượng người đổ xô vào các trang web này đủ lớn để thu hút các nhà quảng cáo trả tiền cao thì mô hình kinh doanh của họ mới củng cố xung quanh việc bán quảng cáo được cá nhân hóa cho những gì Google và Facebook biết về người dùng của họ.

Đến lúc đó, các trang web đã trở thành một phần quan trọng trong hoạt động hàng ngày của người dùng đến mức mọi người cảm thấy họ không thể rời khỏi, bất chấp mối quan tâm của họ về việc thu thập và phân tích dữ liệu mà họ không hiểu và không thể kiểm soát.

Chiến lược này đã bắt đầu triển khai khi hàng chục triệu người tiêu dùng mua Amazon Echoes với giá quà tặng.

Mặt tối của cấu hình giọng nói

Đây là bí quyết: Không rõ cấu hình giọng nói chính xác đến mức nào, đặc biệt là khi nói đến cảm xúc.

Đúng rồi, theo Carnegie Mellon, học giả nhận dạng giọng nói Rita Singh, rằng hoạt động của dây thần kinh thanh âm của bạn được kết nối với trạng thái cảm xúc của bạn. Tuy nhiên, Singh nói với tôi rằng cô ấy lo lắng rằng với sự sẵn có dễ dàng của các gói học máy, những người có kỹ năng hạn chế sẽ bị cám dỗ để chạy các phân tích kém chất lượng về giọng nói của mọi người, dẫn đến kết luận không rõ ràng như các phương pháp.

Cô cũng lập luận rằng những suy luận liên kết sinh lý học với cảm xúc và các dạng căng thẳng có thể bị sai lệch về mặt văn hóa và dễ bị sai sót. Mối quan tâm đó không ngăn cản các nhà tiếp thị, những người thường sử dụng cấu hình giọng nói để đưa ra kết luận về cảm xúc, thái độ và tính cách của từng cá nhân.

Trong khi một số tiến bộ này hứa sẽ làm cho cuộc sống dễ dàng hơn, không khó để thấy công nghệ giọng nói có thể bị lạm dụng và khai thác như thế nào. Điều gì sẽ xảy ra nếu hồ sơ bằng giọng nói nói với một nhà tuyển dụng tiềm năng rằng bạn là một rủi ro xấu cho một công việc mà bạn khao khát hoặc rất cần? Điều gì sẽ xảy ra nếu nó cho ngân hàng biết rằng bạn đang gặp rủi ro xấu đối với khoản vay? Điều gì sẽ xảy ra nếu một nhà hàng quyết định sẽ không nhận đặt chỗ của bạn vì bạn nghe có vẻ đẳng cấp thấp hoặc quá khắt khe?

Cũng hãy xem xét sự phân biệt đối xử có thể xảy ra nếu những người lập hồ sơ bằng giọng nói theo một số tuyên bố của các nhà khoa học rằng có thể sử dụng giọng nói của một cá nhân để cho biết chiều cao, cân nặng, chủng tộc, giới tính và sức khỏe của người đó.

Mọi người đã phải chịu các đề nghị và cơ hội khác nhau dựa trên thông tin cá nhân mà các công ty đã thu thập. Cấu hình giọng nói thêm một phương tiện ghi nhãn đặc biệt xảo quyệt. Ngày nay, một số tiểu bang như Illinois và Texas yêu cầu các công ty phải xin phép trước khi tiến hành phân tích giọng nói, khuôn mặt hoặc các đặc điểm sinh trắc học khác.

Nhưng các tiểu bang khác mong muốn mọi người nhận thức được thông tin được thu thập về họ từ các chính sách bảo mật hoặc điều khoản dịch vụ - có nghĩa là họ hiếm khi. Và chính phủ liên bang đã không ban hành luật giám sát tiếp thị sâu rộng.

Với việc áp dụng rộng rãi công nghệ phân tích giọng nói, điều quan trọng là các nhà lãnh đạo chính phủ phải áp dụng các chính sách và quy định để bảo vệ thông tin cá nhân được tiết lộ bằng âm thanh giọng nói của một người.

Một đề xuất: Trong khi việc sử dụng xác thực giọng nói - hoặc sử dụng giọng nói của một người để chứng minh danh tính của họ - có thể được cho phép trong một số trường hợp được quản lý cẩn thận, tất cả các cấu hình giọng nói nên bị cấm trong các tương tác của nhà tiếp thị với các cá nhân. Lệnh cấm này cũng nên áp dụng cho các chiến dịch chính trị và các hoạt động của chính phủ mà không có lệnh.

Đó có vẻ như là cách tốt nhất để đảm bảo rằng kỷ nguyên sắp tới của cấu hình giọng nói bị hạn chế trước khi nó trở nên quá hòa nhập vào cuộc sống hàng ngày và quá phổ biến để kiểm soát.Conversation

Giới thiệu về Tác giả

Joseph Turow, Robert Lewis Shayon Giáo sư về Hệ thống & Công nghiệp Truyền thông, Đại học Pennsylvania

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.