bài kiểm tra turing và ai 10 17

Pexels/Google Deepmind, CC BY-SA

Năm 1950, nhà khoa học máy tính người Anh Alan Turing đã đề xuất một phương pháp thử nghiệm để trả lời câu hỏi: máy móc có thể suy nghĩ được không? Ông gợi ý rằng nếu con người không thể biết liệu họ đang nói chuyện với một cỗ máy thông minh nhân tạo (AI) hay một con người khác sau XNUMX phút đặt câu hỏi, thì điều này chứng tỏ AI có trí thông minh giống con người.

Mặc dù các hệ thống AI vẫn còn lâu mới vượt qua được bài kiểm tra của Turing trong suốt cuộc đời của ông, nhưng ông đã suy đoán rằng

“[…] trong khoảng năm mươi năm nữa, máy tính sẽ có thể lập trình […] để khiến chúng chơi trò chơi bắt chước giỏi đến mức một người thẩm vấn trung bình sẽ không có hơn 70% cơ hội nhận dạng đúng sau năm phút đang tra hỏi.

Ngày nay, hơn 70 năm sau đề xuất của Turing, không có AI nào vượt qua được bài kiểm tra thành công bằng cách đáp ứng các điều kiện cụ thể mà ông đã vạch ra. Tuy nhiên, như một số tiêu đề phản ánh, một vài hệ thống đã đến khá gần.

Một thử nghiệm gần đây đã thử nghiệm ba mô hình ngôn ngữ lớn, bao gồm GPT-4 (công nghệ AI đằng sau ChatGPT). Những người tham gia đã dành hai phút để trò chuyện với người khác hoặc hệ thống AI. AI được nhắc mắc một số lỗi chính tả nhỏ – và bỏ cuộc nếu người thử nghiệm trở nên quá hung hăng.


đồ họa đăng ký nội tâm


Với lời nhắc nhở này, AI đã làm rất tốt việc đánh lừa những người thử nghiệm. Khi kết hợp với bot AI, người thử nghiệm chỉ có thể đoán chính xác liệu họ có đang nói chuyện với hệ thống AI hay không trong 60% thời gian.

Với tiến bộ nhanh chóng đạt được trong việc thiết kế hệ thống xử lý ngôn ngữ tự nhiên, chúng ta có thể thấy AI vượt qua bài kiểm tra ban đầu của Turing trong vòng vài năm tới.

Nhưng liệu việc bắt chước con người có thực sự là một bài kiểm tra trí thông minh hiệu quả? Và nếu không, chúng ta có thể sử dụng một số tiêu chuẩn thay thế nào để đo lường khả năng của AI?

Hạn chế của bài kiểm tra Turing

Trong khi một hệ thống vượt qua bài kiểm tra Turing cho chúng ta một số Bằng chứng là nó thông minh, bài kiểm tra này không phải là bài kiểm tra quyết định về trí thông minh. Một vấn đề là nó có thể tạo ra "âm tính giả".

Các mô hình ngôn ngữ lớn ngày nay thường được thiết kế để tuyên bố ngay rằng họ không phải là con người. Ví dụ: khi bạn hỏi ChatGPT một câu hỏi, ChatGPT thường mở đầu câu trả lời bằng cụm từ “như một mô hình ngôn ngữ AI”. Ngay cả khi hệ thống AI có khả năng cơ bản để vượt qua bài kiểm tra Turing, kiểu lập trình này sẽ lấn át khả năng đó.

Thử nghiệm cũng có nguy cơ xảy ra một số loại "dương tính giả". Như triết gia Ned Block chỉ ra trong một bài báo năm 1981, một hệ thống có thể vượt qua bài kiểm tra Turing một cách đơn giản bằng cách được mã hóa cứng với phản hồi giống như con người đối với bất kỳ đầu vào nào có thể có.

Ngoài ra, bài kiểm tra Turing đặc biệt tập trung vào nhận thức của con người. Nếu nhận thức của AI khác với nhận thức của con người, một chuyên gia thẩm vấn sẽ có thể tìm ra một số nhiệm vụ mà AI và con người có hiệu suất khác nhau.

Về vấn đề này, Turing đã viết:

Sự phản đối này là một phản đối rất mạnh mẽ, nhưng ít nhất chúng ta có thể nói rằng nếu, tuy nhiên, một cỗ máy có thể được chế tạo để chơi trò chơi bắt chước một cách thỏa đáng thì chúng ta không cần phải gặp rắc rối với sự phản đối này.

Nói cách khác, mặc dù việc vượt qua bài kiểm tra Turing là bằng chứng tốt cho thấy hệ thống thông minh nhưng thất bại không phải là bằng chứng tốt cho thấy hệ thống đó thông minh. không thông minh.

Hơn nữa, bài kiểm tra không phải là thước đo tốt để đánh giá xem AI có ý thức hay không, liệu chúng có thể cảm nhận được nỗi đau và niềm vui hay liệu chúng có ý nghĩa đạo đức hay không. Theo nhiều nhà khoa học nhận thức, ý thức liên quan đến một nhóm khả năng tinh thần cụ thể, bao gồm trí nhớ làm việc, suy nghĩ bậc cao và khả năng nhận thức môi trường của một người và mô hình hóa cách cơ thể của một người di chuyển xung quanh nó.

Bài kiểm tra Turing không trả lời câu hỏi liệu hệ thống AI có có những khả năng này.

Khả năng ngày càng tăng của AI

Bài kiểm tra Turing dựa trên một logic nhất định. Đó là: con người rất thông minh, vì vậy bất cứ thứ gì có thể bắt chước con người một cách hiệu quả đều có khả năng thông minh.

Nhưng ý tưởng này không cho chúng ta biết điều gì về bản chất của trí thông minh. Một cách khác để đo lường trí thông minh của AI liên quan đến việc suy nghĩ chín chắn hơn về trí thông minh là gì.

Hiện tại không có bài kiểm tra nào có thể đo lường chính xác trí thông minh nhân tạo hoặc con người.

Ở mức độ rộng nhất, chúng ta có thể coi trí thông minh là có khả năng để đạt được nhiều mục tiêu trong các môi trường khác nhau. Các hệ thống thông minh hơn là những hệ thống có thể đạt được nhiều mục tiêu hơn trong nhiều môi trường hơn.

Do đó, cách tốt nhất để theo dõi những tiến bộ trong thiết kế hệ thống AI có mục đích chung là đánh giá hiệu suất của chúng qua nhiều nhiệm vụ khác nhau. Các nhà nghiên cứu về máy học đã phát triển một loạt tiêu chuẩn thực hiện điều này.

Ví dụ: GPT-4 đã có thể trả lời đúng 86% câu hỏi về khả năng hiểu ngôn ngữ đa nhiệm ở quy mô lớn – một điểm chuẩn đo lường hiệu suất trong các bài kiểm tra trắc nghiệm ở nhiều môn học ở cấp đại học.

Nó cũng ghi điểm thuận lợi trong Đại lýBench, một công cụ có thể đo lường khả năng hoạt động như một tác nhân của mô hình ngôn ngữ lớn, chẳng hạn như duyệt web, mua sản phẩm trực tuyến và cạnh tranh trong trò chơi.

Bài kiểm tra Turing có còn phù hợp không?

Bài kiểm tra Turing là thước đo bắt chước – khả năng của AI trong việc mô phỏng hành vi của con người. Các mô hình ngôn ngữ lớn là những kẻ bắt chước chuyên nghiệp, điều này hiện đang được phản ánh qua khả năng vượt qua bài kiểm tra Turing của chúng. Nhưng trí thông minh không giống như sự bắt chước.

Có nhiều loại trí thông minh cũng như có nhiều mục tiêu cần đạt được. Cách tốt nhất để hiểu trí thông minh của AI là theo dõi tiến trình phát triển một loạt các khả năng quan trọng của nó.

Đồng thời, điều quan trọng là chúng ta không tiếp tục “thay đổi mục tiêu” khi đặt ra câu hỏi liệu AI có thông minh hay không. Vì khả năng của AI đang được cải thiện nhanh chóng nên những người chỉ trích ý tưởng về trí thông minh AI liên tục tìm ra những nhiệm vụ mới mà hệ thống AI có thể gặp khó khăn để hoàn thành – để rồi nhận ra rằng chúng đã vượt qua một trở ngại khác nữa.

Trong bối cảnh này, câu hỏi liên quan không phải là liệu hệ thống AI có thông minh hay không - mà chính xác hơn là cái gì các loại trí thông minh mà họ có thể có.Conversation

Simon Goldstein, Phó Giáo sư, Viện Triết học Dianoia, Đại học Công giáo Úc, Australian Catholic UniversityCameron Domenico Kirk-Giannini, Trợ lý Giáo sư Triết học, Đại học Rutgers

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.