Daboost / Shutterstock

Với sa thải gần đây và tuyển dụng lại nhanh chóng của Sam Altman bởi OpenAI, các cuộc tranh luận xung quanh việc phát triển và sử dụng trí tuệ nhân tạo (AI) một lần nữa lại được chú ý. Điều bất thường hơn nữa là chủ đề nổi bật trong việc đưa tin trên các phương tiện truyền thông là khả năng Hệ thống AI để làm toán.

Rõ ràng, một số biến cố tại OpenAI có liên quan đến việc công ty phát triển một hệ thống mới. Thuật toán AI có tên Q*. Hệ thống này được coi là một bước tiến đáng kể và một trong những tính năng nổi bật của nó là khả năng suy luận về mặt toán học.

Nhưng chẳng phải toán học là nền tảng của AI sao? Làm sao một hệ thống AI lại có thể gặp rắc rối với khả năng suy luận toán học, khi máy tính và máy tính bỏ túi có thể thực hiện các nhiệm vụ toán học?

AI không phải là một thực thể duy nhất. Đó là sự chắp vá của các chiến lược thực hiện tính toán mà không cần sự hướng dẫn trực tiếp của con người. Như chúng ta sẽ thấy, một số hệ thống AI có năng lực toán học.

Tuy nhiên, một trong những công nghệ quan trọng nhất hiện nay, các mô hình ngôn ngữ lớn (LLM) đằng sau các chatbot AI như ChatGPT, cho đến nay vẫn gặp khó khăn trong việc mô phỏng lý luận toán học. Điều này là do chúng được thiết kế để tập trung vào ngôn ngữ.


đồ họa đăng ký nội tâm


Nếu thuật toán Q* mới của công ty có thể giải quyết được các vấn đề toán học chưa từng thấy thì điều đó có thể sẽ xảy ra. là một bước đột phá đáng kể. Toán học là một hình thức suy luận cổ xưa của con người mô hình ngôn ngữ lớn (LLM) cho đến nay vẫn phải vật lộn để bắt chước. LLM là công nghệ làm nền tảng cho các hệ thống như ChatGPT của OpenAI.

Tại thời điểm viết bài, chi tiết về thuật toán Q* và khả năng của nó còn hạn chế nhưng rất hấp dẫn. Vì vậy, có nhiều điều cần cân nhắc trước khi coi Q* là một thành công.

Ví dụ: toán học là môn học mà mọi người tham gia ở các mức độ khác nhau và trình độ toán học mà Q* thành thạo vẫn chưa rõ ràng. Tuy nhiên, đã có công trình học thuật được xuất bản sử dụng các dạng AI thay thế để nâng cao toán học ở cấp độ nghiên cứu (trong đó có một số do chính tôi viếtvà một bài được viết bởi một nhóm các nhà toán học cộng tác với các nhà nghiên cứu tại Google DeepMind).

Những hệ thống AI này có thể được mô tả là có năng lực về toán học. Tuy nhiên, có khả năng Q* không được sử dụng để hỗ trợ các học giả trong công việc của họ mà được dùng cho mục đích khác.

Tuy nhiên, ngay cả khi Q* không có khả năng vượt qua các ranh giới của nghiên cứu tiên tiến, thì rất có thể có một số ý nghĩa được tìm thấy trong cách nó được xây dựng và có thể nâng cao những cơ hội hấp dẫn cho sự phát triển trong tương lai.

Ngày càng thoải mái

Với tư cách là một xã hội, chúng ta ngày càng cảm thấy thoải mái hơn khi sử dụng AI chuyên dụng để giải quyết các loại vấn đề đã xác định trước. Ví dụ, trợ lý kỹ thuật số, nhận dạng khuôn mặthệ thống khuyến nghị trực tuyến sẽ quen thuộc với hầu hết mọi người. Điều còn khó nắm bắt là cái gọi là “trí tuệ tổng hợp nhân tạo” (AGI) có khả năng suy luận rộng có thể so sánh với con người.

Toán học là kỹ năng cơ bản mà chúng tôi mong muốn dạy cho mọi học sinh và chắc chắn sẽ đủ tiêu chuẩn trở thành một cột mốc cơ bản trong quá trình tìm kiếm AGI. Vậy các hệ thống AI có năng lực về mặt toán học sẽ giúp ích như thế nào cho xã hội?

Tư duy toán học có liên quan đến vô số ứng dụng, chẳng hạn như mã hóa và kỹ thuật, và vì vậy lý luận toán học là một kỹ năng quan trọng có thể chuyển đổi cho cả trí tuệ con người và trí tuệ nhân tạo. Một điều trớ trêu là AI ở cấp độ cơ bản lại dựa trên toán học.

Ví dụ: nhiều kỹ thuật được thực hiện bởi thuật toán AI cuối cùng được rút gọn thành một lĩnh vực toán học được gọi là đại số ma trận. Ma trận đơn giản là một lưới các số, trong đó hình ảnh kỹ thuật số là một ví dụ quen thuộc. Mỗi pixel là không có gì hơn ngoài dữ liệu số.

Các mô hình ngôn ngữ lớn cũng mang tính toán học. Dựa trên một mẫu văn bản khổng lồ, máy có thể học xác suất của các từ có có nhiều khả năng làm theo lời nhắc (hoặc câu hỏi) từ người dùng tới chatbot. Nếu bạn muốn một LLM được đào tạo trước để chuyên về một chủ đề cụ thể thì nó có thể được điều chỉnh dựa trên tài liệu toán học hoặc bất kỳ lĩnh vực học tập nào khác. LLM có thể tạo ra văn bản đọc như thể nó hiểu được toán học.

Thật không may, làm như vậy sẽ tạo ra một LLM giỏi lừa gạt nhưng lại kém chi tiết. Vấn đề là một phát biểu toán học, theo định nghĩa, là một phát biểu có thể được gán một giá trị Boolean rõ ràng (tức là đúng hoặc sai). Lý luận toán học là sự suy diễn logic các phát biểu toán học mới từ những phát biểu đã được thiết lập trước đó.

Người bào chữa cho quỷ dữ

Đương nhiên, bất kỳ cách tiếp cận lý luận toán học nào dựa trên xác suất ngôn ngữ đều sẽ đi chệch khỏi làn đường của nó. Một cách để giải quyết vấn đề này có thể là kết hợp một số hệ thống xác minh chính thức vào kiến ​​trúc (chính xác là cách xây dựng LLM), hệ thống này liên tục kiểm tra logic đằng sau những bước nhảy vọt do mô hình ngôn ngữ lớn thực hiện.

Manh mối cho thấy điều này đã được thực hiện có thể nằm ở cái tên Q*, có thể ám chỉ một cách chính đáng đến một thuật toán được phát triển từ những năm 1970 giúp ích cho việc suy luận suy diễn. Ngoài ra, Q* có thể đề cập đến Q-learning, trong đó một mô hình có thể cải thiện theo thời gian bằng cách kiểm tra và khen thưởng những kết luận đúng.

Tuy nhiên, vẫn tồn tại một số thách thức trong việc xây dựng các AI có khả năng tính toán. Ví dụ, một số phép toán thú vị nhất bao gồm các sự kiện rất khó xảy ra. Có nhiều tình huống mà người ta có thể nghĩ rằng một mẫu tồn tại dựa trên những con số nhỏ, nhưng nó bất ngờ bị phá vỡ khi người ta kiểm tra đủ trường hợp. Khả năng này khó có thể tích hợp vào máy.

Một thách thức khác có thể gây ngạc nhiên: nghiên cứu toán học có thể mang tính sáng tạo cao. Nó phải như vậy, bởi vì những người thực hiện cần phải phát minh ra những khái niệm mới nhưng vẫn gắn bó với quy tắc chính thức của một chủ đề cổ xưa.

Bất kỳ phương pháp AI nào được đào tạo chỉ để tìm ra các mô hình toán học có sẵn có lẽ không bao giờ có thể tạo ra toán học thực sự mới. Với mối liên hệ giữa toán học và công nghệ, điều này dường như ngăn cản quan niệm về các cuộc cách mạng công nghệ mới.

Nhưng chúng ta hãy chơi trò bào chữa của quỷ một lát và tưởng tượng xem liệu AI có thực sự có thể tạo ra toán học mới hay không. Lập luận chống lại điều này trước đây có một sai sót, ở chỗ cũng có thể nói rằng những nhà toán học giỏi nhất của con người cũng được đào tạo riêng về toán học có sẵn. Các mô hình ngôn ngữ lớn đã làm chúng ta ngạc nhiên trước đây và sẽ làm như vậy một lần nữa.Conversation

Tom Oliver, Giảng viên, Khoa học và Kỹ thuật Máy tính, Đại học Westminster

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.