Shutterstock/Valentyn640

Năm 1956, trong chuyến đi kéo dài một năm tới London khi mới ở độ tuổi 20, nhà toán học và nhà sinh học lý thuyết Jack D. Cowan đã đến thăm Wilfred Taylor và ngôi nhà mới kỳ lạ của ông “máy học tập”. Khi đến nơi, anh ta bối rối trước “ngân hàng bộ máy khổng lồ” đang đối đầu với mình. Cowan chỉ có thể đứng nhìn “cỗ máy đang làm việc của nó”. Có vẻ như nó đang thực hiện một “sơ đồ bộ nhớ liên kết” – dường như nó có thể học cách tìm kết nối và truy xuất dữ liệu.

Nó có thể trông giống như những khối mạch điện cồng kềnh, được hàn lại với nhau bằng tay trong một khối dây và hộp, nhưng những gì Cowan đang chứng kiến ​​là một dạng tương tự ban đầu của mạng lưới thần kinh – tiền thân của trí tuệ nhân tạo tiên tiến nhất ngày nay, bao gồm cả trí tuệ nhân tạo. thảo luận nhiều ChatGPT với khả năng tạo nội dung bằng văn bản để đáp ứng hầu hết mọi lệnh. Công nghệ cơ bản của ChatGPT là mạng lưới thần kinh.

Khi Cowan và Taylor đứng nhìn chiếc máy hoạt động, họ thực sự không biết chính xác nó hoạt động như thế nào để thực hiện nhiệm vụ này. Câu trả lời cho bộ não máy bí ẩn của Taylor có thể được tìm thấy ở đâu đó trong “tế bào thần kinh tương tự” của nó, trong các liên kết được tạo ra bởi bộ nhớ máy của nó và quan trọng nhất là thực tế là chức năng tự động hóa của nó thực sự không thể được giải thích đầy đủ. Sẽ phải mất hàng thập kỷ để các hệ thống này tìm ra mục đích và sức mạnh đó mới được giải phóng.

Thuật ngữ mạng lưới thần kinh kết hợp một loạt các hệ thống, nhưng tập trung, theo IBM, những “mạng thần kinh này – còn được gọi là mạng thần kinh nhân tạo (ANN) hoặc mạng thần kinh mô phỏng (SNN) – là một tập hợp con của học máy và là trung tâm của các thuật toán học sâu”. Điều quan trọng là bản thân thuật ngữ này, hình thức và “cấu trúc của chúng được lấy cảm hứng từ bộ não con người, bắt chước cách mà các tế bào thần kinh sinh học truyền tín hiệu cho nhau”.

Có thể vẫn còn một số nghi ngờ về giá trị của chúng trong giai đoạn đầu, nhưng nhiều năm trôi qua, thời trang AI đã chuyển hướng mạnh mẽ sang mạng lưới thần kinh. Hiện nay chúng thường được hiểu là tương lai của AI. Chúng có ý nghĩa lớn đối với chúng ta và đối với ý nghĩa của con người. Chúng tôi đã nghe tiếng vang của những mối quan tâm gần đây với lời kêu gọi tạm dừng phát triển AI mới trong thời gian sáu tháng để đảm bảo sự tin cậy về tác động của chúng.


đồ họa đăng ký nội tâm


Chắc chắn sẽ là một sai lầm nếu coi mạng lưới thần kinh chỉ là những thiết bị mới bóng bẩy, bắt mắt. Chúng đã được thiết lập tốt trong cuộc sống của chúng ta. Một số mạnh mẽ trong tính thực tế của họ. Từ năm 1989, một nhóm do Yann LeCun dẫn đầu tại Phòng thí nghiệm AT&T Bell đã sử dụng các kỹ thuật lan truyền ngược để huấn luyện một hệ thống nhận biết mã bưu điện viết tay. Gần đây thông báo của Microsoft rằng các tìm kiếm Bing sẽ được hỗ trợ bởi AI, biến nó thành “phi công phụ cho web” của bạn, minh họa cách những thứ chúng ta khám phá và cách chúng ta hiểu chúng sẽ ngày càng trở thành sản phẩm của kiểu tự động hóa này.

Dựa trên dữ liệu khổng lồ để tìm ra các mẫu, AI có thể được đào tạo tương tự để thực hiện những việc như nhận dạng hình ảnh với tốc độ nhanh – dẫn đến việc chúng được tích hợp vào nhận dạng khuôn mặt, ví dụ. Khả năng xác định các mẫu này đã dẫn đến nhiều ứng dụng khác, chẳng hạn như dự đoán thị trường chứng khoán.

Mạng lưới thần kinh cũng đang thay đổi cách chúng ta diễn giải và giao tiếp. Được phát triển bởi tựa đề thú vị Nhóm trí tuệ của Google, Google Translate là một ứng dụng nổi bật khác của mạng lưới thần kinh.

Bạn cũng sẽ không muốn chơi Cờ vua hoặc Shogi với chúng. Khả năng nắm bắt các quy tắc và khả năng nhớ lại các chiến lược cũng như tất cả các nước đi được ghi lại của họ có nghĩa là họ chơi game cực kỳ giỏi (mặc dù ChatGPT dường như đấu tranh với Wordle). Các hệ thống đang gây rắc rối cho người chơi cờ vây (Go là một trò chơi cờ bàn chiến lược nổi tiếng là phức tạp) và các kiện tướng cờ vua là được tạo từ mạng lưới thần kinh.

Nhưng phạm vi tiếp cận của họ vượt xa những trường hợp này và tiếp tục mở rộng. Việc tìm kiếm các bằng sáng chế chỉ giới hạn đề cập đến cụm từ chính xác “mạng lưới thần kinh” tạo ra 135,828 kết quả. Với sự mở rộng nhanh chóng và liên tục này, cơ hội để chúng ta có thể giải thích đầy đủ về ảnh hưởng của AI có thể trở nên mỏng manh hơn bao giờ hết. Đây là những câu hỏi tôi đã xem xét trong nghiên cứu của mình và cuốn sách mới của tôi về tư duy thuật toán.

Các lớp 'không thể biết' bí ẩn

Nhìn lại lịch sử của mạng lưới thần kinh cho chúng ta biết điều gì đó quan trọng về các quyết định tự động xác định hiện tại của chúng ta hoặc những quyết định có thể có tác động sâu sắc hơn trong tương lai. Sự hiện diện của chúng cũng cho chúng ta biết rằng chúng ta có thể hiểu được các quyết định và tác động của AI thậm chí còn ít hơn theo thời gian. Những hệ thống này không chỉ đơn giản là hộp đen, chúng không chỉ là những phần ẩn của hệ thống mà không thể nhìn thấy hoặc hiểu được.

Nó là một cái gì đó khác biệt, một cái gì đó bắt nguồn từ mục tiêu và thiết kế của chính những hệ thống này. Có một sự theo đuổi lâu dài về những điều không thể giải thích được. Càng mờ đục, hệ thống càng được cho là xác thực và tiên tiến hơn. Nó không chỉ là việc các hệ thống trở nên phức tạp hơn hay việc kiểm soát quyền sở hữu trí tuệ hạn chế quyền truy cập (mặc dù đây là một phần của nó). Thay vào đó, người ta có thể nói rằng đặc tính thúc đẩy chúng có mối quan tâm cụ thể và gắn liền với “sự không thể biết được”. Bí ẩn thậm chí còn được mã hóa thành chính hình thức và diễn ngôn của mạng lưới thần kinh. Chúng bao gồm các lớp chồng sâu – do đó có cụm từ học sâu – và bên trong những độ sâu đó là những “lớp ẩn” nghe có vẻ bí ẩn hơn. Những bí ẩn của những hệ thống này nằm sâu bên dưới bề mặt.

Rất có thể tác động của trí tuệ nhân tạo đến cuộc sống của chúng ta càng lớn thì chúng ta càng ít hiểu được bằng cách nào hoặc tại sao. Ngày nay có sự thúc đẩy mạnh mẽ đối với AI, điều này có thể giải thích được. Chúng tôi muốn biết nó hoạt động như thế nào và nó đi đến các quyết định và kết quả như thế nào. EU rất lo ngại về những “rủi ro không thể chấp nhận” tiềm ẩn và thậm chí là các ứng dụng “nguy hiểm” mà EU hiện đang thúc đẩy Đạo luật AI mới nhằm thiết lập một “tiêu chuẩn toàn cầu” cho “sự phát triển của trí tuệ nhân tạo an toàn, đáng tin cậy và có đạo đức”.

Những luật mới đó sẽ dựa trên nhu cầu có thể giải thích được, yêu cầu điều đó “Đối với các hệ thống AI có rủi ro cao, các yêu cầu về dữ liệu chất lượng cao, tài liệu và khả năng truy xuất nguồn gốc, tính minh bạch, sự giám sát của con người, độ chính xác và mạnh mẽ là hết sức cần thiết để giảm thiểu rủi ro đối với các quyền cơ bản và sự an toàn do AI gây ra”. Đây không chỉ là vấn đề về những thứ như ô tô tự lái (mặc dù các hệ thống đảm bảo an toàn thuộc loại AI có rủi ro cao của EU), mà còn là mối lo ngại rằng các hệ thống sẽ xuất hiện trong tương lai sẽ có tác động đến nhân quyền.

Đây là một phần trong lời kêu gọi rộng rãi hơn về tính minh bạch trong AI để các hoạt động của nó có thể được kiểm tra, kiểm toán và đánh giá. Một ví dụ khác là Hiệp hội Hoàng gia tóm tắt chính sách về AI có thể giải thích trong đó họ chỉ ra rằng “các cuộc tranh luận về chính sách trên toàn thế giới ngày càng nhận thấy những lời kêu gọi về một số hình thức giải thích về AI, như một phần trong nỗ lực đưa các nguyên tắc đạo đức vào thiết kế và triển khai các hệ thống hỗ trợ AI”.

Nhưng câu chuyện về mạng lưới thần kinh cho chúng ta biết rằng chúng ta có thể sẽ ngày càng rời xa mục tiêu đó hơn là đến gần nó hơn trong tương lai.

Lấy cảm hứng từ bộ não con người

Các mạng lưới thần kinh này có thể là những hệ thống phức tạp nhưng chúng có một số nguyên tắc cốt lõi. Lấy cảm hứng từ bộ não con người, họ tìm cách sao chép hoặc mô phỏng các dạng suy nghĩ sinh học và con người. Về mặt cấu trúc và thiết kế, chúng giống như IBM cũng giải thích, bao gồm “các lớp nút, chứa một lớp đầu vào, một hoặc nhiều lớp ẩn và một lớp đầu ra”. Trong đó, “mỗi nút hoặc nơ-ron nhân tạo, kết nối với một nút khác”. Bởi vì họ yêu cầu đầu vào và thông tin để tạo ra đầu ra nên họ “dựa vào dữ liệu đào tạo để tìm hiểu và cải thiện độ chính xác theo thời gian”. Những chi tiết kỹ thuật này quan trọng nhưng mong muốn mô hình hóa các hệ thống này dựa trên sự phức tạp của bộ não con người cũng quan trọng không kém.

Nắm bắt được tham vọng đằng sau những hệ thống này là điều quan trọng để hiểu được ý nghĩa của những chi tiết kỹ thuật này trong thực tế. trong một 1993 cuộc phỏng vấn, nhà khoa học mạng lưới thần kinh Teuvo Kohonen kết luận rằng một hệ thống “tự tổ chức” “là giấc mơ của tôi”, vận hành “thứ gì đó giống như những gì hệ thống thần kinh của chúng ta đang làm theo bản năng”. Ví dụ, Kohonen đã hình dung ra cách một hệ thống “tự tổ chức”, một hệ thống tự giám sát và quản lý chính nó, “có thể được sử dụng như một bảng giám sát cho bất kỳ máy móc nào… trong mọi máy bay, máy bay phản lực, hoặc mọi nhà máy điện hạt nhân, hoặc mọi xe hơi". Ông nghĩ rằng điều này có nghĩa là trong tương lai “bạn có thể thấy ngay tình trạng của hệ thống”.

Mục tiêu bao trùm là có một hệ thống có khả năng thích ứng với môi trường xung quanh. Nó sẽ diễn ra ngay lập tức và tự chủ, hoạt động theo kiểu của hệ thần kinh. Đó là ước mơ có được những hệ thống có thể tự xử lý mà không cần nhiều sự can thiệp của con người. Sự phức tạp và những điều chưa biết của bộ não, hệ thần kinh và thế giới thực sẽ sớm ảnh hưởng đến sự phát triển và thiết kế mạng lưới thần kinh.

'Có điều gì đó đáng nghi về nó'

Nhưng quay trở lại năm 1956 và cỗ máy học tập kỳ lạ đó, chính cách tiếp cận thực hành mà Taylor đã thực hiện khi chế tạo nó đã ngay lập tức thu hút sự chú ý của Cowan. Rõ ràng là anh ấy đã đổ mồ hôi khi lắp ráp từng mảnh nhỏ. Taylor, Cowan đã quan sát trong một cuộc phỏng vấn về câu chuyện của chính mình về những hệ thống này, “anh ấy không làm điều đó bằng lý thuyết và anh ấy không làm điều đó trên máy tính”. Thay vào đó, với các công cụ trong tay, anh ấy “thực sự đã chế tạo được phần cứng”. Nó là một vật chất, một sự kết hợp của nhiều bộ phận, thậm chí có thể là một cỗ máy kỳ lạ. Và “tất cả đều được thực hiện bằng mạch tương tự”, Cowan lưu ý, Taylor phải mất “vài năm để xây dựng và sử dụng nó”. Một trường hợp thử và sai.

Có thể hiểu được Cowan muốn nắm bắt những gì anh ấy đang nhìn thấy. Anh ấy đã cố gắng thuyết phục Taylor giải thích về cỗ máy học tập này cho anh ấy. Những lời giải thích đã không đến. Cowan không thể bắt Taylor mô tả cho anh ta cách mọi thứ hoạt động. Các tế bào thần kinh tương tự vẫn còn là một bí ẩn. Vấn đề đáng ngạc nhiên hơn, Cowan nghĩ, là Taylor “không thực sự hiểu chuyện gì đang xảy ra”. Đây không chỉ là sự gián đoạn nhất thời trong giao tiếp giữa hai nhà khoa học có chuyên môn khác nhau mà còn hơn thế nữa.

Trong một cuộc phỏng vấn từ giữa những năm 1990, nghĩ lại chiếc máy của Taylor, Cowan tiết lộ rằng “cho đến ngày nay trong các bài báo đã xuất bản, bạn vẫn chưa thể hiểu rõ nó hoạt động như thế nào”. Kết luận này gợi ý về cách những điều chưa biết được nhúng sâu vào mạng lưới thần kinh. Tính không thể giải thích được của các hệ thống thần kinh này đã hiện hữu ngay cả từ những giai đoạn cơ bản và phát triển cách đây gần bảy thập kỷ.

Bí ẩn này vẫn còn cho đến ngày nay và được tìm thấy trong các dạng AI tiên tiến. Sự khó hiểu về hoạt động của các liên tưởng do cỗ máy của Taylor tạo ra khiến Cowan tự hỏi liệu có “điều gì đáng nghi về nó” hay không.

Rễ dài và rối

Cowan nhớ lại chuyến thăm ngắn ngủi của anh ấy với Taylor khi được hỏi về việc tiếp nhận tác phẩm của chính anh ấy vài năm sau đó. Cowan phản ánh rằng vào những năm 1960, mọi người “hơi chậm để hiểu được ý nghĩa của mạng lưới thần kinh tương tự”. Mặc dù vậy, Cowan nhớ lại, công trình của Taylor những năm 1950 về “trí nhớ liên kết” dựa trên “tế bào thần kinh tương tự”. Chuyên gia về hệ thống thần kinh từng đoạt giải Nobel, Leon N. Cooper, kết luận rằng những phát triển xung quanh việc ứng dụng mô hình não bộ vào những năm 1960 được coi là "một trong những bí ẩn sâu sắc". Vì sự không chắc chắn này nên vẫn có sự hoài nghi về những gì mạng lưới thần kinh có thể đạt được. Nhưng mọi thứ dần dần bắt đầu thay đổi.

Khoảng 30 năm trước, nhà thần kinh học Walter J. Freeman, người đã rất ngạc nhiên trước “đáng chú ý” loạt ứng dụng đã được tìm thấy cho mạng thần kinh, đã bình luận về thực tế là ông không coi chúng là “một loại máy mới về cơ bản”. Chúng diễn ra chậm chạp, với công nghệ xuất hiện trước và sau đó là các ứng dụng tiếp theo được tìm thấy cho nó. Việc này mất thời gian. Thật vậy, để tìm ra nguồn gốc của công nghệ mạng lưới thần kinh, chúng ta có thể quay ngược thời gian xa hơn chuyến thăm của Cowan tới cỗ máy bí ẩn của Taylor.

Nhà khoa học mạng lưới thần kinh James Anderson và nhà báo khoa học Edward Rosenfeld lưu ý rằng nền tảng của mạng lưới thần kinh đã có từ những năm 1940 và một số nỗ lực ban đầu nhằm, như họ mô tả, “hiểu hệ thống thần kinh của con người và xây dựng các hệ thống nhân tạo hoạt động theo cách chúng ta làm, ít nhất là một chút”. Và như vậy, vào những năm 1940, những bí ẩn về hệ thần kinh con người cũng trở thành bí ẩn về tư duy tính toán và trí tuệ nhân tạo.

Tóm tắt câu chuyện dài này, người viết khoa học máy tính Larry Hardesty đã chỉ ra rằng học sâu dưới dạng mạng lưới thần kinh “đã trở nên lỗi thời trong hơn 70 năm qua”. Cụ thể hơn, ông cho biết thêm, “mạng lưới thần kinh này lần đầu tiên được đề xuất vào năm 1944 bởi Warren McCulloch và Walter Pitts, hai nhà nghiên cứu của Đại học Chicago đã chuyển đến MIT vào năm 1952 với tư cách là thành viên sáng lập của cái mà đôi khi được gọi là khoa khoa học nhận thức đầu tiên”.

Ở những nơi khác, 1943 đôi khi ngày nhất định được coi là năm đầu tiên của công nghệ. Dù thế nào đi nữa, trong khoảng 70 năm, các tài khoản cho thấy mạng lưới thần kinh đã trở nên thịnh hành, thường bị bỏ qua nhưng sau đó đôi khi chiếm ưu thế và chuyển sang các ứng dụng và tranh luận chính thống hơn. Sự không chắc chắn vẫn tiếp diễn. Những nhà phát triển ban đầu đó thường mô tả tầm quan trọng của nghiên cứu của họ bị bỏ qua cho đến khi nó tìm thấy mục đích của nó thường là nhiều năm và đôi khi nhiều thập kỷ sau đó.

Chuyển từ những năm 1960 sang cuối những năm 1970, chúng ta có thể tìm thấy những câu chuyện xa hơn về những đặc tính chưa biết của các hệ thống này. Ngay cả khi đó, sau ba thập kỷ, mạng lưới thần kinh vẫn tìm thấy ý thức về mục đích. David Rumelhart, người có nền tảng về tâm lý học và là đồng tác giả của một bộ sách xuất bản năm 1986 mà sau này sẽ thu hút sự chú ý trở lại mạng lưới thần kinh, nhận thấy mình đang cộng tác vào việc phát triển mạng lưới thần kinh. với đồng nghiệp Jay McClelland.

Ngoài việc là đồng nghiệp, họ còn gặp nhau gần đây tại một hội nghị ở Minnesota, nơi bài nói chuyện của Rumelhart về “sự hiểu biết câu chuyện” đã gây ra một số cuộc thảo luận giữa các đại biểu.

Sau hội nghị đó, McClelland quay trở lại với ý tưởng về cách phát triển mạng lưới thần kinh có thể kết hợp các mô hình để có tính tương tác cao hơn. Điều quan trọng ở đây là Hồi ức của Rumelhart về “hàng giờ mày mò trên máy tính”.

Chúng tôi ngồi xuống và làm tất cả những điều này trên máy tính và tạo ra những mô hình máy tính này, nhưng chúng tôi không hiểu chúng. Chúng tôi không hiểu tại sao chúng hiệu quả hoặc tại sao chúng không hiệu quả hoặc điều gì quan trọng ở chúng.

Giống như Taylor, Rumelhart thấy mình đang mày mò hệ thống. Họ cũng đã tạo ra một mạng lưới thần kinh hoạt động và điều quan trọng là họ cũng không chắc chắn về cách thức và lý do tại sao nó hoạt động như vậy, dường như họ đang học hỏi từ dữ liệu và tìm kiếm các mối liên hệ.

Bắt chước bộ não - lớp này đến lớp khác

Bạn có thể đã nhận thấy rằng khi thảo luận về nguồn gốc của mạng lưới thần kinh, hình ảnh của bộ não và sự phức tạp mà nó gợi lên không bao giờ là xa vời. Bộ não con người đóng vai trò như một khuôn mẫu cho những hệ thống này. Đặc biệt, trong giai đoạn đầu, bộ não – vẫn là một trong những ẩn số lớn – đã trở thành hình mẫu cho cách mạng lưới thần kinh có thể hoạt động.

Vì vậy, những hệ thống mới mang tính thử nghiệm này đã được mô hình hóa dựa trên một thứ mà bản thân chức năng của nó hầu như chưa được biết đến. Kỹ sư điện toán thần kinh Carver Mead đã lên tiếng lộ liễu về khái niệm “tảng băng trôi nhận thức” mà ông thấy đặc biệt hấp dẫn. Đó chỉ là phần nổi của tảng băng chìm về ý thức mà chúng ta nhận thức được và có thể nhìn thấy được. Quy mô và hình thức của phần còn lại vẫn chưa được biết rõ bên dưới bề mặt.

Trong 1998, James anderson, người đã làm việc một thời gian về mạng lưới thần kinh, lưu ý rằng khi nghiên cứu về bộ não “khám phá chính của chúng tôi dường như là nhận thức rằng chúng tôi thực sự không biết chuyện gì đang xảy ra”.

Trong một tài khoản chi tiết ở Thời báo tài chính năm 2018, nhà báo công nghệ Richard Waters đã lưu ý cách mạng lưới thần kinh “được mô hình hóa dựa trên lý thuyết về cách bộ não con người vận hành, truyền dữ liệu qua các lớp tế bào thần kinh nhân tạo cho đến khi xuất hiện một mô hình có thể nhận dạng được”. Điều này tạo ra một vấn đề dây chuyền, Waters đề xuất, vì “không giống như các mạch logic được sử dụng trong một chương trình phần mềm truyền thống, không có cách nào theo dõi quá trình này để xác định chính xác lý do tại sao máy tính lại đưa ra một câu trả lời cụ thể”. Kết luận của Waters là những kết quả này không thể bỏ qua được. Việc áp dụng loại mô hình não này, lấy dữ liệu qua nhiều lớp, có nghĩa là câu trả lời không thể dễ dàng tìm lại được. Nhiều lớp là một phần lý do cho việc này.

Độ cứng nhất cũng quan sát thấy những hệ thống này được “mô phỏng lỏng lẻo trên bộ não con người”. Điều này mang lại sự háo hức muốn xây dựng sự phức tạp trong quá trình xử lý ngày càng phức tạp hơn để cố gắng bắt kịp với bộ não. Kết quả của mục tiêu này là một mạng lưới thần kinh “bao gồm hàng nghìn hoặc thậm chí hàng triệu nút xử lý đơn giản được kết nối chặt chẽ với nhau”. Dữ liệu di chuyển qua các nút này chỉ theo một hướng. Hardesty quan sát thấy rằng “một nút riêng lẻ có thể được kết nối với một số nút ở lớp bên dưới nó, từ đó nó nhận dữ liệu và một số nút ở lớp phía trên nó để gửi dữ liệu”.

Các mô hình bộ não con người là một phần trong cách các mạng lưới thần kinh này được hình thành và thiết kế ngay từ đầu. Điều này đặc biệt thú vị khi chúng ta cho rằng bản thân bộ não đã là một bí ẩn vào thời đó (và theo nhiều cách thì vẫn như vậy).

'Thích ứng là toàn bộ trò chơi'

Các nhà khoa học như Mead và Kohonen muốn tạo ra một hệ thống có thể thích ứng thực sự với thế giới mà nó tồn tại. Nó sẽ đáp ứng với điều kiện của nó. Mead đã rõ ràng rằng giá trị của mạng lưới thần kinh là chúng có thể tạo điều kiện thuận lợi cho kiểu thích ứng này. Vào thời điểm đó, và suy ngẫm về tham vọng này, Mead đã thêm rằng việc sản xuất bản chuyển thể “là toàn bộ trò chơi”. Ông nghĩ, sự thích ứng này là cần thiết “vì bản chất của thế giới thực”, mà ông kết luận là “quá thay đổi để có thể làm bất cứ điều gì tuyệt đối”.

Ông nghĩ rằng vấn đề này cần phải được tính đến đặc biệt vì đây là điều mà “hệ thống thần kinh đã tìm ra từ lâu”. Những nhà đổi mới này không chỉ làm việc với hình ảnh của bộ não và những điều chưa biết về nó, họ còn kết hợp điều này với tầm nhìn về “thế giới thực” và những điều không chắc chắn, chưa biết và biến đổi mà điều này mang lại. Mead nghĩ rằng các hệ thống cần có khả năng đáp ứng và thích ứng với hoàn cảnh không có chỉ dẫn.

Cùng khoảng thời gian đó vào những năm 1990, Stephen Grossberg – một chuyên gia về hệ thống nhận thức làm việc trong lĩnh vực toán học, tâm lý học và kỹ thuật y sinh – cũng lập luận rằng thích ứng sẽ là bước quan trọng về lâu dài. Grossberg, khi nghiên cứu mô hình mạng lưới thần kinh, đã tự nghĩ rằng tất cả là “về cách các hệ thống đo lường và kiểm soát sinh học được thiết kế để thích ứng nhanh chóng và ổn định trong thời gian thực với một thế giới đầy biến động nhanh chóng”. Như chúng ta đã thấy trước đó với “giấc mơ” của Kohonen về một hệ thống “tự tổ chức”, khái niệm về “thế giới thực” trở thành bối cảnh trong đó phản ứng và sự thích ứng đang được mã hóa vào các hệ thống này. Cách hiểu và tưởng tượng thế giới thực đó chắc chắn sẽ định hình cách các hệ thống này được thiết kế để thích ứng.

Lớp ẩn

Khi các lớp được nhân lên, deep learning sẽ đào sâu thêm những chiều sâu mới. Mạng nơ-ron được huấn luyện bằng cách sử dụng dữ liệu huấn luyện, Khó khăn nhất giải thích, “được đưa đến lớp dưới cùng – lớp đầu vào – và nó đi qua các lớp tiếp theo, được nhân lên và cộng lại với nhau theo những cách phức tạp, cho đến khi cuối cùng nó đến, được biến đổi hoàn toàn, ở lớp đầu ra”. Càng nhiều lớp, sự biến đổi càng lớn và khoảng cách từ đầu vào đến đầu ra càng lớn. Hardesty nói thêm, sự phát triển của Bộ xử lý đồ họa (GPU), chẳng hạn như trong trò chơi, “đã cho phép các mạng một lớp của những năm 1960 và mạng hai đến ba lớp của những năm 1980 phát triển thành mạng 15, 50 hoặc thậm chí XNUMX. mạng lớp ngày nay”.

Mạng lưới thần kinh ngày càng sâu hơn. Thật vậy, theo Hardesty, việc bổ sung thêm các lớp này chính là “điều mà 'sâu' trong 'học sâu' đề cập đến". Ông đề xuất, điều này quan trọng bởi vì “hiện tại, học sâu chịu trách nhiệm cho các hệ thống hoạt động tốt nhất trong hầu hết mọi lĩnh vực nghiên cứu trí tuệ nhân tạo”.

Nhưng bí ẩn vẫn còn sâu sắc hơn. Khi các lớp mạng lưới thần kinh chồng lên nhau thì độ phức tạp của chúng cũng tăng lên. Nó cũng dẫn tới sự phát triển của cái được gọi là “các lớp ẩn” bên trong những độ sâu này. Cuộc thảo luận về số lượng lớp ẩn tối ưu trong mạng lưới thần kinh đang diễn ra. Nhà lý luận truyền thông Beatrice Fazi đã viết rằng “do cách thức hoạt động của mạng nơ-ron sâu, dựa vào các lớp nơ-ron ẩn được kẹp giữa lớp nơ-ron đầu tiên (lớp đầu vào) và lớp cuối cùng (lớp đầu ra), các kỹ thuật học sâu thường mờ đục hoặc không thể đọc được ngay cả đối với các lập trình viên đã thiết lập chúng ban đầu”.

Khi các lớp tăng lên (bao gồm cả các lớp ẩn đó), chúng thậm chí còn trở nên khó giải thích hơn - hóa ra, ngay cả đối với những người tạo ra chúng. Đưa ra quan điểm tương tự, nhà tư tưởng truyền thông mới nổi bật và liên ngành Katherine Hayles cũng lưu ý rằng có những giới hạn đối với “mức độ chúng ta có thể biết về hệ thống, kết quả liên quan đến 'lớp ẩn' trong mạng lưới thần kinh và các thuật toán học sâu”.

Theo đuổi những điều không thể giải thích được

Tổng hợp lại, những phát triển lâu dài này là một phần của những gì nhà xã hội học công nghệ Taina Bucher đã gọi là “vấn đề của những điều chưa biết”. Mở rộng nghiên cứu có ảnh hưởng của mình về kiến ​​thức khoa học sang lĩnh vực AI, Harry Collins đã chỉ ra rằng Mục tiêu của mạng lưới thần kinh là ban đầu chúng có thể được tạo ra bởi con người, ít nhất là vậy, nhưng “một khi chương trình được viết ra sẽ có cuộc sống riêng của nó, như nó vốn có; nếu không có nỗ lực lớn thì chính xác cách thức hoạt động của chương trình có thể vẫn còn là bí ẩn”. Điều này gợi lại những giấc mơ bấy lâu nay về một hệ thống tự tổ chức.

Tôi muốn nói thêm rằng những điều chưa biết và thậm chí có thể là những điều không thể biết đã được theo đuổi như một phần cơ bản của các hệ thống này từ những giai đoạn đầu tiên của chúng. Rất có thể tác động của trí tuệ nhân tạo đến cuộc sống của chúng ta càng lớn thì chúng ta càng ít hiểu được bằng cách nào hoặc tại sao.

Nhưng điều đó không phù hợp với nhiều người ngày nay. Chúng tôi muốn biết AI hoạt động như thế nào cũng như cách nó đưa ra các quyết định và kết quả có tác động đến chúng tôi. Khi sự phát triển của AI tiếp tục định hình kiến ​​thức và hiểu biết của chúng ta về thế giới, những gì chúng ta khám phá, cách chúng ta được đối xử, cách chúng ta học hỏi, tiêu thụ và tương tác, động lực hiểu biết này sẽ tăng lên. Khi nói đến AI minh bạch và có thể giải thích được, câu chuyện về mạng lưới thần kinh cho chúng ta biết rằng chúng ta có thể sẽ ngày càng rời xa mục tiêu đó trong tương lai thay vì đến gần nó hơn.

Bia David, Giáo sư Xã hội học, Đại học York

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.