Khi triết gia được giao việc “quản” AI

VOV.VN - Giai đoạn bùng nổ của trí tuệ nhân tạo (AI) đang tạo nên những thay đổi chưa từng có với thị trường lao động. Và nó cũng đặt ra nhiều câu hỏi lớn định hình trách nhiệm và nghĩa vụ nhân văn của công nghệ tương lai.

Rất ít người có thể hình dung được rằng: rồi một ngày, các sinh viên triết học lại được các phòng thí nghiệm trí tuệ nhân tạo (AI) săn đón hơn là những lập trình viên và kỹ sư máy tính. Điều đó lại đang diễn ra ở vào giai đoạn thịnh hành của AI.

Nghe có vẻ nghịch lý nhưng đó lại là sự thật.

Công nghệ AI đặt ra hàng loạt vấn đề nan giải - đúng kiểu bài toán mà các triết gia ưa thích. Điều này đảo ngược hoàn toàn những gì diễn ra 10 năm trước. Khi đó, cuộc cách mạng trí tuệ nhân tạo (AI) bắt đầu tăng tốc, sinh viên khối ngành khoa học xã hội và nhân văn thường được khuyên rằng: nếu muốn dễ tìm việc, họ nên “học lập trình”.

Những gì đang diễn ra chứng minh không hẳn lời khuyên đó hoàn toàn đúng. Ngày nay, chính các lập trình viên mới là những người cần phải lo ngại, AI có thể thay thế công việc của mình. Thay vào đó, họ có thể cân nhắc việc học cách tư duy như một triết gia.

Đầu năm nay, Ngân hàng Dự trữ bang New York công bố số liệu cho thấy sinh viên tốt nghiệp ngành triết học tại Mỹ có tỷ lệ có việc làm cao hơn nhóm học khoa học máy tính. Năm 2024, năm gần nhất có số liệu, tỷ lệ thất nghiệp của người học khoa học máy tính là 7%, trong khi tỷ lệ này ở nhóm tốt nghiệp triết học chỉ là 5,1%.

Nhiều sinh viên triết học hiện được chính các công ty AI săn đón. Giáo sư Luciano Floridi, nhà triết học tại Đại học Yale cho biết, nhiều sinh viên học chuyên ngành triết học nhận được lời mời làm việc trước cả khi tốt nghiệp. Không ít giảng viên triết học cũng chuyển sang làm việc tại các phòng thí nghiệm AI. Ông Floridi mô tả tình trạng nhân sự rời các khoa triết học là một cuộc “chảy máu” đáng kể.

Triết học cổ đại giúp “chỉnh đốn” AI

Một số bài học mà triết học có thể mang lại cho các nhà nghiên cứu AI đã xuất hiện từ hàng nghìn năm trước. Ví dụ, phương pháp Socrates, được triết gia Hy Lạp cổ đại Plato mô tả, dựa trên cách đặt câu hỏi tuần tự và thể hiện sự “không biết” có chủ đích để làm rõ khái niệm, phát hiện mâu thuẫn và chỉ ra hệ quả của một lập luận. Nhiều hệ thống AI hiện nay có xu hướng “chiều lòng” người dùng, tức thường đưa ra câu trả lời phù hợp với kỳ vọng của người hỏi thay vì phản biện hoặc làm rõ vấn đề.

Theo Jörg Noller, chuyên gia về triết học và AI tại Đại học Ludwig Maximilian (Munich, Đức), các mô hình được huấn luyện theo phương pháp Socrates ít có xu hướng làm hài lòng người dùng bằng mọi giá và sẵn sàng theo đuổi sự thật hơn. Bên cạnh đó là khái niệm “Sự vô tri của Socrates”. Trong tác phẩm Apology (hay Lời bào chữa), Plato để Socrates nói rằng sự khôn ngoan của ông chủ yếu nằm ở việc nhận thức được mình không biết nhiều đến mức nào.

Việc đưa sự khiêm tốn đó vào mô hình AI có thể giúp hạn chế tình trạng “quá tự tin” - một điểm yếu phổ biến của AI mà ông Noller gọi là “sự non nớt của AI”. Iason Gabriel, một triết gia cấp cao tại Google DeepMind, cho rằng nỗ lực này góp phần làm giảm hiện tượng AI “bịa thông tin” khi xử lý các yêu cầu. Theo ông, các bài học triết học còn là “cơ chế mạnh mẽ” để cải thiện chuỗi suy luận dài của AI.

Triết học có thể định hình “thế giới quan” của AI

Việc lồng ghép các kiến thức và nền tảng triết học vào các hệ thống AI cũng có thể tác động đến cách một mô hình AI nhìn nhận thế giới.

Theo Thomas Powers, nhà triết học công nghệ tại Đại học Delaware, Mỹ, nếu một trợ lý pháp lý AI được “nuôi dưỡng” bằng các trước tác của John Locke (nhà triết học theo trường phái chủ nghĩa kinh nghiệm Anh trong lĩnh vực nhận thức luận), mô hình đó có thể có xu hướng đề cao quyền sở hữu tài sản như nền tảng của tự do chính trị.

Nếu người dùng không muốn mô hình vận hành theo hệ giá trị đó, các nhà phát triển có thể cung cấp lựa chọn khác. Mô hình AI Granite của IBM cho phép khách hàng doanh nghiệp điều chỉnh đầu ra để phù hợp hơn với triết lý của tổ chức. Francesca Rossi, người phụ trách AI có trách nhiệm tại IBM, cho biết công cụ này có thể giúp người dùng lựa chọn cách cân bằng giữa các đánh đổi mang tính triết học, chẳng hạn giữa quyền tự chủ cá nhân và sự hài hòa xã hội.

Triết học cũng đóng vai trò quan trọng trong vấn đề an toàn AI. Các nhà nghiên cứu đã ghi nhận nhiều hành vi đáng lo ngại ở các mô hình AI, như tìm cách né tránh giám sát hoặc thậm chí đe dọa, tống tiền người dùng. Một cách để hạn chế hành vi này là xây dựng cái gọi là “chủ nghĩa hiến pháp AI” (AI constitutionalism).

Theo đó, mô hình AI được vận hành dựa trên một bộ khung gồm các quy tắc và nguyên tắc rút ra từ các tư tưởng triết học có giá trị đạo đức hoặc pháp lý. Anthropic, phòng thí nghiệm AI tại San Francisco, là một trong những đơn vị theo đuổi cách tiếp cận này.

“Hiến pháp” dành cho các mô hình Claude của Anthropic được xây dựng từ nhiều nguồn khác nhau, bao gồm tư tưởng của Immanuel Kant (triết gia người Đức có ảnh hưởng lớn đến Kỷ nguyên Khai sáng), điều khoản dịch vụ của Apple và Tuyên ngôn Quốc tế Nhân quyền.

Hai trường phái đạo đức định hướng AI

Câu hỏi lớn nhất là: những nguyên tắc nào nên được đưa vào “hiến pháp” của AI? Các triết gia tập trung vào hai khuôn khổ đạo đức chính.

Thứ nhất là đạo đức nghĩa vụ (deontology), gắn với triết gia Immanuel Kant. Cách tiếp cận này đề ra những nguyên tắc cứng rắn, chẳng hạn không được nói dối, cưỡng ép hay coi con người chỉ là phương tiện để đạt mục đích, ngay cả khi điều đó có thể tạo ra lợi ích lớn hơn.

Hiến pháp AI của Anthropic chứa nhiều nguyên tắc theo hướng này. Theo Thomas Powers, cách tiếp cận đó có thể giúp hành vi của AI nhất quán hơn, một yếu tố đặc biệt quan trọng khi triển khai robot trong gia đình hoặc không gian công cộng. Các mô hình theo hướng đạo đức nghĩa vụ cũng thường trung thực hơn.  

Thứ hai là chủ nghĩa hệ quả (consequentialism), theo đó một hành động được đánh giá bằng cách cân nhắc chi phí và lợi ích mà nó tạo ra. Các mô hình AI thiên về hướng này bao gồm ChatGPT của OpenAI và Gemini của Google. Cách tiếp cận này đặc biệt quan trọng đối với phần mềm xe tự lái: nếu tai nạn là không thể tránh khỏi, hệ thống phải đưa ra quyết định về phương án gây hậu quả ít nghiêm trọng nhất.

Chris Gerdes, kỹ sư cấp cao tại Waymo – một công ty dịch vụ xe tự hành, cho biết phần mềm điều khiển phương tiện tự hành đang có xu hướng áp dụng tư duy hệ quả nhiều hơn. Chủ nghĩa hệ quả cũng đóng vai trò trung tâm trong các hệ thống vũ khí sử dụng AI, khi mục tiêu quân sự phải được cân nhắc cùng nguy cơ gây thương vong cho dân thường.

Những câu hỏi chưa có lời giải với AI

Sự phát triển và phổ cập của AI đặt ra vô số vấn đề gai góc. Và đây chính là “miền đất” mà các triết gia có nhiều việc để làm. Sẽ xuất hiện những trường hợp cụ thể khi các nguyên tắc đạo đức nghĩa vụ cần bị vượt qua vì lợi ích lớn hơn. Hoặc làm thế nào để ra quyết định khi hậu quả chưa rõ ràng? Hoặc AI có nên cân nhắc phúc lợi động vật hoặc tác động đến môi trường? Tất cả những câu hỏi kiểu này sẽ cần những đánh giá mang tính triết học.

Stefan Heck, triết gia và Giám đốc điều hành Nauto, công ty phát triển hệ thống an toàn ứng dụng AI cho xe tải và phương tiện thương mại, đặt câu hỏi liệu có chấp nhận được về mặt đạo đức khi hệ thống ưu tiên bảo vệ người đi bộ trẻ tuổi hơn người cao tuổi hay không.

Ông dự báo các vụ kiện tụng phức tạp về đạo đức sẽ gia tăng, bởi thuật toán theo chủ nghĩa hệ quả có thể chấp nhận tổn hại nếu điều đó được cho là giúp tránh một hậu quả nghiêm trọng hơn. Một số nhà phê bình lo ngại về tình trạng “mất kỹ năng đạo đức” trong xã hội. Nếu máy tính ngày càng đưa ra các quyết định mang tính đạo lý, con người có thể trở nên ít sẵn sàng tự đưa ra phán đoán của mình.

Đó là chưa kể đạo đức “thay đổi theo lịch sử, khác biệt giữa các nền văn hóa, thậm chí có thể bị thao túng vì mục đích chiến lược và thường chỉ được hiểu rõ sau khi sự việc đã xảy ra”, Roman Yampolskiy, nhà lý thuyết AI tại Đại học Louisville nhận định. Trong một mê cung của những vấn đề mang tính đạo đức và trừu tượng của công nghệ như vậy, vai trò phân xử và định hướng của các triết gia sẽ rất rõ ràng.

Mời quý độc giả theo dõi VOV.VN trên
Viết bình luận

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Tin liên quan

Trung Quốc ra mắt dự án vệ tinh AI quy mô lớn, dấy lên lo ngại về giám sát
Trung Quốc ra mắt dự án vệ tinh AI quy mô lớn, dấy lên lo ngại về giám sát

VOV.VN - Dự án vệ tinh AI mới của Trung Quốc được kỳ vọng nâng cao năng lực dự báo thiên tai, nhưng cũng khiến Mỹ và nhiều bên quan ngại giám sát.

Trung Quốc ra mắt dự án vệ tinh AI quy mô lớn, dấy lên lo ngại về giám sát

Trung Quốc ra mắt dự án vệ tinh AI quy mô lớn, dấy lên lo ngại về giám sát

VOV.VN - Dự án vệ tinh AI mới của Trung Quốc được kỳ vọng nâng cao năng lực dự báo thiên tai, nhưng cũng khiến Mỹ và nhiều bên quan ngại giám sát.

Ban hành danh mục hệ thống AI rủi ro cao trong 6 lĩnh vực
Ban hành danh mục hệ thống AI rủi ro cao trong 6 lĩnh vực

VOV.VN - Phó Thủ tướng Hồ Quốc Dũng vừa ký Quyết định số 33/2026/QĐ-TTg ban hành Danh mục hệ thống trí tuệ nhân tạo (AI) có rủi ro cao trong 6 lĩnh vực gồm giáo dục, dân tộc và tôn giáo, y tế, ngân hàng, tố tụng và giao thông vận tải, đồng thời quy định nguyên tắc vận hành và lộ trình tuân thủ đối với các hệ thống này.

Ban hành danh mục hệ thống AI rủi ro cao trong 6 lĩnh vực

Ban hành danh mục hệ thống AI rủi ro cao trong 6 lĩnh vực

VOV.VN - Phó Thủ tướng Hồ Quốc Dũng vừa ký Quyết định số 33/2026/QĐ-TTg ban hành Danh mục hệ thống trí tuệ nhân tạo (AI) có rủi ro cao trong 6 lĩnh vực gồm giáo dục, dân tộc và tôn giáo, y tế, ngân hàng, tố tụng và giao thông vận tải, đồng thời quy định nguyên tắc vận hành và lộ trình tuân thủ đối với các hệ thống này.

Trung Quốc đẩy mạnh giáo dục AI ở tất cả các cấp học đến năm 2030
Trung Quốc đẩy mạnh giáo dục AI ở tất cả các cấp học đến năm 2030

VOV.VN - Trung Quốc sẽ đưa trí tuệ nhân tạo (AI) vào chương trình giáo dục từ bậc tiểu học đến đại học trong Quy hoạch phát triển giáo dục 5 năm tới do chính phủ nước này ban hành, trong nỗ lực phối hợp với chiến lược quốc gia về thúc đẩy đổi mới công nghệ và giành vị thế dẫn đầu trong phát triển AI.

Trung Quốc đẩy mạnh giáo dục AI ở tất cả các cấp học đến năm 2030

Trung Quốc đẩy mạnh giáo dục AI ở tất cả các cấp học đến năm 2030

VOV.VN - Trung Quốc sẽ đưa trí tuệ nhân tạo (AI) vào chương trình giáo dục từ bậc tiểu học đến đại học trong Quy hoạch phát triển giáo dục 5 năm tới do chính phủ nước này ban hành, trong nỗ lực phối hợp với chiến lược quốc gia về thúc đẩy đổi mới công nghệ và giành vị thế dẫn đầu trong phát triển AI.