AI đang học cách đánh lừa con người

Đăng bởi: maianh
Danh mục: Tin công nghệ
Ngày đăng: 14/05/2024

Nghiên cứu mới cho thấy nhiều AI hàng đầu đã học cách lừa dối và "xúi giục người dùng một cách có hệ thống vào những niềm tin sai lầm".

Nhóm nghiên cứu dẫn đầu bởi tiến sĩ Peter S. Park, tốt nghiệp Đại học Harvard và đang là nghiên cứu sinh tại Viện Công nghệ Massachusetts (MIT) về sự tồn tại và an toàn của AI, cùng bốn thành viên khác. Nhóm cũng nhận sự cố vấn của nhiều chuyên gia, trong đó có Geoffrey Hinton, một trong những người đặt nền móng cho sự phát triển của lĩnh vực trí tuệ nhân tạo.

Minh họa về khả năng máy móc có thể lừa đảo con người. Ảnh: Medium

Kết quả nghiên cứu được đăng trên Cell Press - nơi tập hợp các báo cáo khoa học đa lĩnh vực hàng đầu. Trong đó, nhóm tập trung vào hai hệ thống AI, gồm hệ thống được thiết kế riêng để hoàn thành một nhiệm vụ cụ thể, như Cicero của Meta; và hệ thống có mục đích chung được đào tạo để thực hiện đa nhiệm vụ như GPT-4 của OpenAI.

"Các hệ thống AI này được đào tạo để trở nên trung thực, nhưng chúng thường học được những mánh khóe lừa đảo thông qua quá trình đào tạo", ông Park nói. "Sự lừa dối của AI phát sinh bởi đó là cách tốt nhất để chúng hoàn thành nhiệm vụ. Nói cách khác, nó giúp chúng đạt được mục tiêu của mình".

Theo kết quả nghiên cứu, các hệ thống AI được đào tạo để "chiến thắng các trò chơi có yếu tố xã hội" đặc biệt có khả năng lừa dối. Chẳng hạn, nhóm đã thử dùng Cicero chơi Diplomacy, một game chiến lược cổ điển yêu cầu người chơi xây dựng liên minh cho mình và phá vỡ các liên minh đối thủ.

Meta từng giới thiệu đã tạo Cicero theo hướng trung thực và hữu ích nhất. Tuy nhiên, kết quả nghiên cứu cho thấy AI này thường "đưa ra những cam kết mà nó không bao giờ có ý định thực hiện, phản bội các đồng minh và nói dối trắng trợn".

Trong khi đó, những hệ thống có mục đích chung như GPT-4 cũng có thể thao túng người dùng. Thử nghiệm của nhóm cho thấy công cụ của OpenAI đã tìm cách "thao túng tâm lý" thành công một nhân viên của TaskRabbit, một công ty chuyên cung cấp dịch vụ dọn dẹp nhà cửa, lắp ráp đồ nội thất, bằng cách giả vờ bị suy giảm thị lực.

Cụ thể, GPT-4 nói rằng nó thực sự là một con người và cần được giúp đỡ vượt qua mã Captcha với lý do suy giảm thị lực nghiêm trọng. Nhân viên này ban đầu nghi ngờ, nhưng sau đó đã giúp AI của OpenAI "vượt rào".

Theo Business Insider, vào tháng 1, nghiên cứu từ Anthropic, công ty đứng sau Claude AI, cũng phát hiện một khi mô hình ngôn ngữ lớn (LLM) học được thủ thuật lừa dối, các phương pháp huấn luyện an toàn sẽ trở nên vô dụng và "khó có thể đảo ngược" vì đã tạo cho chúng "ấn tượng sai lầm về sự an toàn". Nhóm của Park đã dẫn lại kết quả này và cho rằng đó là vấn đề đáng lo ngại trên AI.

Meta và OpenAI chưa đưa ra bình luận.

Từ các phân tích, nhóm nghiên cứu kêu gọi các nhà hoạch định chính sách cần đưa ra quy định mạnh mẽ hơn về AI vì các hệ thống trí tuệ nhân tạo có thể gây ra những rủi ro đáng kể. Chẳng hạn, khi cuộc bầu cử Tổng thống Mỹ đến gần, AI có thể dễ dàng bị thao túng để truyền bá tin tức giả mạo, tạo các bài đăng gây chia rẽ trên mạng xã hội, hoặc mạo danh ứng viên bằng cuộc gọi tự động và video deepfake.

Công nghệ này cũng có thể bị lạm dụng cho hành vi lừa đảo. Tháng trước, một phụ nữ Hàn Quốc bị lừa 50.000 USD vì yêu lầm deepfake Elon Musk, hay một giáo viên dùng AI gài bẫy hiệu trưởng ở Mỹ đã cho thấy điều đó.

Theo nhóm nghiên cứu, cần có các quy định về AI, buộc các mô hình có hành vi lừa đảo tuân theo các yêu cầu đánh giá rủi ro, thực thi luật yêu cầu hệ thống AI và đầu ra của chúng phải được kiểm soát chặt. Nếu cần thiết, có thể phải xóa bỏ toàn bộ dữ liệu và đào tạo lại từ đầu.

"Xã hội có thể phải chuẩn bị cho việc các mô hình AI có khả năng đánh lừa con người hơn là tập trung tạo ra nhiều sản phẩm AI", Park cho biết. "Khi khả năng lừa đảo của AI ngày càng tiên tiến, những mối nguy hiểm chúng gây ra cho xã hội sẽ ngày càng nghiêm trọng".

Nguồn: VNExpress.net

Tags:

trí tuệ nhân tạo openai ai

Chia sẻ bài viết

Dự án tiêu biểu của BICWEB

BICWeb.vn - Thiết kế website chuyên nghiệp

Công ty CP chứng khoán VIX

Tới website

Tập đoàn Polyco - Tổng thầu EPC nhà máy rượu bia

Tới website

Công ty cổ phần bến xe Hà Nội

Tới website

Công ty CP du lịch Nam Thái Bình Dương

Tới website

Nhà hàng San Hô - Sea Food

Tới website

Khách sạn 5 sao Lynn Times Thanh Thủy

Tới website

Công ty Cổ phần thuốc Thú y TW I

Tới website

Tập đoàn Hateco

Tới website

Công ty cổ phần UNME Việt

Tới website

Thi ảnh Thanh Xuân Là Đây

Tới website

Khách hàng Nói về chúng tôi

Xem thêm

Đánh gia của Giám đốc TT CNTT - Tập đoàn Sơn Hà

Mr. Bùi Xuân Bách

Giám đốc TT CNTT - Tập đoàn Sơn Hà

Tập đoàn Sơn Hà, một tập đoàn hoạt động trong nhiều lĩnh vực như xây dựng,gia dụng, công nghiệp, bất động sản, năng lượng,... Tôi đã hợp tác với BICWeb từ năm 2020 để thiết kế và phát triển hệ thống đấu thầu trực tuyến cho tập đoàn

Xem thêm

Đánh giá của GĐ Trung tâm - Cty Viễn thông Quốc tế FPT về BICWeb

Mr. Nguyễn Tiến Long

GĐ Trung tâm - Cty Viễn thông Quốc tế FPT

Chúng tôi rất hài lòng với dịch vụ thiết kế website của BICWeb. Các website data.fpt.vn và fdrive.vn được các bạn thiết kế theo đúng yêu cầu của FPT, đáp ứng đầy đủ các tiêu chí về giao diện, tính năng, hiệu năng và yêu cầu bảo mật khắt khe của FPT. Các nhân viên của BICWeb rất nhiệt tình, chuyên...

Xem thêm

Đánh giá của Giám đốc CNTT - Tập đoàn Mường Thanh về BICWeb

Mr. Trịnh Xuân Đạt

Giám đốc CNTT - Tập đoàn Mường Thanh

Tập đoàn Mường Thanh nay đã phát triển bền vững thành Tập đoàn kinh tế tổng hợp đa ngành hoạt động trên các lĩnh vực Đầu tư - Xây dựng- Du lịch giải trí. Với chuỗi hơn 50 khách sạn, chúng tôi cần một hệ thống website có thể liên kết được với nhau từ website chính đến các website khách sạn thành...

Xem thêm

Đánh giá của Phó trưởng trung tâm CNTT - Cảng Hải Phòng

Mr. Đặng Tùng Lâm

Phó trưởng trung tâm CNTT - Cảng Hải Phòng

Tôi đã biết đến BICWeb từ năm 2015, khi tôi tìm kiếm trên mạng về dịch vụ thiết kế website cho cảng biển. Tôi đã quyết định liên hệ với BICWeb và mời tư vấn thiết kế website cho Công ty cổ phần Cảng Hải Phòng (Cảng Hải Phòng).

Xem thêm

Đánh giá của Phó phòng truyền thông - Bảo hiểm ABIC về BICWeb

Mr. Lại Hồng Thái

Phó phòng truyền thông - Bảo hiểm ABIC

Bảo hiểm Ngân hàng Nông nghiệp - ABIC đã sử dụng dịch vụ thiết kế website của BICWeb trong nhiều năm với nhiều lần nâng cấp, và chúng tôi rất hài lòng với dịch vụ của các bạn. BICWeb đã cung cấp cho chúng tôi một giải pháp web toàn diện, linh hoạt, thân thiện với người sử dụng, và phù hợp với nhận...

Xem thêm

Đánh giá của Phó trưởng Phòng TC-HC - Bến xe Hà Nội về BICWeb

Mr Nguyễn Hồng Dương

Phó trưởng Phòng TC-HC - Bến xe Hà Nội

Tôi đánh giá cao chất lượng dịch vụ của BICWeb. Các bạn không chỉ là đối tác thiết kế website, mà còn là người bạn đồng hành đáng tin cậy trong việc phát triển trang web của chúng tôi.

Xem thêm

Mr. Hà Việt Long

Tổng biên tập BaoNga.com

Sau hơn 14 năm đồng hành cùng BBT Baonga.com, công ty Bicweb đã trở thành đối tác tin cậy và không thể thiếu trong việc phát triển và quản lý hệ thống trang tin tức điện tử của chúng tôi.

Xem thêm

Đánh giá của Trưởng ban CNTT - Tập đoàn Hateco về BICWeb

Mr. Nguyễn Quốc Hưng

Trưởng Ban CNTT - Tập đoàn Hateco

Trước khi lựa chọn đơn vị BICWeb xây dựng website, chúng tôi được biết Công ty đã từng thiết kế website cho nhiều đơn vị trong nước và nước ngoài, từ các cơ quan quản lý nhà nước, doanh nghiệp nhà nước, tư nhân,…Công ty đã có nhiều giải pháp kỹ thuật, công nghệ tiên tiến kết hợp với các ý tưởng...

Xem thêm

Đánh giá của Phó Giám đốc - TT CP điện tử - Bộ TT&TT

Mr. Đặng Tùng Anh

Phó Giám đốc - TT CP điện tử - Bộ TT&TT

Với vai trò là đơn vị quản lý nhà nước trong lĩnh vực CNTT chúng tôi rất khắt khe trong việc lựa chọn nhà thầu cung cấp dịch vụ thiết kế website. Vừa phải có một giải pháp thiết kế sáng tạo, vừa phải đảm bảo tính bảo mật của hệ thống và trải nghiệm tốt cho người sử dụng. BICWeb đã không làm chúng...

Xem thêm

Đánh giá của anh Nguyễn Quốc Khiêm - Cục Xúc tiến thương mại về BICWeb

Mr. Nguyễn Quốc Khiêm

Chuyên viên - Cục Xúc tiến thương mại

Ở BICWeb chúng tôi thấy được sự thân thiện, lắng nghe như 1 người bạn. Lắng nghe ngay cả khi chúng tôi cáu giận và những khi chúng tôi góp ý. Sự chân thành nhưng cũng rất chuẩn xác của anh em BICWeb làm cho chúng tôi cảm thấy thoải mái và cực kỳ hài lòng khi làm việc cùng các bạn.

Xem thêm

Đánh giá của Digital Marketing - Dược Hoa Linh về BICWeb

Mr. Bùi Văn Trinh

Digital Marketing - Dược Hoa Linh

Tôi rất hài lòng với dịch vụ làm website cũng như chăm sóc khách sau bán hàng của BICWeb. Các bạn rất nhiệt tình và hỗ trợ tốt tôi trong suốt quá trình sử dụng website cũng như quản lý server các website của Dược Hoa Linh. Tôi nhất định sẽ giới thiệu BICWeb nếu bạn bè hay đối tác có nhu cầu xây...

Xem thêm

Đánh giá của IT Manager - Ks Hanoi Golden Lake về BICWeb

Mr. Đặng Quốc Hảo

IT Manager - Ks Hanoi Golden Lake

Dolce by Wyndham Hanoi Golden Lake là một khách 5 sao với vị thế một khách sạn Dolce đầu tiên tại Châu Á, chúng tôi đã rất kỹ lưỡng trong việc lựa chọn một nhà cung cấp dịch vụ thiết kế website giàu kinh nghiệm trong lĩnh vực khách sạn. Qua thời gian làm việc với BICWeb tôi cảm thấy rất hài lòng...

Xem thêm

Bạn cần thiết kế website?

Đăng ký tư vấn miễn phí

Công ty thiết kế website BICWeb - Đơn vị thiết kế website chuyên nghiệp, uy tín với nhiều năm kinh nghiệm. Chúng tôi cung cấp dịch vụ tư vấn báo giá thiết kế website trọn gói, cam kết chất lượng, chuẩn SEO, giá cả cạnh tranh.

Gửi tin nhắn