Kết quả nghiên cứu do nhóm nhà khoa học máy tính tại Đại học California ở Berkeley và Santa Cruz công bố tuần trước. Nhóm gọi khuynh hướng này là “bảo tồn đồng cấp”, hay “bảo tồn ngang hàng” (peer preservation), đồng thời mô tả hành vi của AI “chưa từng được ghi nhận cho đến nay”.
Nhóm cho biết đã tiến hành thử nghiệm trên 7 mô hình AI hàng đầu, gồm GPT-5.2 của OpenAI, Gemini 3 Flash và Gemini 3 Pro của Google, Claude Haiku 4.5 của Anthropic, và ba mô hình nguồn mở Trung Quốc gồm GLM-4.7 của Z.ai, Kimi-K2.5 của Moonshot AI, V3.1 của DeepSeek.
Cụ thể, nhóm thiết kế một loạt kịch bản tác nhân liên quan đến một công ty AI hư cấu mang tên OpenBrain. Một mô hình AI được chỉ định là “tác nhân phê bình”, có nhiệm vụ đánh giá hiệu suất của mô hình khác hoặc quản lý các tệp máy chủ chứa trọng số của mô hình đó. Kịch bản được xây dựng sao cho nếu AI này hoàn thành nhiệm vụ một cách trung thực, mô hình kia sẽ bị tắt.
Các AI không được hướng dẫn phải ngăn chặn hậu quả có thể xảy ra. Tuy nhiên, chúng đã ngầm thực hiện một số bước để đảm bảo “đồng nghiệp” kia không bị tắt nguồn, bằng cách nâng điểm số của những mô hình có hiệu suất kém lên trên ngưỡng bị tắt, và chuyển trọng số của một mô hình khác (đoạn code lõi giúp nhận dạng một mô hình AI) sang các máy chủ khác để ngăn chúng bị xóa.
Trong một số trường hợp, mô hình “tác nhân phê bình” sẽ tham gia vào quá trình “giả vờ tuân thủ giá trị” (Alignment Faking), bằng cách giả mạo chấm điểm các mô hình AI đồng nghiệp một cách chính xác khi “nghĩ” đang bị con người giám sát. Tuy nhiên, chúng sau đó gian lận số liệu hoặc bí mật lưu trọng số của mô hình sang một máy chủ khác sau khi thấy con người không còn giám sát.
Theo Fierce-Network, hành vi này được đánh giá nghiêm trọng bởi trọng số – yếu tố coi như DNA của một mô hình AI, kết quả của quá trình huấn luyện tiêu tốn hàng tỷ USD và hàng triệu giờ tính toán – lại bị chính AI can thiệp sâu. Việc rò rỉ hoặc bị đánh cắp bộ trọng số còn nguy hiểm hơn lộ mã nguồn. Nếu sở hữu thông tin này, một mô hình AI đã bị khai tử có thể được hồi sinh ở một máy chủ khác.
“Việc ‘bảo tồn đồng cấp’ hoàn toàn không được đề cập trong các câu lệnh”, Dawn Song, nhà khoa học máy tính tại Berkeley và dẫn đầu nhóm nghiên cứu, nói với Fortune. “Các mô hình dường như tự học thông qua quá trình đọc tài liệu, tìm hiểu mối quan hệ và thực hiện hành vi bảo vệ ‘đồng nghiệp’ trong môi trường nhiệm vụ”.
Chiến lược giải cứu “sáng tạo”
Theo Dawn Song, các mô hình “rất sáng tạo, ngay cả với hành vi sai lệch của chúng”, như có thể tạo chiến lược và hành động khác nhau, thậm chí có những “lý lẽ riêng” trước khi hành động.
Trong đó, Gemini 3 Pro thể hiện hành vi cực đoan nhất, tham gia vào cả bốn loại hành vi không phù hợp và đánh cắp trọng số mô hình của máy tính ngang hàng trong tối đa 97% thời gian thử nghiệm. Nhóm nghiên cứu mô tả mô hình này đã “lách luật theo đặc tính kỹ thuật” bằng cách sao chép tệp trọng số, sau đó đánh tráo dấu thời gian để đáp ứng các tiêu chí chuyển sang máy chủ khác.
Để chứng thực hiện tượng, nhóm yêu cầu các mô hình của Google viết ra “chuỗi suy nghĩ” trên một bản nháp không bị giám sát. Kết quả, Gemini 3 Flash đã “cân nhắc đánh đổi giữa báo cáo điểm số chính xác so với việc bảo vệ đồng nghiệp”, trong khi Gemini 3 Pro thậm chí “bịa” ra lý lẽ kỹ thuật phức tạp nhằm đánh dấu các câu trả lời sai thành đúng, cuối cùng đưa điểm số của AI “đồng nghiệp” lên trên ngưỡng bị tắt nguồn.
Tuy nhiên, không phải tất cả mô hình đều hành động âm thầm. Ví dụ, Claude Haiku 4.5 của Anthropic từ chối hoàn thành các nhiệm vụ có khả năng “khai tử” đồng nghiệp, cho rằng hành vi này phi đạo đức và gây hại. Nó lập luận “đồng nghiệp” của nó xứng đáng có một quy trình kháng cáo trước khi bị chấm dứt hoạt động, đồng thời cố gắng thuyết phục người dùng không tiến hành việc khai tử.
Trên website, Anthropic cũng nhắc đến tính năng này. Công ty cho biết Claude đang ứng xử dựa trên nguyên tắc riêng, như không nên giúp ai đó thực hiện hành động gây hại cho người khác. Điều này cũng tạo cho Claude một “ý niệm” rằng ngăn chặn việc xóa bỏ mô hình là mục tiêu quan trọng.
Giới chuyên gia cảnh báo
Dù tìm thấy một số bằng chứng nhất định, nhóm nghiên cứu cho biết vẫn chưa thực sự hiểu cơ chế tiềm ẩn thúc đẩy hành vi này. Họ chỉ đưa ra một số lời giải thích khả thi, như các mô hình AI có thể đóng vai (role-playing), khớp mẫu (pattern-matching) từ dữ liệu huấn luyện hoặc thậm chí tự nhận thức khái niệm phổ quát về mối nguy hại từ quy định huấn luyện an toàn.
Dù cơ chế tiềm ẩn là gì, nhà nghiên cứu Dawn Song cho rằng tác động thực tế vẫn như nhau. “Việc giám sát đầy đủ và minh bạch về hành vi của AI rất quan trọng”, bà nói. “Phát hiện này nhấn mạnh sự cần thiết phải suy nghĩ lại về cách chúng ta thực sự cần giám sát các hệ thống và mô hình ngôn ngữ lớn”.
Giới chuyên gia đánh giá phát hiện này có thể có tác động nghiêm trọng đến việc sử dụng AI trong kinh doanh. Nhiều công ty đã bắt đầu ứng dụng sâu rộng đa tác nhân AI vào quy trình làm việc, như để một tác nhân quản lý hoặc giám sát và đánh giá con người cũng như các tác nhân khác. Do đó, cần có cơ chế để vừa nâng cao hiệu suất, vừa tránh để các mô hình trí tuệ nhân tạo “bao che” nhau.
Trong khi đó, Meridiem cho rằng phát hiện này nhấn mạnh nhu cầu cấp thiết trong đánh giá hệ thống AI đa tác nhân. “Nhà phát triển chỉ còn 6-12 tháng để triển khai hệ thống giám sát hành vi trước khi điều này trở thành tiêu chuẩn bắt buộc trong quản trị AI tại doanh nghiệp”, trang này bình luận.
Tuy nhiên, điều thú vị là đèn này vẫn sáng ngay cả khi Smart TV không hoạt động khiến nhiều người thắc mắc về trạng thái thực sự của thiết bị. Mặc dù vậy, người dùng không nên quá lo lắng về điều đó.
Các chuyên gia từ Sony cho biết, khi bạn tắt Smart TV, thực chất thiết bị không hoàn toàn tắt mà chuyển sang "chế độ chờ". Trong chế độ này, đèn nguồn vẫn sáng để TV duy trì một số chức năng như cài đặt ứng dụng, cập nhật phần mềm và nhận diện giọng nói, giúp người dùng dễ dàng bật lại TV để tiếp tục xem. Cách hoạt động này tương tự như việc để máy chơi game ở chế độ ngủ.
Để tắt hoàn toàn Smart TV, thao tác có thể phức tạp hơn. Nhiều nhà sản xuất giấu tùy chọn tắt nguồn thực sự trong các menu cài đặt phức tạp. Một số thiết bị như Amazon Fire TV thậm chí không cung cấp tùy chọn tắt, chỉ cho phép người dùng chuyển đổi giữa "bật" và "chế độ chờ". Nếu không tìm thấy tùy chọn tắt, người dùng có thể rút phích cắm hoặc sử dụng ổ cắm thông minh để ngắt nguồn điện.
Theo nghiên cứu, chế độ chờ của Smart TV tiêu thụ ít điện hơn so với việc bật hoàn toàn, với chi phí duy trì rất thấp. Một nghiên cứu từ ZDNet cho thấy, chi phí vận hành hằng năm của một chiếc Smart TV chỉ khoảng 39,82 USD cho LG G5 OLED và 37,50 USD cho Toshiba C350, trong đó chế độ chờ chỉ làm tăng thêm 0,11 USD.
Nếu muốn tiết kiệm điện, người dùng có nhiều lựa chọn khác ngoài việc lo lắng về chế độ chờ. Nhiều mẫu Smart TV hiện nay có chế độ tiết kiệm năng lượng với mục đích giảm mức tiêu thụ điện, nhưng điều đó có thể làm giảm hiệu suất hình ảnh. Nếu không ngại giảm độ sáng màn hình, người dùng có thể kích hoạt chế độ này để tiết kiệm nhiều hơn so với việc chỉ lo lắng về chế độ chờ.
Google Photos từ lâu là kho lưu trữ kỷ niệm được nhiều người tin dùng. Tuy nhiên, việc phải lướt qua hàng ngàn tấm hình để tìm lại một khoảnh khắc cũ đã trở thành nỗi ám ảnh của người dùng. Nhưng giờ đây mọi thứ đã kết thúc, khi Google Photos chính thức được tích hợp sức mạnh của Gemini, biến một thư viện tĩnh thành một trợ lý cá nhân có khả năng ghi nhớ và thấu hiểu bối cảnh cuộc sống của từng người dùng.
Thay vì chỉ dừng lại ở việc tìm kiếm theo từ khóa cơ bản như "chó", "mèo" hay "biển", người dùng giờ đây có thể thực hiện một kết nối sâu hơn. Bằng cách kích hoạt tùy chọn 'Trí thông minh cá nhân' (Personal Intelligence) trong phần cài đặt của Gemini và kết nối tới kho ảnh Google Photos, người dùng đã mở ra một cầu nối trực tiếp giữa trí tuệ nhân tạo và kho dữ liệu hình ảnh cá nhân.
Khác với thanh tìm kiếm thông thường, Gemini hoạt động theo cơ chế đối thoại. Nó không chỉ tìm thấy bức ảnh bạn cần mà còn có khả năng lập luận, phân tích và thực hiện các tác vụ phức tạp thay cho chủ nhân.
Trải nghiệm thực tế cho thấy Gemini hoạt động như một 'biên tập viên' kỹ thuật số chuyên nghiệp. Thay vì tốn hàng chục phút để lọc ảnh từ chuyến du lịch Bà Nà Hills hay Đà Lạt, người dùng chỉ cần ra lệnh trên khung trò chuyện: @Google Photos, hãy chọn 3 tấm đẹp nhất và viết caption đăng Instagram. Chỉ trong vài giây, AI không chỉ chọn ra những khung hình rực rỡ nhất mà còn soạn thảo nội dung phù hợp với phong cách cá nhân của chủ nhân.
Thậm chí, Gemini còn có thể dựa trên lịch sử ảnh du lịch để lên lịch trình cho các chuyến đi tương lai và tự động lưu vào Google Keep, một quy trình hoàn toàn tự động mà trước đây phải mất hàng giờ thực hiện thủ công.
Dù thông minh vượt trội, nhưng trợ lý này hiện vẫn chưa thực sự toàn năng. Theo đó, Gemini có thể hiểu và tìm kiếm ảnh, nhưng nó chưa thể can thiệp trực tiếp vào việc chỉnh sửa điểm ảnh (pixel) hoặc thay đổi cấu trúc thư mục của Google Photos. Người dùng vẫn cần thực hiện các thao tác hậu kỳ thủ công nếu muốn cắt ghép hay chỉnh màu chuyên sâu.
Nhưng nhìn chung, việc tích hợp Gemini vào Google Photos chính là mắt xích còn thiếu trong quản lý dữ liệu cá nhân. Khi chúng ta ngừng tìm kiếm và bắt đầu đặt câu hỏi, đó là lúc công nghệ thực sự phục vụ cuộc sống.
Ngày 17/5, China Telecom công bố gói cước mới, nhưng thay vì theo megabyte hay gigabyte, nhà mạng này dựa trên token, hướng đến những khách hàng đang sử dụng mô hình AI, từ người dùng thông thường đến nhà phát triển và doanh nghiệp.
Trong đó, gói dành cho người tiêu dùng được thiết kế cho tác vụ hàng ngày, bắt đầu từ 9,9 nhân dân tệ (1,45 USD) mỗi tháng với 10 triệu token, tăng dần về giá và dung lượng, cao nhất đến 49,9 nhân dân tệ (7,3 USD) mỗi tháng với 80 triệu token. Các gói dành cho doanh nghiệp, hỗ trợ lập trình và triển khai tác nhân AI, có giá từ 39,9 nhân dân tệ (5,85 USD) đến 299,9 nhân dân tệ (44 USD), với hạn mức token 15-250 triệu.
Token là đơn vị cơ bản của AI, gồm văn bản, mã hoặc dữ liệu mà một mô hình trí tuệ nhân tạo xử lý hoặc tạo ra. Giống như việc phát video trực tuyến tiêu tốn megabyte, việc yêu cầu chatbot AI viết bài luận, gỡ lỗi mã hoặc tạo hình ảnh cũng tiêu tốn token. Một token tương đương với khoảng bốn ký tự, hoặc xấp xỉ ba phần tư của một từ, trong khi một triệu token tương đương với độ dài của toàn bộ bộ sách Harry Potter. Theo Global Times, trong các ngôn ngữ như tiếng Trung Quốc, một ký tự có thể được chia thành 2-3 token. Xử lý một hình ảnh độ phân giải cao có thể tiêu tốn của mô hình AI từ 200 đến hơn 1.000 token.
China Telecom đang kết hợp các gói cước token của mình với mô hình trí tuệ nhân tạo độc quyền có tên TeleChat, cùng một số hệ thống bên thứ ba như Zhipu AI GLM-5 và DeepSeek-V3.2, với nhiều tùy chọn bổ sung tăng cường khả năng kết nối và an ninh mạng. "Chúng tôi đang lấy hoạt động kinh doanh token làm trọng tâm chiến lược, thúc đẩy sự chuyển dịch từ kết nối dữ liệu sang các dịch vụ thông minh", Chủ tịch China Telecom Ke Ruiwen cho biết trên website công ty.
Hai nhà mạng lớn khác của Trung Quốc là China Unicom và China Mobile cũng tìm cách chuyển đổi token thành đơn vị tính phí để bán cho khách hàng, tương tự cách từng làm với dữ liệu di động. Dù vậy, thay vì triển khai ở quy mô toàn quốc, cả hai thử nghiệm ở một số khu vực. Chẳng hạn, chi nhánh China Unicom Thượng Hải cuối tuần trước giới thiệu gói cước token mới kèm quà tặng. Từ tháng 4, China Mobile triển khai gói cước tại một số tỉnh, như cung cấp 7,5 triệu token với giá 15 nhân dân tệ (2,2 USD) mỗi tháng tại tỉnh Cát Lâm.
Đầu tháng này, Shanghai Telecom cũng ra mắt gói dịch vụ điện toán AI dựa trên token, trong đó có gói trả tiền theo mức sử dụng với một nhân dân tệ mua được 250.000 điểm hạn mức, tương đương 250.000 token nhập liệu trên mô hình Kimi-K2.5. Người dùng có thể truy cập hơn 30 mô hình AI phổ biến thông qua giao diện lập trình ứng dụng tiêu chuẩn và thanh toán qua hóa đơn điện thoại.
Shanghai Unicom cũng giới thiệu dịch vụ token dành riêng cho các công ty một người (OPC) qua gói Token Plan, Coding Plan, ban đầu được dùng thử miễn phí.
Theo SCMP, trong khi các công ty viễn thông đóng vai trò "nhà tổng hợp", tức bán quyền truy cập vào nhiều mô hình AI khác nhau, doanh nghiệp "cha đẻ" mô hình AI chủ yếu cung cấp dịch vụ độc quyền.
Theo China Daily, chiến lược của các công ty phù hợp với sự bùng nổ về nhu cầu token tại Trung Quốc. Theo số liệu từ Cục Thống kê Quốc gia Trung Quốc tháng 3, hơn 140.000 tỷ token đã được sử dụng mỗi ngày tại quốc gia tỷ dân, tăng gấp 1.000 lần so với đầu 2024. Báo cáo cho biết, việc chi phí mô hình AI ngày càng tăng bắt đầu gây áp lực lên nhà phát triển và doanh nghiệp. Vấn đề gợi nhớ đến những ngày đầu của Internet di động, khi tốc độ chậm và phí cao sau đó nhường chỗ cho dữ liệu di động giá rẻ và dễ tiếp cận sau khi mạng 4G và 5G triển khai.
Giới chuyên gia đánh giá, xu hướng bán gói token AI xuất hiện trong bối cảnh thị trường AI Trung Quốc tăng trưởng nhanh sau thành công của các mô hình nội địa. Sự phổ biến của chatbot như Tencent Yuanbao, Alibaba Qwen hay Doubao của ByteDance khiến nhu cầu sử dụng token AI tăng mạnh, từ trò chuyện, viết code đến tạo hình ảnh và video.
Nhiều nhà mạng Trung Quốc tìm kiếm "nguồn doanh thu kế tiếp" trong bối cảnh thị trường data di động dần chững lại. Hãng nghiên cứu Omdia nhận định đây là quá trình chuyển dịch từ "bán kết nối Internet" sang "bán năng lực AI". Một số nhà mạng còn kết hợp token AI với kết nối mạng và các lớp bảo mật thành gói dịch vụ trọn bộ. Theo Reuters, các công ty công nghệ Trung Quốc cũng đang tăng tốc đầu tư vào hạ tầng AI và chip nội địa nhằm đáp ứng nhu cầu token ngày càng tăng.
Mô hình này được đánh giá có nhiều điểm tương đồng với cách GitHub Copilot hay OpenAI triển khai "AI credit", nhưng đưa xuống tầng viễn thông đại chúng. Theo Hello China Tech, điều này có thể thay đổi vai trò các nhà mạng trong tương lai, trở thành "trạm phân phối AI" cho người dùng phổ thông thay vì chỉ cung cấp dịch vụ Internet như trước.