Bị lộ thông tin qua mã số sinh viên, chuyên gia lý giải nguyên nhân

Bị lộ thông tin qua mã số sinh viên, chuyên gia lý giải nguyên nhân

Bất ngờ bị AI “phơi bày” thông tin cá nhân

Thử gõ mã số sinh viên của bản thân trên Google, Minh Châu (22 tuổi, sinh viên tại Hà Nội) giật mình khi trông thấy gần như toàn bộ thông tin cá nhân xuất hiện trên kết quả tìm kiếm do AI trả về.

Đó là câu chuyện được Châu kể lại sau khi thử làm theo trào lưu đang lan truyền trên Threads những ngày gần đây.

Cụ thể, nhiều người dùng đã đăng tải những nội dung bày tỏ hoang mang khi chỉ cần tra mã sinh viên, lập tức các thông tin cá nhân từ họ tên, lớp học, ngày sinh, kết quả học tập hay thậm chí là quê quán, căn cước công dân xuất hiện.

Một tài khoản đăng tải: “Vụ tra mã sinh viên ra thông tin có thật hả mọi người, mình tra ra hết thông tin luôn, đến cả từng học môn gì, điểm thế nào đều có hết. Mình bắt đầu thấy sợ AI rồi đó”.

Bài viết nhanh chóng thu hút hàng trăm nghìn lượt xem. Ở dưới bài đăng, nhiều sinh viên khác cũng thử làm theo và bất ngờ khi thông tin cá nhân xuất hiện từ kết quả của AI.

Nhưng trên thực tế, thủ phạm đằng sau lại không thực sự đến từ AI.

Trao đổi với phóng viên Dân trí, chuyên gia an ninh mạng, ông Ngô Minh Hiếu (Hiếu PC), nhận định: “Không nên hiểu là AI tự “bẻ khóa” dữ liệu. Phần lớn trường hợp là thông tin đã từng được công khai trên website trường, file PDF, danh sách lớp, thông báo học vụ, diễn đàn hoặc mạng xã hội. AI và công cụ tìm kiếm chỉ làm việc tổng hợp, hiển thị lại nhanh hơn”.

Trong nhiều năm qua, một số trường đại học thường công khai danh sách sinh viên, học bổng, điểm rèn luyện hay kết quả học tập. Những nội dung này có thể được Google lập chỉ mục và lưu trữ trong cơ sở dữ liệu tìm kiếm.

Mặt khác, trên các nền tảng chia sẻ tài liệu, để có được quyền truy cập hoặc tải xuống một số tài liệu cần thiết, người dùng cần tải lên tài liệu coi như để trao đổi.

Vì vậy, nhiều sinh viên đã ngang nhiên nộp các báo cáo, bài tiểu luận và ngay cả khóa luận tốt nghiệp của sinh viên khác mà không xin phép.

Không ít tài liệu trong số đó được tải lên vẫn giữ nguyên thông tin cá nhân của tác giả hoặc thông tin của các thành viên trong nhóm thực hiện.

Theo ghi nhận, có một số người còn nộp cả danh sách lớp, danh sách sinh viên nhận học bổng hoặc các biểu mẫu hành chính với nhiều trường dữ liệu cá nhân.

“Không phải sợ AI đâu. AI không làm được vậy nếu không có mấy người dùng bài chứa thông tin của người khác tải lên lấy lượt đọc tài liệu đâu”, một người dùng bình luận.

Và rồi khi các công cụ AI được tích hợp vào hệ thống tìm kiếm, việc tổng hợp và trình bày lại thông tin trở nên nhanh chóng hơn.

Từ những mảnh dữ liệu rời rạc, AI có thể tổng hợp và tập trung lại thành một bộ hồ sơ thông tin sinh viên tương đối hoàn chỉnh.

Theo chuyên gia Ngô Minh Hiếu, mã số sinh viên là một định danh tương đối ổn định trong suốt quá trình học tập.

Khi mã này xuất hiện ở nhiều nguồn dữ liệu khác nhau, công cụ tìm kiếm có thể sử dụng nó như một điểm kết nối để liên kết các mảnh thông tin rời rạc.

Từ một mã sinh viên, hệ thống có thể lần theo họ tên, lớp học, ngành đào tạo, email trường cấp hoặc các tài liệu học tập từng được công khai. Mỗi thông tin riêng lẻ khi được ghép nối lại có thể tạo thành hồ sơ tương đối về một cá nhân.

Rủi ro rình rập sinh viên

Theo ông Hiếu, khi có trong tay các thông tin cá nhân của sinh viên, kẻ xấu hoàn toàn có thể xây dựng những kịch bản lừa đảo với độ tin cậy cao hơn nhiều so với các hình thức phát tán tin nhắn hàng loạt.

Chẳng hạn, sinh viên có thể nhận được email giả mạo phòng đào tạo yêu cầu xác minh tài khoản học vụ, cập nhật thông tin cá nhân hoặc đóng học phí bổ sung.

Do nội dung thư chứa nhiều thông tin chính xác về người nhận, nạn nhân dễ tin rằng đây là thông báo chính thức từ nhà trường.

Trong một số trường hợp, những dữ liệu này còn có thể được sử dụng để dò đoán mật khẩu hoặc thực hiện các hình thức tấn công phi kỹ thuật nhắm vào cả sinh viên lẫn phụ huynh.

  Hộ gia đình dùng thiết bị kích sóng trái phép bị xử lý

Vị chuyên gia cho biết điều đáng lo ngại khác còn đến từ khả năng các công cụ AI giúp việc thu thập và tổng hợp dữ liệu trở nên dễ dàng hơn.

“Trước đây, muốn tìm hiểu thông tin về một người, kẻ xấu có thể phải truy cập nhiều website, tải nhiều tài liệu khác nhau rồi tự đối chiếu. Hiện nay, AI có thể hỗ trợ gom các dữ liệu đó lại, tóm tắt và trình bày dữ liệu thành một bức tranh hoàn chỉnh trong thời gian ngắn”, ông Hiếu đánh giá.

Trước thực tế này, chuyên gia khuyến nghị các trường đại học cần rà soát toàn bộ website, kho tài liệu trực tuyến và các tệp PDF đang được công khai.

Những nội dung chứa dữ liệu cá nhân như danh sách lớp, điểm số, lịch thi hoặc thông tin học vụ nên được chuyển sang hệ thống yêu cầu đăng nhập nội bộ thay vì để công khai.

Các trường cũng nên hạn chế việc công bố đồng thời họ tên và mã số sinh viên trong các tài liệu có thể được công cụ tìm kiếm lập chỉ mục, đồng thời chủ động gỡ bỏ hoặc chặn lập chỉ mục đối với những nội dung không còn giá trị sử dụng.

Về phía sinh viên, ông Hiếu khuyến nghị nên chủ động tra cứu thông tin của bản thân trên Google để kiểm tra những thông tin nào đang xuất hiện công khai.

Nếu phát hiện dữ liệu không cần thiết hoặc có nguy cơ ảnh hưởng đến quyền riêng tư, người dùng có thể gửi yêu cầu gỡ bỏ kết quả tìm kiếm tới Google TẠI ĐÂY

Bên cạnh đó, sinh viên không nên sử dụng mã số sinh viên làm mật khẩu, thông tin khôi phục tài khoản hoặc các câu hỏi bảo mật.

Đối với các nền tảng chia sẻ tài liệu, nếu bắt gặp tài liệu hoặc thông tin của mình bị công khai, sinh viên có thể truy cập vào tính năng báo cáo để yêu cầu được gỡ bỏ.

Tin Gốc: Dân Trí