Giống như các nhà xuất bản trực tuyến khác, The New York Times thu phí của người đọc truy cập vào các bài viết trên website của mình. Nhưng tại sao lại phải trả tiền trong khi có thể sử dụng Google để xem các trang này một cách hoàn toàn miễn phí qua tính năng cache?
Qua một tính năng caching (lưu giữ tạm thời nội dung của trang web để tăng tốc độ truy cập hoặc tìm kiếm) trên trang tìm kiếm Google, người tìm kiếm đôi khi có thể xem được các bài viết hoặc câu chuyện được lưu tại NYTimes.com và các site dành riêng cho thuê bao đăng ký khác. Tính năng này đã tặng cho người lướt web khả năng truy tìm các trang web không còn có thể truy cập vào nguồn chính thống, vì bất kỳ lý do nào. Nhưng gần đây tính năng này đã khiến Google đắc tội với một số nhà xuất bản trực tuyến.
Ông Christine Mohan, một phát ngôn viên của New York Times Digital, nhà xuất bản của NYTimes.com cho biết: ''Chúng tôi đang làm việc với Google để khắc phục vấn đề này - chúng tôi sẽ vô hiệu tính năng này để khi bạn click vào một đường link cache, nó sẽ đưa bạn trở về trang đăng ký''. ''Chúng tôi đã thiết lập các đường link lưu trữ này và muốn duy trì chúng có hiệu lực từ tất cả các điểm truy cập''.
Google chỉ cung cấp cho các nhà xuất bản một cách rất đơn giản để rút khỏi tính năng lưu trữ tạm thời của mình, và sự tranh cãi này có thể dẫn đến các cuộc chiến về pháp lý.
Tại tâm điểm của tình trạng cache tiến thoái lưỡng nan của Google là một vấn đề mang tính pháp lý. Đó là khi nào thì việc copy trang web của một tổ chức hay cá nhân khác là có thể chấp nhận, thậm chí chỉ là copy tạm thời?
Một ''vong hồn'' của những trang web chết
Tính năng cache của Google, được giới thiệu vào năm 1997, là một tính năng độc đáo giữa những công cụ tìm kiếm trên mạng khác, nhưng không giống các site lưu trữ trên web lưu lại các bản sao của các trang web. Tính năng ít được biết đến này của Google cho phép mọi người truy cập vào một bản sao của hầu như bất kỳ website nào, dưới dạng lần cuối cùng được công cụ tìm kiếm này phân loại và ghi chỉ mục. Có thể trang web cache này được truy cập có tuổi đời chỉ vài phút hoặc vài tháng, phụ thuộc vào lần cuối mà Google mò đến để đánh chỉ mục tìm kiếm.
Không như các dự án lưu trữ web chính thống khác, Google cho biết tính năng cache của mình không cố gắng tạo ra một bản sao lưu trữ cố định của trang web. Thay vào đó, công ty này liên tục tìm kiếm các đường link chết để xoá bỏ, một khi trang web không hiển thị được, công cụ tìm kiếm sẽ thanh lọc các cache có liên quan đến đường link đó trong thời gian nhanh nhất có thể.
Tuy nhiên, các trang cache của Google đã được chứng tỏ là một kho báu cho những nhà phân tích tìm kiếm dữ liệu phục hồi từ các trang web công cộng. Một ví dụ điển hình, chuyên gia bảo mật và riêng tư Richard Smith đã copy được các trang web thông tin chi tiết về hồ sơ của Tiến sĩ John Poindexter, người đứng đầu Cơ quan thu nhận thông tin (IAO) của Lầu Năm Góc, cùng các quan chức khác, từ cache của Google vài ngày sau khi chúng được dỡ bỏ khỏi website của IAO. Các trang này đã được xoá vài ngày sau khi các báo cáo công cộng cho biết các thông tin này đã bị xâm nhập với động cơ gián điệp và khủng bố.
Bình Minh - Theo CNET