Digg sẽ hấp dẫn hơn trong năm mới?

94 views

Sexy girls with Digg logo

(hình từ paulierco.ro)

Liên tiếp trong hai ngày cuối năm, Anton Kast, VP of Research & Development của Digg đã viết hai bài blog liên quan tới việc làm cho Digg trở nên hấp dẫn hơn (Digg là một website cho phép mọi người có thể chia sẻ những thông tin mình đọc được ở bất cứ website nào khác trên Internet. Việc chia sẻ được thực hiện đơn giản bằng cách cung cấp URL tới thông tin đó và thông tin nào được bình chọn – Digg – nhiều nhất sẽ được xuất hiện trên trang chủ. Ở VN, các website như Linkhay hay Tagvn hoạt động gần giống như Digg. Có khá nhiều người cho rằng Baomoi.vn giống Digg nhưng trên thực tế Baomoi.vn khác Digg khá nhiều).

Trong bài blog ngày 30/12/2008, Anton Kast với vai trò là người đứng đầu team R&D cam kết rằng các thuật toán và công cụ để xác định tự động các bài trùng lặp được người sử dụng đưa lên Digg sẽ được nâng cấp trong thời gian ngắn tới. Điều này là vô cùng cần thiết để tránh cho độc giả của Digg phải liên tục đọc các tin trùng nhau. Trong bài viết của mình, Anton Kast cũng nhắc tới việc tạo ra tính đa dạng cho thông tin trên trang chủ và tạo ra cơ hội cân bằng nhau cho tất cả mọi người khi đưa link lên Digg. Tuy vậy, giải pháp tối ưu mà Anton Kast muốn đem lại là muốn độc giả có thể đào sâu (Digg) hơn vào các trang sau trang chủ và tìm kiếm ra những thông tin phù hợp với mình. Đó là lý do cho bài blog ngày 31/12/2008, bài blog nói về hệ thống tự động giới thiệu thông tin phù hợp với độc giả (Auto-recommendation) của Digg.

Digg đã được đầu tư tới Series C với tổng số tiền lên tới 40 triệu USD. Theo thống kê của Quancast, 1% user hoạt động tích cực nhất của Digg đã đưa lên trang web này tới 32% nội dung của cả trang web. Cho tới tháng 11/2008, lượng độc giả của Digg gần như không phát triển và Digg không có lợi nhuận.

Digg Traffic

Tuy vậy, trong bài viết của mình, Anton Kast đã chỉ ra bằng số liệu rằng sau khi triển khai Recommendation Engine, số lượng hoạt động của độc giả trên Digg đã tăng khá nhiều (40% Diggs, 11% comment, 24% Friend Activities…)

Những thông tin này làm tôi nghĩ khá nhiều tới chức năng Auto-detect Duplicated News của Baomoi (tự động xác định bài đăng trùng giữa các báo). Đào Hải Nam, người chịu trách nhiệm phát triển module WDE (Web Data Extraction) và DAS (Data Analysis System) cho tôi biết rằng hiện tại Baomoi.com đang sử dụng thuật toán biến thiên từ thuật toán tìm chuỗi chung dài nhất (Longest common substring) để thực hiện viêc tự động xác định các bài đăng trùng giữa các báo. Nam cũng cho biết rằng trong quý I/2009, khi Baomoi thực hiện triển khai so sánh toàn bộ body của bài thì việc xác định bài đăng trùng sẽ trở nên chính xác hơn rất nhiều.

Hiện tại, độc giả có thể xem thống kê về tin trùng lặp trên Baomoi tại đây.

Auto detect duplicatied news Baomoi

Quay lại với Digg, tôi khá hy vọng vào những gì mà Anton Kast đang làm vì đó là những thuật toán thực sự có ích cho độc giả. Hy vọng rằng trong năm 2009, với những sự cải tiến vượt bậc của mình, Digg sẽ thực sự “hấp dẫn” hơn và chúng tôi (những người phát triển Baomoi) có thể học hỏi được ở Digg để mang lại cho độc giả nhiều hơn năm 2008.