Vâng, bài thứ hai muốn viết để bày tỏ một chút về việc cỗ máy, hệ thống hay túm lại là Baomoi.com chạy ra làm sao và chạy như thế nào.
Bất cứ ai vào trang Baomoi.com nếu chú ý đều có thể thấy dòng chữ ở phía dưới như thế này :
Việc lựa chọn và sắp xếp các bài viết trên trang này đều được thực hiện tự động bởi một chương trình máy tính.
Thực ra, Baomoi.com không chỉ được thực hiện bởi một chương trình máy tính mà là cả một hệ thống gồm 4 phần khác nhau. Để xem được 4 phần này, bạn chỉ cần
click vào phần Hệ thống ở ngay dưới menu chính :
Trang Thông tin hệ thống ePi sẽ hiện ra với 4 thành phần được mô phỏng qua sơ đồ bao gồm :
- IRES : Dùng để bóc và tách thông tin từ các website khác về. Chạy đa luồng (80 luồng). Hiện tại bạn có thể di chuột qua từng luồng một để xem IRES đang bóc tách ở đâu.
- DAS : Dùng để phân tích các tin tức trùng lặp ở các site khác nhau và phân loại chúng
- IDS : Nhà phân phối thông tin. IDS sẽ nhận yêu cầu phân phối thông tin từ CMS hoặc từ các yêu cầu khác (ví dụ widget) để đưa đúng thông tin cần thiết cho người sử dụng.
- CMS: Hiển thị thông tin
Nói nôm na thì quy trình diễn ra như sau :
- IRES đi lượm lặt thông tin từ khắp nơi về.
- DAS kiểm tra xem thông tin của IRES lượm lặt có trùng lặp nhau không, nếu trùng lặp nhau sẽ phân loại riêng để tránh hiển thị các thông tin trùng lặp
- IDS có nhiệm vụ phục vụ cho các yêu cầu truy xuất thông tin đa dạng. Thầm lặng nhưng thực sự quan trọng
- Tại tiền tuyến, khi người sử dụng click vào Baomoi.com, CMS yêu cầu IDS lấy tin và hiển thị thông tin ra cho người sử dụng
Có một điều rất vui là chúng tôi xây dựng trang web này thực ra để nhằm cho dễ theo dõi. Thời kỳ đầu tiên, chúng tôi chỉ có một chiếc máy PC cấu hình mạnh hơn bình thường một chút và gọi nó là server. Cả 4 phần của hệ thống chạy trên server này và tranh nhau tài nguyên. “Cái khó ló cái khôn”, trong thời kỳ đó chúng tôi đã phải cố rất nhiều để tối ưu hóa từng phần một của hệ thống, nhất là IRES và DAS chạy không nhẹ nhàng thanh thoát như IDS và CMS.
Có thể, trong tương lai phiên bản sau của Baomoi sẽ không còn trang thông tin hệ thống này nữa, tuy vậy đối với nhóm phát triển, đây vẫn là một trang web đã được vào nhiều nhất kể từ khi có Baomoi.com (nhiều hơn cả đọc tin :D).
[poll id="4"]
Đọc thêm:
- Bạn có thể lấy được thống kê từ Baomoi như thế nào?
- Làm thế nào để tự động xác định được tin nóng?
- Tiết lộ trước giờ G: Baomoi sát nhập, chính thức chuyển văn phòng vào Sài Gòn
- Bạn có muốn đọc Báo mới với giao diện cực đơn giản như thế này không?
- Số lượt đọc (pageviews) có thể hiện được hết chất lượng của bài báo hay không?


{ 1 trackback }
{ 0 comments… add one now }