11/06/2018, 00:29

Internet Archive – Wayback Machine là gì và dùng để làm gì?

Wayback Machine là gì? Internet Archive là gì? Công dụng, tác dụng của dùng để làm gì? Hãy cùng ngôi nhà kiến thức tìm hiểu qua bài viết này nhé. Có thể bạn quan tâm: Free là gì – Cách mở nhiều trang web cùng lúc Internet Archive là gì? Internet Archive được xem như là 1 thư viện kỹ ...

Wayback Machine là gì? Internet Archive là gì? Công dụng, tác dụng của dùng để làm gì? Hãy cùng ngôi nhà kiến thức tìm hiểu qua bài viết này nhé.

Có thể bạn quan tâm: Free là gì – Cách mở nhiều trang web cùng lúc

Internet Archive là gì?

Internet Archive được xem như là 1 thư viện kỹ thuật số trực tuyến miễn phí. Nơi đây cung cấp hàng triệu cuốn sách, phim ảnh, phần mềm, nhạc, bản lưu của trang web. Đây là 1 trang web ra đời vào năm 1996. Nếu tính đến thời điểm mình viết bài này thì đã là 22 năm rồi. Brewster Kahle và Bruce Gilliat chính là 2 người đã sáng lập ra Internet Archive.

Khẩu hiệu của Internet Archive là Our mission is to provide Universal Access to All Knowledge. Có thể tạm dịch theo ý của mình là Nhiệm vụ của chúng tôi là cung cấp tất cả kiến thức cho người truy cập trên toàn cầu.

Internet Archive hoạt động thì chủ yếu là lưu trữ lại các nội dung kỹ thuật số như theo số liệu công bố trên chính trang Web của họ thì hiện nay.

Theo số liệu họ công bố thì hiện nay họ đang lưu trữ:

  • 279 tỷ trang web
  • 11 tỷ cuốn sách và văn bản
  • 4 triệu bản ghi âm  (trong đó bao gồm 160000 buổi hòa nhạc trực tiếp)
  • 3 triệu video (trong đó bao gồm 1 triệu video các chương trình tin tức truyền hình)
  • 1 triệu tấm hình
  • 100000 phần mềm

Như đây là phim về vua hề Sác Lô  (Charlie Chaplin) mình tìm được trên

https://archive.org/search.php?query=director%3A”Charles+Chaplin”

Internet Archive - Wayback Machine là gì và dùng để làm gì?

Wayback Machine là gì?

Wayback Machine hay có người còn gọi là Web Archive là 1 trang Web chuyên lưu trữ nội dung các website trên thế giới theo các mốc thời gian. Chủ yếu là là do người dùng nhấn lưu hoặc robot của họ tự động đi thu thập dữ liệu. Nhưng việc tự động chỉ thường diễn ra ở các Website lớn nổi tiếng. Còn đối với các Website nhỏ thì mật độ thu thập dữ liệu, thông tin rất thấp.

Điển hình như Web mình, đa số toàn là mình vô lưu lại mà thôi. Chứ chờ chắc còn lâu lắm mới lưu.

Để dễ hiểu hơn thì bạn vào đây:

Ở đây mình lấy bài viết thẻ Visa của mình ra làm ví dụ:

https://ngoinhakienthuc.com/the-visa-card-va-mastercard-la-gi.html

Còn đây là kết quả khi mình tìm kiếm về bản lưu nội dung của bài viết thẻ Visa trên trang

https://archive.org/web/

Cách tìm kiếm là bạn chỉ cần copy đường link bỏ vô và nhấn nứt BROWSE HISTORY để tìm là sẽ ra giống như link bên dưới.

https://web.archive.org/web/*/https://ngoinhakienthuc.com/the-visa-card-va-mastercard-la-gi.html

Vào đây bạn sẽ thấy thông tin như ảnh sau:

Thông tin bản lưu Internet Archive

Có thể nhìn vào đọc ra những số liệu sau:

Trang này được lưu đến nay là 65 lần từ khoảng thời gian 25/05/2015 cho đến lần gần đây nhất 03/11/2017.

Để có thể xem nội dung các bản lưu bạn hãy chọn năm ở phía trên và kéo xuống dưới. Và chọn thời điểm bạn muốn xem.

Như ở đây mình sẽ chọn thời điểm đầu tiên của bản lưu là ngày 25/05/2015.

Đây là nội dung của bài viết vào năm 2015. Đây là 1 trong những bài viết mình đã viết lúc mới lập ra ngôi nhà kiến thức. Đến nay thì nội dung cũng đã có nhiều thay đổi, giao diện web hiện tại cũng không phải giao diện năm xưa. Bạn có thể vào đây để xem nhé

https://web.archive.org/web/20150525223307/https://ngoinhakienthuc.com/the-visa-card-va-mastercard-la-gi.html

Bài viết này chủ yếu là mình dành để cho các bạn bị dính vụ DMCA. Còn biết đường mà kháng cáo. Cung cấp bằng chứng để chứng minh nội dung Web mình có trước khi bị kẻ xấu kiện cáo.

Còn đối với các bạn làm Seo, hay biên tập thì để bảo vệ nội dung của mình. Thì khi xuất bản 1 bài viết nào mới thì nên lên https://archive.org/web/ và nhìn bên góc phải màn hình sẽ có hình như sau:

Hãy bỏ đường link cần lưu của bạn vào chổ mình gạch đỏ và nhấn nút Save Page để lưu. Như thế là Internet Archive sẽ tự động vào lưu nội dung của bạn lại.

Bản thân mình dùng trang này để sao lưu các nội dung trên các web mà mình thấy hay. Sau này cho dù web đó sập, mình chỉ cần có đường link nội dung để vào tìm lại.

Để thuận lợi cho việc quản lý. Thì mình khuyên bạn nên đăng ký 1 tài khoản ở đây nhé.

Hy vọng qua bài viết Tìm hiểu Internet Archive – Wayback Machine là gì và dùng để làm gì đã giúp bạn tìm hiểu biết thêm về 1 website hữu ích. Cám ơn các bạn đã dành thời gian theo dõi bài viết này của mình. Hẹn gặp lại các bạn ở một bài viết khác của mình nhé.

Thông tin, số liệu trong bài viết có tham khảo sử dụng từ:

https://en.wikipedia.org/wiki/Internet_Archive

https://archive.org/about/

0