08/02/2018, 17:13

Dữ liệu lớn – Big Data là gì?

Big Data hàm chứa lượng thông tin cực kỳ lớn mà nếu trích xuất, khai thác thành công nó sẽ giúp chúng ta có thể thống kế số liệu của một ngành, nhóm ngành, lĩnh vực; dự đoán dịch bệnh sắp xảy ra, thậm chí là xem diễn biến giao thông theo… ...

Big Data hàm chứa lượng thông tin cực kỳ lớn mà nếu trích xuất, khai thác thành công nó sẽ giúp chúng ta có thể thống kế số liệu của một ngành, nhóm ngành, lĩnh vực; dự đoán dịch bệnh sắp xảy ra, thậm chí là xem diễn biến giao thông theo… thời gian thực và “kinh khủng” hơn thế nữa. Vậy khái niệm Big Data, định nghĩa Big Data là gì?.

Big Data là gìBig Data là gì | Khái niệm Big Data | Định nghĩa Big Data

Những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu từ lâu đã được nhà phân tích Doug Laney mô tả bằng ba chiều: tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về chủng loại (variety); nhưng trong giai đoạn hiện nay sự phát triển của “3V” (volume – velocity – variety) cần được bổ sung thêm những dạng xử lí mới có khả năng đáp ứng, khai thác chúng. Big Data ra đời và dưới đây là khái niệm Big Data giải đáp cho câu hỏi đang được quan tâm: Big Data là gì…

[Big Data là gì] Big Data được dịch ra tiếng Việt là “Dữ liệu lớn” – là tập hợp dữ liệu có dung lượng của tất cả các lĩnh vực của đời sống xã hội; chúng vượt mức đảm đương của những ứng dụng và công cụ truyền thống trong việc thu thập, hiển thị, phân phối, quản lý và xử lý. Tương lai xa dữ liệu Big Data là không thể đếm được.

Kích cỡ dữ liệu của Big Data tăng lên từng ngày, tính đến năm 2012 số lượng này có thể nằm trong khoảng vài chục terabyte cho đến vài trăm petabyte (1 petabyte = 1024 terabyte) chỉ dành riêng cho một tập hợp dữ liệu nhất định. Ví dụ: Tập hợp dữ liệu khủng bố, tập hợp dữ liệu ô nhiễm môi trường, tập hợp dữ liệu vũ khí hạt nhân…

TÓM TẮT KHÁI NIỆM BIG DATA LÀ GÌ

– Big Data là Dữ liệu lớn
– Gồm dữ liệu của tất cả các lĩnh vực của đời sống xã hội
– Vượt khả năng đảm đương của các công cụ truyền thống
– Tương lai dữ liệu Big Data không đếm được

Theo những tài liệu của Intel công bố vào trung tuần tháng 9 năm 2013 thì cứ 11 giây trôi đi tổng lượng dữ liệu trên toàn thế giới được tạo thêm 1 petabyte – dung lượng này tương đương với hàng chục tỷ file hình ảnh, *doc, *PDF… đang có trên Internet hoặc tương ứng một video HD dài… 13 năm.

Big Data là gìBig Data gồm dữ liệu của tất cả các lĩnh vực của đời sống xã hội

Big Data ra đời dựa trên yêu cầu tất yếu của quá trình phát triển dữ liệu số trên phạm vi toàn cầu; hầu hết các doanh nghiệp đầu tầu trong lĩnh vực công nghệ như: Microsoft, SAP, EMC, HP, Software AG, Oracle, IBM, Ebay, Amazon.com, Facebook… đều phải quản lý Big Data của mình sở hữu.

Thế nào là Big DataBig Data vượt khả năng đảm đương của các công cụ truyền thống

Hàng ngày trang thương mại điện tử Amazon phải xử lý hàng triệu đơn hàng cùng với hàng trăm nghìn giao dịch phát sinh khác của hệ thống đối tác.  Để có thể “chịu” được khối lượng data siêu khủng mà mình phải xử lý hãng đã huy động ba cơ sở dữ liệu Linux lớn với dung lượng của mỗi cơ sở lần lượt là 7,8TB, 18,5TB và 24,7TB.

Big Data làm gì, Big Data dùng để làm gìTương lai dữ liệu Big Data không đếm được

eBay cần hai trung tâm dữ liệu với dung lượng 40 petabyte để vận hành dữ liệu; 50 tỉ bức ảnh cùng hàng triệu video, dòng trạng thái mà người dùng upload cũng là một con số không nhỏ mà Facebook phải quản lý; Youtube và Google thì phải lưu lại hết các lượt truy vấn cùng vô số thông tin khác.

Với số lượng như vậy quá trình Khai phá dữ liệu (Data Mining) cũng sẽ gặp những khó khăn nhất định, bạn đọc chưa biết thế nào là Data Mining có thể tham khảo bài viết Data Mining là gì mà chúng tôi mới thực hiện.

Big Data làm gì, Big Data dùng để làm gìCác tập đoàn công nghệ phải chi hàng tỷ USD để quản lý Big Data của mình

Dưới đây là một số thông tin về Big Data của Walmart, Twitter, Dịch vụ chuyển phát UPS, Dịch vụ thẻ VISA do tập đoàn SAS tổng hợp và công bố. Chúng rất thú vị và gây choáng ngợp. Hãy cần trọng khi đọc (nhớ cầm máy tính bấm nha).

– Walmart: Năm 2012, trong 4 giờ của ngày “Black Friday” xử lý hơn 10 triệu giao dịch tiền mặt. Tức 5.000 giao dịch mỗi giây.

– Dịch vụ chuyển phát UPS: Nhận khoảng 39,5 triệu yêu cầu mỗi ngày từ khách hàng. Tức 61.000 yêu cầu mỗi giờ. Mỗi giây xấp xỉ 6.100 yêu cầu.

– Dịch vụ thẻ VISA: 172.800.000 giao dịch thẻ được xử lý chỉ trong một ngày.

– Twitter: Mỗi ngày đón nhận hơn 500 triệu dòng tweet mới.

– Facebook: Với 1,15 tỉ thành viên đã tạo ra một khối lượng dữ liệu khổng lồ gồm: văn bản, tập tin, video…

Theo các chuyên gia, nhà chiến lược, tính tới thời điểm năm 2010 tổng giá trị của ngành công nghiệp Big Data đạt hơn 100 tỉ đô la và tăng 10% mỗi năm, nhanh gấp đôi so với tổng ngành công nghiệp phần mềm. Điều đó cho thấy Big Data chính là thách thức cũng như cơ hội lớn của nhiều doanh nghiệp.

Trên đây là khái niệm Big Data mà chúng tôi đã nghiên cứu và biên tập gửi tới bạn đọc giúp giải đáp câu hỏi Big Data là gì, Dữ liệu lớn Big Data là gì, Thế nào là Big Data… Chúc các bạn có nhiều kiến thức bổ ích trên Website Thuatngu.org của chúng tôi.

THM – Nguồn ảnh: Internet

Comments for Facebook

comments

0