Tin Tức

Big Data là gì?

Big Data là gì?

Big data (Dữ liệu lớn) là một thuật ngữ mô tả khối lượng dữ liệu lớn – có cấu trúc và không có cấu trúc – sẽ tràn ngập một doanh nghiệp hàng ngày. Nhưng nó không phải là lượng dữ liệu quan trọng. Đó là những gì các tổ chức làm với dữ liệu quan trọng. Dữ liệu lớn có thể được phân tích để có những hiểu biết sâu sắc dẫn đến các quyết định tốt hơn và các bước đi kinh doanh chiến lược.

Lịch sử Big Data và các cân nhắc hiện tại

Mặc dù cụm từ “Big Data” là tương đối mới, nhưng hành động thu thập và lưu trữ một lượng lớn thông tin để phân tích đã diễn ra từ lâu. Khái niệm này xuất hiện vào đầu những năm 2000 khi nhà phân tích ngành công nghiệp Doug Laney đưa ra định nghĩa chính xác về Big Data qua 3 chữ V:

  • Volume (khối lượng): Các tổ chức thu thập dữ liệu từ nhiều nguồn, bao gồm các giao dịch kinh doanh, phương tiện truyền thông xã hội và thông tin từ dữ liệu cảm biến hoặc thiết bị này tới thiết bị kia. Trong quá khứ, lưu trữ nó sẽ là một vấn đề – nhưng với các công nghệ mới (như Hadoop) đã giảm bớt gánh nặng phần nào.
  • Velocity (Tốc độ): Các luồng dữ liệu ở tốc độ chưa từng thấy và phải được xử lý kịp thời. Thẻ RFID, cảm biến và hệ thống đo sáng thông minh đang thúc đẩy nhu cầu xử lý các torrent dữ liệu gần thời gian thực.
  • Variety (Đa dạng): Dữ liệu có trong tất cả các loại định dạng – từ dữ liệu có cấu trúc, dữ liệu  trong cơ sở dữ liệu truyền thống sang tài liệu văn bản phi cấu trúc, email, video, âm thanh, dữ liệu mã cổ phiếu và các giao dịch tài chính.

Ngoài ra, chúng ta xem xét thêm hai chiều hướng khi nói đến dữ liệu lớn:

  • Variability (Sự biến đổi): Dữ liệu cũng gia tăng đột biến theo mùa, đôi khi cũng khiến chúng ta khó khăn trong việc thu thập dữ liệu vào những đợt cao điểm. Thậm chí nhiều hơn như vậy với dữ liệu phi cấu trúc.
  • Complexity (Phức tạp): Dữ liệu ngày hôm nay đến từ nhiều nguồn, làm cho việc liên kết, so khớp, làm sạch và chuyển đổi dữ liệu trên các hệ thống rất khó khăn. Tuy nhiên, cần kết nối và tương quan các mối quan hệ, phân cấp và nhiều liên kết dữ liệu hoặc dữ liệu của bạn có thể nhanh chóng thoát ra khỏi sự mất kiểm soát.

Tại sao dữ liệu lớn lại quan trọng?

Tầm quan trọng của dữ liệu lớn không xoay quanh số lượng dữ liệu bạn có, nhưng bạn sẽ làm gì với nó. Bạn có thể lấy dữ liệu từ bất kỳ nguồn nào và phân tích nó để tìm câu trả lời cho phép giảm chi phí, 2) giảm thời gian, 3) phát triển sản phẩm mới và dịch vụ được tối ưu hóa, và 4) ra quyết định thông minh. Khi bạn kết hợp dữ liệu lớn với các phân tích mạnh mẽ, bạn có thể thực hiện các tác vụ liên quan đến kinh doanh như:

  • Xác định nguyên nhân gốc rễ của sự cố, sự cố và khiếm khuyết trong thời gian gần.
  • Tạo phiếu giảm giá tại điểm bán hàng dựa trên thói quen mua của khách hàng.
  • Tính lại toàn bộ danh mục rủi ro trong vài phút.
  • Phát hiện hành vi gian lận trước khi nó ảnh hưởng đến tổ chức của bạn.
Leave a Comment (0) ↓