Dữ liệu lớn (big data) là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp và đa chiều, không có một cấu trúc cố định, không thể lưu theo dòng hay theo cột. Nó có sự chuyển động liên tục theo thời gian thực để tạo thành “dòng dữ liệu”, đến nỗi những công cụ, ứng dụng xử lí dữ liệu truyền thống không thể nào đảm đương được.
Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu phân tích hiệu quả nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực. Điều đó cũng cho thấy giá trị cốt lõi của big data trong nền kinh tế số là rất quan trọng. Và cũng không thể phủ nhận việc thu thập một lượng data lớn theo thời gian thực là khát khao của doanh nghiệp. Nhưng các chuyên gia cảnh báo: chúng ta không nên “lóa mắt” với lượng data lớn mà chưa thật sự hiểu hết về nó, chưa tối ưu khai thác một cách triệt để dữ liệu.
Phần lớn, chúng ta thường phân tích dữ liệu theo một phương pháp lối mòn, hoặc theo cách mà một số doanh nghiệp khác đang áp dụng thông qua các bộ công cụ hiện có trên thị trường như: nhân khẩu học, giới tính, địa lý, thói quen,… Tuy nhiên, để khai thác hiệu quả big data, đối với doanh nghiệp đang hoạt động, điều quan trọng nhất vẫn nên dựa vào mục tiêu cụ thể trong hoạt động kinh doanh. Còn với mục tiêu phát triển ngành nghề, sản phẩm mới cần trả lời câu hỏi tìm được nhu cầu khác biệt gì của khách hàng trong dữ liệu lớn (Big data). Từ đó cải tiến hoặc tạo ra sản phẩm, dịch vụ mới đáp ứng nhu cầu hiện tại và tương lai cho khách hàng.
Ví dụ: Việc phát minh ra xe ô tô điện và tương lai có thể là ô tô bay là điều tất yếu, vì đó là nhu cầu của người dùng trong tương lai. Nhưng để phán đoán được nhu cầu tương lai hoặc ngay cả nhu cầu hiện tại của khách hàng dựa trên big data là điều không hề đơn giản, bởi nguồn dữ liệu lớn không tuân theo một cấu trúc cụ thể như dạng hàng hay dạng cột.
Dựa trên cuộc khảo sát năm 2012 do NewVantage Partner thực hiện với hơn 50 các giám đốc tại các Tập đoàn lớn, cho thấy việc giải quyết sự thiếu cấu trúc dữ liệu quan trọng hơn nhiều so với chuyện xử lý một lượng dữ liệu lớn. Có 30% cho biết vấn đề dữ liệu cốt yếu khiến họ xem xét dữ liệu lớn là “phân tích dữ liệu từ nhiều nguồn khác nhau”, có 22% khác lại tập trung vào “phân tích các loại dữ liệu liên tục”, chỉ có 28% tập trung phân tích những bộ dữ liệu từ 1TB (terabyte) trở lên.
Trong một cuộc khảo sát năm 2013 của Tạp chí Harvard Business Review đối với 1.000 độc giả, có rất nhiều người trả lời rằng họ đã rất quen thuộc với khái niệm dữ liệu lớn. Nhưng trong đó, chỉ có 28% chia sẻ “doanh nghiệp của họ hiện đang sử dụng dữ liệu lớn để đưa ra những quyết định kinh doanh tốt hơn và tạo ra những cơ hội kinh doanh mới”, chỉ 23% cho biết các tổ chức của họ đã có kế hoạch chiến lược cho dữ liệu lớn, chỉ số ít là 6% đồng tình với “tổ chức của họ đang xem xét tầm ảnh hưởng của dữ liệu lớn lên những bộ phận quan trọng trong công ty”. Với con số nhỏ hơn 3,5% cho rằng “Tổ chức của họ biết cách ứng dụng dữ liệu lớn vào kinh doanh”.
Thông qua hai cuộc khảo sát chúng ta có góc nhìn khái quát sơ bộ về dữ liệu lớn và tầm quan trọng của nó đối với từng nhu cầu, sự hiểu biết khác nhau của mỗi cá nhân hoặc của mỗi doanh nghiệp thông qua mục tiêu cụ kinh doanh cụ thể.
Với định hướng đẩy mạnh phát triển nền kinh tế số của Việt Nam, điều mà các doanh nghiệp của chúng ta cần là xác định mục tiêu rõ ràng và có cách tiếp cận cụ thể. Việc xây dựng cấu trúc dữ liệu là bước đi đầu tiên để khai thác hiệu quả, nó quan trọng hơn là việc chúng ta tập trung khai thác số lượng dữ liệu mới liên tục. Bởi lẽ lượng dữ liệu lớn của doanh nghiệp này có khi chỉ là lượng dữ liệu nhỏ hoặc dữ liệu của một bộ phận của doanh nghiệp lớn hơn, chưa kể đến nguồn dữ liệu mới của doanh nghiệp này cũng có thể là nguồn dữ liệu cũ của doanh nghiệp khác. Do vậy, các doanh nghiệp cần đặt mục tiêu quy mô phát triển theo từng giai đoạn, từ đó thu thập nguồn dữ liệu khách hàng tiềm năng dựa trên nguồn dữ liệu mới nhất của mình, để xây dựng cho mình bảng cấu trúc khai thác dữ liệu khách hàng hiệu quả, với mục tiêu cụ thể, nhằm duy trì doanh nghiệp hoạt động thông suốt. Việc mở rộng mô hình, mặt hàng sẽ thực hiện thông qua việc thu thập nguồn dữ liệu mới được phân tích dựa trên cấu trúc khai thác dữ liệu của mình. Mặt khác, việc bồi đắp bảng cấu trúc phân tích dữ liệu là vấn đề nhạy cảm, quyết định lớn đến sự phát triển của doanh nghiệp, cùng với đó nguồn dữ liệu thu thập phải đủ lớn trên thời gian thực cụ thể, có như vậy việc ra quyết định mới chuẩn xác và giảm thiểu tối đa rủi ro cho doanh nghiệp./.