Giải mã ba giai thoại về dữ liệu lớn

Trong kỷ nguyên số, dữ liệu lớn (Big Data) thường được ca ngợi như “mỏ vàng” của doanh nghiệp. Song, nếu nhìn nhận dữ liệu như một công cụ vạn năng, tổ chức có thể rơi vào ảo tưởng, đầu tư lớn nhưng không tạo ra giá trị thực.

BÀI VIẾT LIÊN QUAN

Nhiều học giả đã nhấn mạnh rằng dữ liệu mở ra cơ hội, nhưng cũng tiềm ẩn không ít rủi ro nếu doanh nghiệp tiếp cận chúng với những giả định sai lầm. Tác giả Viktor Mayer-Schönberger và Kenneth Cukier của cuốn sách “Big Data: A Revolution That Will Transform How We Live, Work, and Think” cho rằng dữ liệu lớn không phải phép màu, nếu chỉ dừng lại ở việc quan sát các mẫu tương quan mà không tìm hiểu nguyên nhân, doanh nghiệp có thể rơi vào “bẫy nhận thức”.

Giáo sư Judea Pearl, tác giả The Book of Why nhận định rằng thiếu tư duy nhân quả, dữ liệu sẽ dễ dẫn tổ chức tới những kết luận sai lệch và khó chuyển hóa thành hành động đúng. Ở một góc nhìn khác, nhà toán học người Mỹ – bà Cathy O’Neil – tác giả cuốn sách “Weapons of Math Destruction” đã chỉ ra rằng các mô hình toán học khi áp dụng mù quáng, thiếu kiểm chứng và minh bạch có thể gây ra rủi ro nghiêm trọng và làm xói mòn niềm tin.

Bổ sung cho các quan điểm đó, tác giả David L. Rogers của cuốn sách “The Digital Transformation Playbook” đã hệ thống hóa ba giai thoại về dữ liệu lớn thành ba lầm tưởng phổ biến nhưng nguy hiểm mà nhiều tổ chức từng mắc phải trong hành trình chuyển đổi số. Đây không chỉ là những câu chuyện mang tính cảnh báo, mà còn giúp doanh nghiệp định hình cách tiếp cận dữ liệu đúng đắn: coi dữ liệu là công cụ chiến lược, nhưng phải gắn với bối cảnh, câu hỏi kinh doanh rõ ràng và mục tiêu phát triển cụ thể.

Dữ liệu có tác động lớn đến ngành hàng không trong thời đại số

Giai thoại 1: Thuật toán sẽ giải quyết mọi thứ

Ngộ nhận đầu tiên xuất phát từ niềm tin rằng chỉ cần có dữ liệu lớn và thuật toán mạnh thì mọi vấn đề đều được giải quyết. Trên thực tế, thuật toán chỉ là công cụ; biến dữ liệu lớn thành thứ có ích vẫn cần sự tham gia của các nhà phân tích có kỹ năng. Các thuật toán ngày càng mạnh mẽ trong việc tìm kiếm các lời giải, tuy nhiên chúng vẫn cần con người để đặt ra câu hỏi đúng. Vì thế, quan trọng nhất là các nhà quản lý cần nêu được câu hỏi đúng về dữ liệu.
Một ví dụ nổi tiếng là cuộc thi Netflix Prize năm 2006. Netflix treo giải thưởng 1 triệu USD cho người tạo ra một thuật toán “cải thiện tính chính xác của những dự đoán về mức độ yêu thích của một người khi xem phim dựa trên các lựa chọn phim của họ”.

Đã có một người chiến thắng, khi cải thiện thuật toán 10%. Tuy nhiên, Netflix chưa bao giờ triển khai thuật toán ấy vì mô hình quá phức tạp, tiêu tốn tài nguyên và không phù hợp với môi trường dữ liệu thay đổi liên tục của khách hàng. Câu chuyện này cho thấy một thuật toán “siêu mạnh” chưa chắc đã mang lại giá trị kinh doanh thực tế. Bài học cho doanh nghiệp là hãy bắt đầu từ câu hỏi kinh doanh, không phải từ thuật toán.

Giai thoại 2: Sự tương quan là quan trọng nhất

Giai thoại thứ hai cho rằng trong kỷ nguyên dữ liệu lớn, việc tìm ra các mối tương quan đã đủ để ra quyết định. Ông David Rogers cảnh báo đây là ngộ nhận nguy hiểm, bởi tương quan không đồng nghĩa với nhân quả. Để dễ mường tượng hãy nhìn vào ví dụ thực tế. Ở trường học, vào mùa hè ta thường thấy hai hiện tượng cùng xuất hiện đó là doanh số bán kem tăng, và số vụ đuối nước cũng tăng. Nhưng rõ ràng ăn kem không phải là nguyên nhân gây đuối nước; cả hai chỉ cùng liên quan đến… thời tiết nóng. Đó là sự khác biệt giữa “tương quan” (hai hiện tượng xảy ra cùng lúc) và “nhân quả” (một hiện tượng thật sự gây ra hiện tượng kia).

Trong phân tích kinh doanh, nhầm lẫn giữa tương quan và nhân quả có thể dẫn đến các chiến lược sai lầm. Nếu một công ty bán lẻ chỉ dựa vào dữ liệu tương quan để tung ra chiến dịch marketing, họ có thể nhắm sai đối tượng hoặc bỏ lỡ nguyên nhân thật sự thúc đẩy hành vi tiêu dùng. Theo David Rogers, lối thoát nằm ở việc phân tích dữ liệu. Một nguyên tắc rất đơn giản là nếu doanh nghiệp chỉ đưa ra các dự báo thì sự tương quan về dữ liệu là đủ; nhưng nếu doanh nghiệp tìm cách thay đổi điều kiện tiên quyết, cần biết rằng quan hệ nhân quả cũng tồn tại. Chỉ khi giải mã được quan hệ nhân quả, dữ liệu mới thực sự trở thành công cụ chiến lược.

Giai thoại 3: Mọi dữ liệu tốt đều là dữ liệu lớn

Ngộ nhận thứ ba là nghĩ rằng dữ liệu càng lớn, càng phức tạp thì càng có giá trị. Nhưng trên thực tế, giá trị của dữ liệu nằm ở chỗ dữ liệu giúp giải quyết đúng vấn đề, chứ không phải ở khối lượng dữ liệu. Sự thấu hiểu đầy sức mạnh có thể đến từ việc phân tích và ứng dụng các dữ liệu truyền thống và có cấu trúc hơn so với một “núi dữ liệu” hỗn tạp. Ý nghĩa của chiến lược dữ liệu là phải tạo ra giá trị cho khách hàng và chính doanh nghiệp. Đôi khi chiến lược đó cần đến dữ liệu lớn và đôi khi cũng chẳng cần đến nó.

Trường hợp của UPS là minh chứng điển hình. Thay vì thu thập lượng dữ liệu lớn về mạng xã hội hay cảm biến phức tạp, Tập đoàn chuyển phát lớn nhất thế giới tập trung vào dữ liệu vận hành thiết yếu: điểm dừng, bản đồ, lịch giao hàng, điều kiện giao thông… Từ đó, họ xây dựng hệ thống ORION (On-Road Integrated Optimization and Navigation) để tối ưu hóa tuyến đường cho hàng chục nghìn tài xế. Kết quả rất ấn tượng, ORION giúp mỗi tài xế tiết kiệm trung bình 8–11 km mỗi ngày, giúp UPS tiết kiệm 300–400 triệu USD mỗi năm, giảm gần 38 triệu lít nhiên liệu và hơn 100.000 tấn CO₂ thải ra môi trường.

Ba giai thoại trên cho thấy dữ liệu lớn không phải là chiếc đũa thần. Doanh nghiệp có thể mắc sai lầm nếu quá tin vào sức mạnh của thuật toán, ngộ nhận giữa tương quan và nhân quả, hoặc chạy theo khối lượng dữ liệu mà bỏ quên tính phù hợp. Đối với Vietnam Airlines, việc tiếp cận dữ liệu với tư duy đúng đắn sẽ giúp Hãng tránh rơi vào “cái bẫy” của những giai thoại dữ liệu lớn, đồng thời xây dựng được chiến lược dữ liệu gắn liền với tối ưu hóa vận hành, nâng cao trải nghiệm khách hàng và mở ra cơ hội kinh doanh mới. Đây mới chính là con đường bền vững để dữ liệu trở thành động lực cho chuyển đổi số.

Tài liệu tham khảo

1. David L. Rogers – The Digital Transformation Playbook: Rethink Your Business for the Digital Age
2. Geoffrey A. Moore – Crossing the Chasm: Marketing and Selling High-Tech Products to Mainstream Customers
3. Viktor Mayer-Schönberger & Kenneth Cukier – Big Data: A Revolution That Will Transform How We Live, Work, and Think
4. Judea Pearl & Dana Mackenzie – The Book of Why: The New Science of Cause and Effect
5. Cathy O’Neil – Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy
6. Netflix Tech Blog – “The Netflix Prize and Beyond”
7. UPS Pressroom – “UPS ORION: Driving Efficiency Through Data and Analytics”

Ban CĐSCN
Share bài viết:

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Chào mừng trở lại!

Đăng nhập vào tài khoản của bạn dưới đây

Lấy lại mật khẩu của bạn

Vui lòng nhập tên người dùng hoặc địa chỉ email để đặt lại mật khẩu của bạn.