Đối với một người mới làm quen với khái niệm Business Intelligence (BI) thì tìm hiểu những thuật ngữ liên quan có thể mất không ít thời gian. Vì vậy loạt bài viết này sẽ lần lượt điểm qua những thuật ngữ công nghệ phổ biến nhất của BI.
Các phần khác: Phần 1 | Phần 2
M - Data Mining (Khai thác dữ liệu)
Khai thác dữ liệu là quá trình phát hiện những hình mẫu và mối quan hệ từ một lượng lớn dữ liệu. Đây là một trong những chức năng phân tích chính của business intelligence. Khai thác dữ liệu giúp các doanh nghiệp dự đoán xu hướng tương lai dựa trên thông tin quá khứ.N - Natural Language Processing (Xử lý ngôn ngữ tự nhiên)
Tốc độ phát triển của các ứng dụng điều khiển bằng giọng nói như Amazon Alexa, Apple Siri, và Microsoft Cortana là dấu hiệu cho thấy sự lên ngôi của xử lý ngôn ngữ tự nhiên (NLP), một lĩnh vực công nghệ điện toán tập trung vào sự tương tác giữa máy tính và ngôn ngữ của con người.
Theo hãng tư vấn Gartner, đến năm 2020, 50% số truy vấn phân tích dữ liệu sẽ được tạo ra dưới dạng câu hỏi tự nhiên. Ví dụ, một quản lý có thể chỉ đơn giản là đặt câu hỏi: “Doanh số chia theo từng phân khúc trong quý vừa qua là bao nhiêu?” để nhận được kết quả phân tích phù hợp.
O – OLAP (kỹ thuật xử lý phân tích trực tuyến)
OLAP (online analytical processing) là một công nghệ cho phép thực hiện phân tích dữ liệu đa chiều. Ví dụ, nó có thể cho thấy doanh số trong quý vừa qua của một sản phẩm cụ thể được bán online, và so sánh với doanh số của cùng sản phẩm được bán ở những kênh bán hàng khác.
OLAP là nền tảng công nghệ của nhiều giải pháp business intelligence. Nguồn dữ liệu của nó được tổ chức theo từng khối dữ liệu (data cube) và lưu trữ trong kho dữ liệu (data warehouse). Nếu như những file Excel chỉ lưu trữ dữ liệu theo 2 chiều (hàng x cột) thì OLAP cho phép người dùng xử lý dữ liệu trên nhiều chiều.
Các tác vụ chính của OLAP bao gồm cộng gộp (roll-up), đào sâu (drill-down), xoay trục (pivoting), cắt nhỏ (slicing and dicing). Roll-up là tổng hợp dữ liệu theo một chiều cụ thể. Drill-down cho phép đi sâu vào chi tiết của dữ liệu. Pivoting cho phép xoay khối dữ liệu trong không gian để người dùng có thể nhìn thấy những mặt khác nhau của khối. Slicing và dicing cho phép lấy ra một phần của khối dữ liệu và xem xét nó từ những khía cạnh khác nhau.
P- Predictive / Prescriptive Analytics (Phân tích dự đoán / đề xuất)
Phần mềm business intelligence truyền thống được trang bị công cụ phân tích mô tả (descriptive analytics), tập trung vào việc cung cấp insight về quá khứ để trả lời cho câu hỏi: “Điều gì đã xảy ra?”
Ngược lại, công cụ phân tích dự đoán (predictive analytics) của những phần mềm BI hiện đại hướng đến việc dự báo các xu hướng tương lai và trả lời cho câu hỏi: “Điều gì sẽ xảy ra.”
Phân tích đề xuất (prescriptive analytics) là một bước tiến xa hơn khi tìm cách đưa ra đề xuất hành động thích hợp và dự đoán những kết quả có thể xảy ra. Nó trả lời cho câu hỏi: “Điều gì nên xảy ra?”
Đọc thêm: Grab ứng dụng Business Intelligence trong “siêu bản địa hóa” ứng dụng đặt xe như thế nào?
Q - Query and Reporting (Truy vấn và báo cáo)
Về cơ bản thì một giải pháp business intelligence cũng là một công cụ truy vấn và báo cáo, cho phép người dùng đặt ra câu hỏi (truy vấn) về dữ liệu của mình và nhận lại kết quả được thể hiện trên các bảng thông tin (dashboard) hay báo cáo.
Trong quá khứ, những người dùng không chuyên về kỹ thuật phải nhờ bộ phận IT thiết kế các báo cáo cho mình, và quá trình này có thể mất vài tuần hay thậm chí vài tháng. Phần mềm BI hiện đại cho phép người dùng không chuyên tạo truy vấn và báo cáo mà không cần sự hỗ trợ của bộ phận IT.
R - Real-time Analytics (Phân tích theo thời gian thực)
Phân tích theo thời gian thực có thể cung cấp insight ngay lập tức hay gần như ngay lập tức, trong vòng từ vài giây đến vài phút sau khi dữ liệu được cung cấp. Nó cho phép các quản lý ra quyết định nhanh hơn và phản ứng kịp thời hơn trước những thay đổi của thị trường.
Một số công nghệ nền tảng của phân tích thời gian thực gồm:
- Phân tích trên bộ nhớ đệm (in-memory analytics): những dữ liệu cần được truy vấn được đặt trên bộ nhớ đệm (RAM) thay vì ổ đĩa cứng.
- Xử lý tích hợp trong cơ sở dữ liệu (in-database processing): phân tích dữ liệu không phải là 1 ứng dụng riêng biệt mà được tích hợp vào trong kho dữ liệu.
- Xử lý trên bộ nhớ đệm (Processing in memory): một bộ vi xử lý được tích hợp vào bộ nhớ đệm. Kết quả là một con chip có thể thực hiện một số tác vụ nhất định ngay trong bộ nhớ RAM. Kiến trúc này giúp loại bỏ nhu cầu di chuyển dữ liệu giữa bộ xử lý và bộ nhớ đệm và giảm thiểu độ trễ của hệ thống (latency).