PHÂN TÍCH CỤM (CLUSTERING): GIẢI MÃ HÀNH VI KHÁCH HÀNG TRONG QUẢNG CÁO DIGITAL

Phân tích cụm (Clustering) là kỹ thuật thống kê giúp nhóm các đối tượng có đặc điểm chung. Trong digital marketing, nó hỗ trợ phân khúc khách hàng dựa trên hành vi, tối ưu chiến dịch quảng cáo. Bài viết tập trung vào K-Means – phương pháp phổ biến để xác định nhóm khách hàng tiềm năng.

Phân tích cụm (Clustering)

Giả sử thương hiệu X đang cần xử lý dữ liệu từ một chiến dịch quảng cáo và muốn phân loại khách hàng theo hành vi của họ để tối ưu hóa chiến lược marketing. Dữ liệu thu được như bảng 1 (Trên hình). Thương hiệu X có thể xử lý dữ liệu thông qua 3 bước như sau:

Case study

Bước 1: Tiền xử lý dữ liệu

Trước khi chạy K-Means, cần chuẩn hóa dữ liệu để đảm bảo tất cả các biến có cùng trọng số khi tính toán khoảng cách. Vì số lần click, thời gian xem trang, số lần mua và doanh thu có đơn vị khác nhau, ta sử dụng StandardScaler để đưa tất cả về cùng một thang đo.

Bước 1

Bước 2: Xác định số cụm K

Phương pháp Elbow Method giúp xác định số cụm tối ưu trong K-Means Clustering bằng cách phân tích sự thay đổi của tổng phương sai nội cụm (WCSS - Within-Cluster Sum of Squares) . Dưới đây là các bước thực hiện cụ thể:

Tính tổng phương sai nội cụm (WCSS - Within-Cluster Sum of Squares) cho từng giá trị K.

- WCSS phản ánh mức độ tập trung của các điểm dữ liệu trong một cụm:

- WCSS nhỏ → Điểm trong cụm gần nhau → Cụm chặt chẽ.

- WCSS lớn → Điểm phân tán → Cụm chưa tối ưu.

Kết hợp chạy K-Means với các giá trị K=1,2,3,4,5.

Xác định điểm “khuỷu tay” (Elbow Point)

Vẽ đồ thị Elbow method với:

- Trục X: Giá trị K (số cụm thử nghiệm)

- Trục Y: Giá trị WCSS tương ứng với mỗi K Quan sát xu hướng giảm:

- Khi K tăng từ 1 → 2, WCSS giảm mạnh (từ 884,369.2 xuống 196,526.5).

- Khi K tăng từ 2 → 3, tiếp tục giảm mạnh (từ 196,526.5 xuống 38,889.33).

- Khi K tăng từ 3 → 4, mức giảm không còn đáng kể (từ 38,889.33 xuống 4,018.5).

- Khi K tăng từ 4 → 5, WCSS về gần 0, nghĩa là mỗi điểm trở thành một cụm riêng lẻ. Như vậy, điểm "khuỷu tay" xuất hiện tại K=3 Có thể phân nhóm khách hàng thành 3 cụm là hợp lý nhất để cân bằng giữa độ chính xác và hiệu quả phân tích.

Bước 2

Bước 3: Ứng dụng kết quả

Theo dõi 3 nhóm khách hàng được phân cụm sau khi chạy K-mean và đưa ra chiến lược điều chỉnh cho phù hợp, đảm bảo tối ưu ngân sách quảng cáo.

Cụm 1 (Nhóm khách hàng ít tương tác - có giá trị thấp): Gồm những khách hàng có rất ít click, ít thời gian xem trang, ít mua hàng hoặc không mua hàng.

Theo Bảng 1 : ID 2 và ID 4 có số click thấp (2-8 lần), thời gian xem ngắn (10-50 giây), doanh thu thấp (0-80$).

Chiến lược: Loại khỏi chiến dịch remarketing để tránh lãng phí ngân sách.

Cụm 2 (Nhóm khách hàng trung bình - có hành vi tương tác khá tốt):

Gồm các khách hàng có số lần click, thời gian xem trang và số lần mua hàng ở mức trung bình (không quá cao, không quá thấp).

Theo Bảng 1 : Khách hàng ID 1 và ID 3 có số click từ 15-30, thời gian xem 120-300 giây, số lần mua từ 3-5.

Chiến lược: Retarget bằng quảng cáo hoặc giảm giá để thúc đẩy hành vi mua hàng.

Cụm 3 (Nhóm khách hàng tiềm năng - có giá trị cao): Gồm những khách hàng có tương tác mạnh, số lần mua hàng cao, doanh thu lớn .

Theo Bảng 1 : ID 5 có 50 click, 600 giây xem trang, 8 lần mua, doanh thu 1000$.

Chiến lược: Retarget bằng quảng cáo hoặc giảm giá để thúc đẩy hành vi mua hàng.

Bước 3

Ready to transform your advertising?

Achieve 3X more conversions with our easy-to-use platform.
  • 200 Advertisers
    are launching campaigns right now
Register to launch campaign

Latest posts

AD BLINDNESS: RÀO CẢN CỦA QUẢNG CÁO HIỂN THỊ

Người dùng ngày càng bỏ qua hoặc không nhận ra quảng cáo khi trải nghiệm nội dung số – hiện tượng này gọi là ad blindness. Đây là thách thức lớn với nhà quảng cáo. Bài viết sẽ giải thích ad blindness là gì, nguyên nhân và cách khắc phục để tăng hiệu quả quảng cáo.

Machine learning: nâng tầm quảng cáo cá nhân hóa với dữ liệu tự động

Machine Learning là công nghệ giúp máy “học” từ dữ liệu và đưa ra quyết định thông minh. Giống như một đứa trẻ, càng tiếp xúc nhiều dữ liệu, nó càng giỏi. Công nghệ này đang được ứng dụng mạnh mẽ trong quảng cáo, từ gợi ý sản phẩm đến cá nhân hóa trải nghiệm.

PHÂN TÍCH CỤM (CLUSTERING): GIẢI MÃ HÀNH VI KHÁCH HÀNG TRONG QUẢNG CÁO DIGITAL

Phân tích cụm (Clustering) là kỹ thuật thống kê giúp nhóm các đối tượng có đặc điểm chung. Trong digital marketing, nó hỗ trợ phân khúc khách hàng dựa trên hành vi, tối ưu chiến dịch quảng cáo. Bài viết tập trung vào K-Means – phương pháp phổ biến để xác định nhóm khách hàng tiềm năng.

12 CHỈ SỐ QUAN TRỌNG TRONG VIDEO ADS

Phân tích đúng các chỉ số giúp tối ưu ngân sách và nâng cao hiệu suất quảng cáo. Bài viết tổng hợp các chỉ số quan trọng trong Video Ads, hỗ trợ doanh nghiệp đưa ra quyết định chiến lược hiệu quả dựa trên dữ liệu.

RIGHT AUDIENCE - TÂM LÝ KHÁCH HÀNG TRONG CHIẾN LƯỢC MARKETING

Khi nhà quảng cáo nhắm đúng đối tượng và đặt quảng cáo trong ngữ cảnh phù hợp, xuất hiện tại thời điểm chính xác, hiệu quả của quảng cáo không chỉ được đo bằng các chỉ số như CTR (tỷ lệ nhấp chuột) hay ROI (lợi tức đầu tư), mà còn tác động sâu sắc đến tâm lý và hành vi của khách hàng.

VIEWABILITY: LÀN SÓNG MỚI ĐỊNH NGHĨA LẠI HIỆU QUẢ QUẢNG CÁO

Đã bao giờ bạn nhìn thấy một quảng cáo xuất hiện ở cuối trang web, nhưng ngay lập tức cuộn lên mà không đọc nó? Hoặc một video quảng cáo tự động phát?

AD PLACEMENT - NGHỆ THUẬT ĐẶT QUẢNG CÁO ĐÚNG VỊ TRÍ THU HÚT ĐÚNG KHÁCH HÀNG

Quảng cáo gây khó chịu là vì xuất hiện sai thời điểm. Đặt quảng cáo đúng lúc, đúng chỗ sẽ tăng giá trị trải nghiệm và hiệu quả tiếp cận. Cùng SmartAds khám phá chiến lược Ad placement để biến quảng cáo thành một phần liền mạch trong hành trình người dùng.

Ad Fraud: lý do các chiến dịch quảng cáo không hiệu quả

Quảng cáo trực tuyến phát triển nhanh nhưng kéo theo nguy cơ gian lận. Với mô hình đấu thầu thời gian thực (RTB), tin tặc dễ thực hiện và che giấu hành vi gian lận. Năm 2019, thiệt hại ước tính 5,8 tỷ USD do thiếu công nghệ bảo vệ và khó phát hiện Ad fraud.

Các loại sai số phổ biến trong A/B testing: các thiên lệch khiến kết quả thiếu chính xác

A/B testing là phương pháp so sánh hai phiên bản khác nhau để tìm ra lựa chọn hiệu quả hơn. Bài viết giới thiệu các loại sai số phổ biến có thể ảnh hưởng đến kết quả A/B testing, kèm ví dụ minh họa giúp hiểu rõ và tránh sai lệch
Sponsored content