Hệ thống gợi ý hiển thị trang chủ hoạt động như thế nào trên Tmall (9/2019)

Bạn có bao giờ thấy duyệt shopee thì mình ko cần đăng nhập vẫn duyệt ok còn ở Tmall Taobao thì vài giây là nó bắt login tài khoản, ko đăng nhập thì cực khó duyệt sản phẩm -> lý do chính là ở bài viết này

-----------------

Bài viết được mình - Trà Bô lược dịch và viết lại cho dễ hiểu nguồn từ Alibaba Cloud, đây là một trong những bài viết mình rất tâm đắc trong quá trình tìm hiểu về TMĐT Trung Quốc áp dụng vào Shopee / Tiki / Lazada TMĐT Việt Nam. Tác giả là Chen Qiwei -Kỹ sư thuật toán của Alibaba giải thích cách thức hoạt động của hệ thống khuyến nghị trang chủ Tmall, thảo luận về mọi thứ từ đồ thị kiến thức đến hệ thống tính toán neural network.

-----------------

Buổi tối trước khi đi ngủ, bạn bật Tmall lên và bạn lướt từ banner xuống các sản phẩm đề xuất và bạn không hiểu tại sao Tmall lại có thể đưa ra những sản phẩm phù hợp với bạn như vậy. Tmall nhờ các thuật toán đề xuất, dựa vào hành vi của người dùng trong ứng dụng, lịch sử mua hàng, khả năng chi tiêu, thói quen mua hàng để phân phối gợi ý những sản phẩm trong lần hiển thị tiếp theo một cách tối ưu nhất. Tmall đóng vai trò quan trọng trong việc thực hiện và phân phối lưu lượng truy cập của người dùng, cải thiện trải nghiệm mua sắm tổng thể của người dùng và ít nhiều giúp họ tối ưu hiệu quả chi phí, chất lượng và giá trị thương hiệu của các sản phẩm trên Tmall. Nói cách khác, trang chủ Tmall đã trở thành một phần quan trọng để cải thiện trải nghiệm của người dùng trong Tmall.

-----------------

Các loại Trang chủ (homepage)

Có 2 loại trang chủ là trang chủ ngày Siêu Sale ( ngày Campaign) và trang chủ ngày thường. Trang chủ ngày Siêu Sale ví dụ 6.6, 11.11, 12.12.

Ví dụ ảnh 1 bạn sẽ thấy trang chủ thể hiện 7 sản phẩm với trải nghiệm tập trung vào những sản phẩm chủ lực chính của campaign. Khoảng 10 triệu khách hàng sẽ truy cập vào thẳng trang này Thường các slot hiển thị này siêu đắt ở việt nam ngày 12.12 slot đắt nhất lên tới 400tr/ ngày. Và phía dưới là 4 bộ sưu tập liên quan nhất, phù hợp nhất tới khách hàng đó ( 4 trong hơn 10.000 bộ sưu tập chứa tất cả sản phẩm trên sàn )

Ảnh 2 là trang chủ của ngày thường thì show các slot Flash sale / Flash discount / sản phẩm gợi ý và phần mua chung cùng với các tag thành viên cũng những cat mà họ hay vào

Trong những năm trước thì hệ thống gợi ý hiển thị trang chủ của Tmall tập chung chính vào việc tối ưu những sản phẩm liên quan. ví dụ như bạn mua bỉm, click nhiều sp bỉm sữa thì hệ thống sẽ gợi ý thêm các sản phẩm chăm sóc bé thêm như bô, ghế ăn, dinh dưỡng cho mẹ sau sinh. Tuy nhiên bây giờ thì hệ thống gợi ý hiển thị không chỉ tập chung vào sự liên quan mà còn tối ưu rất nhiều đến khám phá và sự đa dạng của gợi ý hiển thị.

Hiệu quả và trải nghiệm người dùng được cân bằng tối ưu trong việc hiển thị của trang chủ dựa vào công nghệ mới như “ graph embeddings, transformers, deep learning, and knowledge graphs” mình cũng chả biết dịch thế nào cho sát đại loại là máy học, dùng trí tuệ nhân tạo, dùng phân tích sâu dữ liệu để áp dụng cho hệ thống gợi ý hiển thị trang chủ của Tmall dành riêng cho từng người dùng. Tất cả những thay đổi đó đều mục đích để tăng được tỷ lệ Click ( CTR) lê của người dùng ngay trong trang homepage lên trên 2 con số ( tức là 100 người thì sẽ có 10-20-30 người click ngay vào 1 sp nào đó trên trang chủ homepage )

-----------------

Khung hệ thống gợi ý hiển thị

 

-----------------

Hệ thống gợi ý hiển thị trang chủ tùy biến theo từng cá nhân của Tmall bao gồm 3 cấu phần

  1. Recall module: Sẽ ưu tiên những thằng top ngành hàng liên quan nhất tới những sản phẩm mà bạn có nhu cầu ( click , xem nhiều, cho vào giỏ hàng)
  2. Sorting module: Tập trung vào những sản phẩm có tỉ lệ Click cao (CTR tốt)
  3. Mechanism module: Kiểm soát, cân bằng trafic , tối ưu hóa trải nghiệm người dùng, thay đổi thuật toán hiển thị và xắp xếp.

Khung hệ thống gợi ý hiển thị

-----------------

Hệ thống gợi ý hiển thị trang chủ tùy biến theo từng cá nhân của Tmall bao gồm 3 cấu phần

  1. Recall module: Sẽ ưu tiên những thằng top ngành hàng liên quan nhất tới những sản phẩm mà bạn có nhu cầu ( click , xem nhiều, cho vào giỏ hàng)
  2. Sorting module: Tập trung vào những sản phẩm có tỉ lệ Click cao (CTR tốt)
  3. Mechanism module: Kiểm soát, cân bằng trafic , tối ưu hóa trải nghiệm người dùng, thay đổi thuật toán hiển thị và xắp xếp.

------------------

Phần 2 này sẽ nói kĩ Recall Module : ranki2i CF và Graph Embedding

The Recall Module

Ranki2i ( item to item collaborative filtering) Hệ thống gợi ý sản phẩm i2i được biết đến là thuật toán được sử dụng rộng rãi nhất. Nó tính toán điểm giống nhau giữa các sản phẩm dựa trên tần suất mà cả 2 sản phẩm được click đồng thời để thu được bảng i2i. Sau đó hệ thống sẽ truy vấn bảng i2i dựa trên hành vi của người dùng để mở rộng các sản phẩm khác mà người dùng quan tâm. Mặc dù thuật toán i2i-CF đơn giản tuy nhiên nó phải được tối ưu dựa trên rất nhiều dữ liệu thực tế và xóa được các dữ liệu nhiễu ví dụ đơn hàng ảo, traffic ảo, xác định khoảng thời gian hợp lý để xác định độ tương đồng cũng như việc suy giảm liên quan theo thời gian. Và đặc biệt chỉ xem xét các cặp sản phẩm cùng danh mục, chuẩn hóa có thể tối ưu hóa thuật toán i2i-CF

Hệ thống sẽ nhân các sự giống nhau (simscore) giữa các sản phẩm bằng tỷ lệ click mục tiêu. Sản phẩm sẽ được hiển thị khi mà sản phẩm đó có điểm giống nhau ( simscore ) đạt trong bảng i2i. Do đó bảng i2i không chỉ xem xét đồng thời CTR đồng thời của cả 2 sản phẩm mà còn xem xét cả CTR khi sản phẩm được hiển thị qua recall

Dựa trên dữ liệu CTR khủng khiếp của sàn và dữ liệu về CTR trong trang chủ, hệ thống có thể tính toán được bảng Ranki2i và lấy đó làm lõi cơ bản cho hệ thống truy suất. Khi người dùng truy cập vào trang chủ Tmall thì hệ thống cơ bán sẽ truy suất vào hệ thống Ali Basic Feature server (ABFS) và sử dụng bảng Ranki2i để lôi ra sản phẩm mà người dùng quan tâm đến

I2i CF tính toán sự giống nhau giữa 2 sản phẩm dựa trên tần xuất cả 2 sản phẩm được click cùng lúc. Nó vừa đơn giản lại hiệu quả cao cho việc xác định sự giống nhau và sự tương quan giữa việc người dùng click vào sản phẩm và các sản phẩm phù hợp của chúng. Ngày nay nó trở thành thuật toán recall được sử dụng rộng rãi nhất. Tuy nhiên thuật toán I2i CF, những sản phẩm gợi ý dựa duy nhất trên lịch sử hành vi của người dùng, không dựa trên khía cạnh thông tin chi tiết sản phẩm . Do đó, kết quả gợi ý sản phẩm sẽ rất yếu khoản khả năng mở rộng khám phá và đặc biệt không hiệu quả với các sản phẩm Longtail ( volume nhỏ bán ít / thị trường ngách ) . Hệ thống gợi ý sản phẩm chỉ cung cấp số lượng hạn chế những sản phẩm có điểm số liện quan cao dẫn đến bị hạn chế việc phát triển bền vững toàn hệ thống với hàng tỷ sản phẩm. Để giải quyết vấn đề này hệ thống có thêm thuật toán S3 graph embedding và Thuật toán MIND.

Graph Embedding

Graph Embedding là một công nghệ máy học chiếu các mạng phức tạo sang không gian đơn giản hơn. Thông thường công nghệ này sẽ vector hóa các nút mạng đảm bảo độ tương đồng của chúng gần với sự tương đồng của dữ liệu , cấu trúc liên hết

Thuật toán S3 Graph Embedding sẽ xây dựng hàng trăm tỷ những kết nối dựa trên hàng tỷ người dùng click vào hảng tỷ sản phẩm. Thuật toán còn sử dụng công nghệ tái tạo lại hành vi của người dùng cùng với việc đọc thông tin sản phẩm dần dần sẽ cải thiện khả năng máy học và có thể cố gắng vector hóa tất cả các sản phẩm trên cùng một nền tảng đo lường được. Vecsto này được sử dụng trực tiếp trong thuật toán I2i- CF để tính độ tương đồng của sản phẩm. Tuy nhiên không giống như thuật toán I2i CF cổ điển, thuật toán S3 Graph embedding có thể tính toán được độ giống nhau của sản phẩm mà không yêu cầu các nhấp chuột click đồng thời của 2 sản phẩm. và nó cũng có thêm các thông tin phụ để xử lý tốt hơn Long tail Product và những sản phẩm Cold-Start product

Dựa trên nền tảng Behemoth X2Vec, chúng tôi sử dụng dữ liệu CTR và thông tin bên sản phẩm trên mạng để xây dựng quá trình nhúng của tất cả các sản phẩm, tính toán biểu đồ nhúng bảng i2i và triển khai bảng trên công cụ cơ bản. Khi người dùng truy cập trang chủ Tmall, công cụ cơ bản truy xuất trình kích hoạt của người dùng từ ABFS và truy vấn biểu đồ nhúng bảng i2i để gọi lại các sản phẩm mà người dùng quan tâm.

Phần Tiếp theo cả nhà (.) Hóng đợi mình nhé

Tác giả bài viết: anh (2) Vũ Minh Trà | Facebook

Bạn đọc có thể đọc nhiều bài viết của anh Trà nhiều hơn ở đây nhé

← Bài trước Bài sau →