(vi) Tóm tắt hội nghị RecSys-23

§ Tóm tắt

Dưới đây là toàn bộ điểm nhấn mà mình lĩnh hội được sau 5 ngày tham dự RecSys 23 diễn ra tại Singapore.

§ Ngày 1

Mặc dù tiêu đề của buổi hội thảo đầu tiên nói về học sâu cho dữ liệu thưa, nhưng các bài trình bày khá là thập cẩm với đủ chủ đề khác nhau. Có vẻ vì được tài trợ (và tổ chức) bởi Huawei nên hầu hết các bài đều đến từ tập đoàn này. Xu hướng chung của năm nay (hoặc chí ít từ Huawei) là kết hợp LLM vào hệ thống gợi ý. Một hướng nghiên cứu nữa cũng được quan tâm là kết hợp mô hình đa phương [1] trong hệ thống gợi ý. Điều này cũng dễ hiểu vì hiện giờ người dùng cuối tương tác với hệ thống quảng cáo/gợi ý bằng đa phương tiện: văn bản, hình ảnh, video. Các bài thuyết trình diễn ra chóng vánh bởi sự cố kỹ thuật liên tục (dẫn đến không có thời gian cho Q&A) và quá giờ. Một phần có vẻ Huawei hơi tham lam, dồn nhiều nghiên cứu của mình vào trong buổi workshop này. Không một bài báo nào quá ấn tượng, duy chỉ có bài khảo sát về LLM cho hệ thống gợi ý là đáng chú ý.

Buổi chiều mình dự được 1 phần của CARS, chủ yếu là keynote về LLM. Bài này không gì ấn tượng, và trùng nội dung kha khá với bài khảo sát lúc sáng. Nghiên cứu đề xuất cũng không quá nổi bật.

Lúc sau thì mình chạy sang phần tutorial chủ đề Recommender in the wild vì có Kim thuyết trình (Principal Data Scientist mới của Visenze). Lúc qua thì phần của Kim đã xong, nên mình xem phần tiếp sau, tập trung về Bayesian A/B Testing. Phần này theo mình bám sát thực tế, cũng như đi vào trọng tâm khi phát triển hệ thống gợi ý người dùng. Một điểm quan trọng được nhấn mạnh là sử dụng độ đo như thế nào để sát với mục đích đánh giá, thuyết phục các bên liên quan (stakeholders) về ý nghĩa của độ đo. Từ sáng giờ thì bài về Bayesian A/B Testing là thu hút mình nhất, slides sinh động và diễn giả lôi cuốn người nghe.

Tính tranh thủ xem FashionXrecsys nhưng không có thời gian.

§ Ngày 2

Hôm nay mình xem được vài keynotes tại 2 workshops: ORSUM2023, CONSEQUENCES và VideoRecSys.

Bài keynote từ ORSUM ấn tượng, giàu thông tin, cung cấp cho người xem khái quát về hệ thống gợi ý chuỗi [2] và hệ thống gợi ý theo phiên [3]. Bài nói cũng nêu lên những vấn đề trong việc đánh giá tính hiệu quả của hệ thống, việc các chỉ số không nói lên được sự hài lòng của người dùng và các vấn đề liên quan. Nhiều trích dẫn trong bài liên quan đến đánh giá mô hình theo mình khá hữu dụng.

Sequential recommender: Ví dụ trong giỏ hàng bạn có bánh phở, thịt bò, xương ống thì hệ thống sẽ đoán là bạn đang chuẩn bị làm phở nên sẽ gợi ý bạn mua thêm hành, chanh, gừng hay các nguyên liệu khác để chế biến, cho dù bạn có chế biến với các nguyên liệu đó hay không là 1 chuyện khác 🤣

Session-based recommender: thông tin cho huyến luyện và dự đoán là phiên người dùng ẩn danh, không có lịch sử truy cập của từng account.

Những phần thuyết trình còn lại lần lượt đến từ Youtube Research, Instagram và Netflix rải rác ở workshop CONSEQUENCESVideoRecsys. Theo mình thì ngoại trừ bài của Youtube ra thì cả Instagram và Netflix chất lượng không cao, không tập trung vào vấn đề nào cụ thể. Tuy nhiên vẫn có vài mẫu thông tin hữu ích:

§ Ngày 3

Keynote là một bài PR đến từ Microsoft Research. Không nhiều ấn tượng bởi chủ yếu vẫn xoay quanh những sản phẩm sắp ra lò (Bing AI) mà Microsoft đang tập trung phát triển. Hôm nay là phiên posters đầu tiên, không được nhiều bài quá thú vị (1 phần là do những bài này đã được trình bài trong workshop). Có 1 bài bên Shopee sử dụng graph-based recommender, bên Amazon (JP) phát triển mô hình nền tảng (foundational model) cho hành vi người dùng. Mình xem phiên báo cáo chủ để Click-Through Rate Predictions, 3 bài đến từ Huawei và 1 bài đến từ JD (nhưng JD không trình bày). Không có gì ấn tượng, hoặc là người thuyết trình không cho mình cảm giác là công trình họ có gì ấn tượng. Tương tự với Trustworthy in Recommendation. Phần Sequential Recomendation (SRS) có vài bài thú vị. Một bài sử dụng thông tin sản phẩm[6] đề cải thiện độ chính xác của mô hình. Một bài khác tìm cách giảm kích thước và thời gian truy vấn.

§ Ngày 4

GS. Tat-Seng Chua khảo sát những tiến bộ gần đây của LLM(s). So với phần của Microsoft hôm qua thì bài này thú vị hơn nhiều. Một số hướng nghiên cứu được đề cập bao gồm finetune LLM cho các ứng dụng khác nhau với domain knowledge. Để làm giàu thêm ứng dụng của LLM, GS đề xuất sử dụng RAG (Retrieval-Augmented Generation) nhằm cung cấp, bổ sung thông tin hệ thống LLM, đồng thời sử dụng công cụ ngoài luồng (external tools) cho xác thực nội dung. Một hướng đi cũng thú vị đó là Proactive Dialogs: ChatGPT chủ động đặt câu hỏi lại cho người dùng nhằm cải thiện chất lượng/độ chính xác của thông tin. Vì là hội nghị về mô hình gợi ý, GS cũng giới thiệu những công trình gần đây tận dụng LLM trong hệ thống gợi ý với 2 hướng nghiên cứu chính:

Mình dự phiên trình bày Knowledge & Context. Cả 4 bài được trình bày đều có ý tưởng thú vị (hoặc là do bản thân mình chưa tìm hiểu nhiều về Graph-based Neural Network nên thấy cái nào cũng mới lạ). Buồi chiều mình dự phiên Reinforcement LearningEvaluation. Phần Reinforcement Learning khiến mình buồn ngủ (một phần mình không hiểu vấn đề mà các tác giả muốn giải quyết). Trong khi đó phần Evaluation thì cực hay và lôi cuốn, cả 4 bài trình bày ở phiên này đều chứa thông tin hữu ích và thấu suốt về việc đánh giá các mô hình gợi ý.

§ Ngày 5

Bài keynote đến từ Amazon đầy ấn tượng bởi sự chuyên sâu và đánh vào trọng tâm. Mình khá bất ngờ bởi tính hàm lượng kỹ thuật trong bài nói của phó chủ tịch của amazon. Bài nói xoay quanh một số vấn đề trọng tâm nhưng gợi ý nốt trong đồ thị có hướng (Node recommendations in directed graphs), phản hồi trì hoãn (Delayed feedback), và tính bất định trong mô hình dự đoán (Uncertainty in model predictions). Có lẽ mình sẽ viết một bài riêng mà mình quan tâm trong hội nghị này. Nhiều phiên trình bày của hôm nay thú vị và cung cấp thông tin quan trọng để đánh giá một hệ thống. Một số bài hay ho bao gồm:


  1. Multi-modality - mình không biết dịch sao luôn. ↩︎

  2. Sequential Recomendation. ↩︎

  3. Session-based Recommendation. ↩︎

  4. Phía bên phải màn hình. ↩︎

  5. quảng cáo có thể ảnh hưởng tiêu cực đến trải nghiệm xem của người dùng, dẫn đến sự không hài lòng khi trải nghiệm hệ thống gợi ý ↩︎

  6. như là thuộc tính của sản phẩm, hay danh mục sản phẩm. ↩︎