บล็อคสั้น ๆ เล่าวิธีการบังคับให้ LLM ตอบออกมาเป็น json format ที่เราต้องการ
เล่าการทำ uplift modelling ด้วยวิธีแขนงของ metalearner จ้า ต้องเก็บข้อมูลยังไง ขั้นตอนการทำเป็นยังไง
เล่าเปเปอร์ Raptor ซึ่งจะเป็นวิธีทำ RAG ให้ LLM สามารถตอบคำถามเกี่ยวกับองค์รวมได้ดึขึ้น
บทความนี้จะแนะนำให้รู้จักกับ isolation forest algorithm ซึ่งใช้ในการหา outlier หรือ anomaly ใน dataset
เล่าเปเปอร์ Raptor ซึ่งจะเป็นวิธีทำ RAG ให้ LLM สามารถตอบคำถามเกี่ยวกับองค์รวมได้ดึขึ้น
ในบทความนี้จะมาเล่า paper ที่ชื่อว่า 'TRAQ: Trustworthy Retrieval Augmented Question Answering via Conformal Prediction' ซึ่งเป็นการทำ conformal prediction กับ RAG และ LLM เพื่อให้มั่นใจได้ว่า LLM จะตอบคำถามผิดไม่เกินกว่า % ที่เราตั้งไว้
บทความนี้เป็นการทำความรู้จักกับ Conformal Prediction ที่เป็นวิธีการที่จะช่วยให้เราทำนายผลลัพธ์ต่าง ๆ ออกมาเป็น set แทนที่จะเป็นค่า ๆ เดียว
บทความนี้จะพามารู้จักกับวิธี reinforcement learning อีกแบบหนึ่งนอกจากพวก Q-learning โดยที่ในบทความนี้จะเป็นการ introduce ตัว policy-based reinforcement learning ตั้งแต่ทฤษฏีไปจนถึง coding ง่าย ๆ เพื่อทำงานทดลอง
บทความนี้จะพูดถึงวิธีการที่ชื่อว่า facenet ซึ่งเอาไว้หา representative vector ของใบหน้าคนด้วยการใช้ triplet loss ซึ่งเราสามารถนำ representative vector นั้นไปทำอะไรต่อได้หลายอย่าง เช่น เอาไปเทียบกันระหว่างสองหน้าแล้วดูว่าเหมือนกันรึเปล่า
บทความนี้จะพูดถึง extension ของ DQN ที่ชื่อว่า Dueling DQN ซึ่งจะช่วยให้ DQN เรียนรู้ได้เร็วขึ้นด้วยการเรียน value function ของ state และเรียน advantage function แยกกัน เพื่อให้หลาย ๆ action สามารถแชร์ value function กันได้
บทความนี้พูดถึงวิธีการ augment Data ที่ถูกนำเสนอในเปเปอร์ 'mixup: BEYOND EMPIRICAL RISK MINIMIZATION' ซึ่งจะช่วยให้โมเดลเราทำงานกับข้อมูลแบบ in-between sample (ข้อมูลที่อยู่กึ่งกลางระหว่างสองคลาส) ได้ดีขึ้น ช่วยลดปัญหา overfit ด้วยวิธีง่าย ๆ แต่ใช้ได้จริง
ในบทความนี้จะเล่าเรื่องปัญหา maximization bias ของ Q-learning ในรูปแบบของนิทานให้ฟัง เพื่อให้เข้าใจง่าย (รึเปล่า ?)
บทความนี้สรุปมาจากเปเปอร์ 'Deep Clustering for Unsupervised Learning of Visual Features' ซึ่งนำเสนอวิธีในการ classify image โดยที่เราไม่ต้องใช้ labels
บทความนี้จะพูดถึงการหาว่าแต่ละฟีเจอร์ส่งผลต่อผลการทำนายของแต่ละ instance อย่างไรบ้างด้วยการใช้ LIME
บทความนี้จะพูดถึง Deep Q-Learning ซึ่งเป็นพัฒนาการสำคัญจาก Q learning โดยการใช้ neural network ในการประมาณค่า Q value แทนที่การเก็บค่า Q ในตาราง
บทความนี้จะพูดถึง ICE plot ซึ่งเป็นวิธีหนึ่งในการหาความสัมพันธ์ระหว่างฟีเจอร์กับผลการทำนาย ซึ่งต่อยอดมาจาก PDP plot เพื่อให้เราสามารถเห็น heterogeneous effect ได้
บทความนี้จะทำความรู้จักกับ Partial Depence Plot (PDP) ซึ่งเป็นวิธีในการหาความสัมพันธ์ระหว่างข้อมูลฟีเจอร์กับผลลัพธ์การทำนายไม่ว่าจะเป็น Classification หรือ Regression
บทความนี้จะพูดถึง Q-Learning ซึ่งเป็น reinforcement algorithm ที่เป็นพื้นฐานของหลาย ๆ reinforcement algorithm ในปัจจุบัน
บทความนี้จะพูดถึงการฝึกคอมพิวเตอร์ให้แก้ปัญหา Multi-Armed Bandit ซึ่งเปรียบเสมือง Hello World ของ reinforcement learning ก็ว่าได้
บทความนี้เป็นการทำความรู้จักกับ Reinforcement Learning ว่าคืออะไร ต่างจาก Supervised- หรือ Unsupervised-learning ยังไง และเราจะใช้ Reinforcement Learning ในการแก้ปัญหาอย่างไรได้บ้าง