บล็อคสั้น ๆ เล่าวิธีการบังคับให้ LLM ตอบออกมาเป็น json format ที่เราต้องการ
7 July 2024
เล่าการทำ uplift modelling ด้วยวิธีแขนงของ metalearner จ้า ต้องเก็บข้อมูลยังไง ขั้นตอนการทำเป็นยังไง
20 June 2024
เล่าเปเปอร์ Raptor ซึ่งจะเป็นวิธีทำ RAG ให้ LLM สามารถตอบคำถามเกี่ยวกับองค์รวมได้ดึขึ้น
7 June 2024
บทความนี้จะแนะนำให้รู้จักกับ isolation forest algorithm ซึ่งใช้ในการหา outlier หรือ anomaly ใน dataset
27 May 2024
เล่าเปเปอร์ Raptor ซึ่งจะเป็นวิธีทำ RAG ให้ LLM สามารถตอบคำถามเกี่ยวกับองค์รวมได้ดึขึ้น
26 May 2024
ในบทความนี้จะมาเล่า paper ที่ชื่อว่า 'TRAQ: Trustworthy Retrieval Augmented Question Answering via Conformal Prediction' ซึ่งเป็นการทำ conformal prediction กับ RAG และ LLM เพื่อให้มั่นใจได้ว่า LLM จะตอบคำถามผิดไม่เกินกว่า % ที่เราตั้งไว้
25 May 2024
บทความนี้เป็นการทำความรู้จักกับ Conformal Prediction ที่เป็นวิธีการที่จะช่วยให้เราทำนายผลลัพธ์ต่าง ๆ ออกมาเป็น set แทนที่จะเป็นค่า ๆ เดียว
15 May 2024
บทความนี้จะพามารู้จักกับวิธี reinforcement learning อีกแบบหนึ่งนอกจากพวก Q-learning โดยที่ในบทความนี้จะเป็นการ introduce ตัว policy-based reinforcement learning ตั้งแต่ทฤษฏีไปจนถึง coding ง่าย ๆ เพื่อทำงานทดลอง
30 July 2020
บทความนี้จะพูดถึงวิธีการที่ชื่อว่า facenet ซึ่งเอาไว้หา representative vector ของใบหน้าคนด้วยการใช้ triplet loss ซึ่งเราสามารถนำ representative vector นั้นไปทำอะไรต่อได้หลายอย่าง เช่น เอาไปเทียบกันระหว่างสองหน้าแล้วดูว่าเหมือนกันรึเปล่า
25 July 2020
บทความนี้จะพูดถึง extension ของ DQN ที่ชื่อว่า Dueling DQN ซึ่งจะช่วยให้ DQN เรียนรู้ได้เร็วขึ้นด้วยการเรียน value function ของ state และเรียน advantage function แยกกัน เพื่อให้หลาย ๆ action สามารถแชร์ value function กันได้
18 July 2020
บทความนี้พูดถึงวิธีการ augment Data ที่ถูกนำเสนอในเปเปอร์ 'mixup: BEYOND EMPIRICAL RISK MINIMIZATION' ซึ่งจะช่วยให้โมเดลเราทำงานกับข้อมูลแบบ in-between sample (ข้อมูลที่อยู่กึ่งกลางระหว่างสองคลาส) ได้ดีขึ้น ช่วยลดปัญหา overfit ด้วยวิธีง่าย ๆ แต่ใช้ได้จริง
16 July 2020
ในบทความนี้จะเล่าเรื่องปัญหา maximization bias ของ Q-learning ในรูปแบบของนิทานให้ฟัง เพื่อให้เข้าใจง่าย (รึเปล่า ?)
2 July 2020
บทความนี้สรุปมาจากเปเปอร์ 'Deep Clustering for Unsupervised Learning of Visual Features' ซึ่งนำเสนอวิธีในการ classify image โดยที่เราไม่ต้องใช้ labels
3 June 2020
บทความนี้จะพูดถึงการหาว่าแต่ละฟีเจอร์ส่งผลต่อผลการทำนายของแต่ละ instance อย่างไรบ้างด้วยการใช้ LIME
3 June 2020
บทความนี้จะพูดถึง Deep Q-Learning ซึ่งเป็นพัฒนาการสำคัญจาก Q learning โดยการใช้ neural network ในการประมาณค่า Q value แทนที่การเก็บค่า Q ในตาราง
3 June 2020
บทความนี้จะพูดถึง ICE plot ซึ่งเป็นวิธีหนึ่งในการหาความสัมพันธ์ระหว่างฟีเจอร์กับผลการทำนาย ซึ่งต่อยอดมาจาก PDP plot เพื่อให้เราสามารถเห็น heterogeneous effect ได้
28 May 2020
บทความนี้จะทำความรู้จักกับ Partial Depence Plot (PDP) ซึ่งเป็นวิธีในการหาความสัมพันธ์ระหว่างข้อมูลฟีเจอร์กับผลลัพธ์การทำนายไม่ว่าจะเป็น Classification หรือ Regression
3 May 2020
บทความนี้จะพูดถึง Q-Learning ซึ่งเป็น reinforcement algorithm ที่เป็นพื้นฐานของหลาย ๆ reinforcement algorithm ในปัจจุบัน
3 May 2020
บทความนี้จะพูดถึงการฝึกคอมพิวเตอร์ให้แก้ปัญหา Multi-Armed Bandit ซึ่งเปรียบเสมือง Hello World ของ reinforcement learning ก็ว่าได้
3 May 2020
บทความนี้เป็นการทำความรู้จักกับ Reinforcement Learning ว่าคืออะไร ต่างจาก Supervised- หรือ Unsupervised-learning ยังไง และเราจะใช้ Reinforcement Learning ในการแก้ปัญหาอย่างไรได้บ้าง
2 May 2020