picobot
多用戶 Web Agent — 對話、呼叫工具、操作 workspace、瀏覽網頁,每段對話都跑在隔離沙盒裡。
Max · Personal Side Projects
Agent harness、推論服務與路由、檢索、資料處理、評測、RL 對齊 —— 九個個人 side project,串成一條完整的 LLM pipeline。
Overview
九個 project、八個站
AGENT
多用戶 agent — 工具呼叫、瀏覽、沙盒執行
SERVING · ROUTING
一個入口,路由與管理整個模型 fleet
INFERENCE
TensorRT 加速與動態批次
RETRIEVAL · RAG
單向量 / 多向量混合檢索與重排
TOOLS
統一的 LLM / Embedding / Rerank 介面
DATA
把原始文件變成乾淨的模型輸入
EVALUATION
多任務評測與 LLM-as-judge
ALIGNMENT · RL
用 RL 教模型何時回答、何時棄答
Work
從 agent 到推論服務、檢索、資料處理、評測、RL 對齊 —— 每個專案都是這條 LLM pipeline 上的一站。
Agent
多用戶 Web Agent — 對話、呼叫工具、操作 workspace、瀏覽網頁,每段對話都跑在隔離沙盒裡。
Serving · Routing
一站式部署、路由、監控、評測你的 vLLM 叢集。
Inference
基於 TensorRT 的高效能推論伺服器 — Embedding / Reranker / NLI。
Retrieval · RAG
輕量 RAG 框架 — 單向量 / 多向量混合檢索,不依賴外部資料庫。
Tools
LLM、Embedding、Reranker 的統一介面。
Data Processing
把各種檔案格式轉成 Markdown,餵給下游 LLM。
把 SEC 10-K 年報解析成標準化 JSON — 零 LLM 成本,平均 < 1 秒。
Evaluation
跨任務的 LLM 評測框架 — QA、Tool Calling、G-Eval、RAG。
Alignment · RL
教 LLM 學會「何時回答、何時棄答」— 行為導向 RL,幻覺率降低 65%+。
About
我在學習 LLM、檢索系統與 AI 基礎設施的路上,選擇不只停在理論 —— 而是動手打造真實系統:從推論伺服器、RAG pipeline 到 agent harness 框架。這些專案不求完美或 production-ready,它們誠實記錄我的學習過程與實驗。
What I'm exploring
Skills