karellen-kim — 학습 노트

005

Uber Search Platform

Uber 검색 플랫폼 자체에 대한 종합 정리. Elasticsearch → Sia(BSL 람다 + Kafka pull) → OpenSearch(Project Sunrise)의 10년 궤적. Pull-based 인제스천 · active-active multi-region · Spark 벡터 파이프라인 · blue-green 배포 · gRPC 도입까지 — 4개 원문 종합.

Uber Blog · 2025~2026 작성 · 2026.05.20 읽는 시간 18분 →

004

Uber Delivery Search Platform

Uber Eats의 billion-scale 시맨틱 검색 정리. QWEN 백본 two-tower + Matryoshka 임베딩으로 -50% 저장, int7 양자화로 -50% latency, boolean pre-filter로 99% 후보 제거. ANN보다 사전 필터가 더 큰 영향이었다는 교훈.

Uber Blog · 2026 작성 · 2026.05.20 읽는 시간 13분 →

003

Recursive Multi-Agent Systems

arXiv 2604.25917 정리. agent 간 통신을 텍스트가 아니라 latent vector로 — 9개 벤치마크에서 토큰 75% 절감, 속도 2.4x, 정확도 +8.3%. RecursiveLink와 inner-outer 학습 루프까지.

arXiv · 2026 작성 · 2026.05.17 읽는 시간 11분 →

002

Multi-Agent Research System

Anthropic 엔지니어링 글 정리. Lead–Subagent 아키텍처, 토큰 15x 경제학, LLM judge 평가, 프로덕션의 heisenbug · rainbow 배포까지 — 멀티 에이전트를 실제로 운영한 사람들의 교훈.

Anthropic · 2025 작성 · 2026.05.17 읽는 시간 14분 →

001

Building Effective Agents

Anthropic 리서치 글 정리. 워크플로우 5패턴과 에이전트 루프, Augmented LLM 빌딩블록, ACI 설계까지 — 그림과 Python 코드로 다시 풀어쓴다.

Anthropic · 2024 작성 · 2026.05.14 읽는 시간 12분 →