Uber 검색 플랫폼 자체에 대한 종합 정리. Elasticsearch → Sia(BSL 람다 + Kafka pull) → OpenSearch(Project Sunrise)의 10년 궤적. Pull-based 인제스천 · active-active multi-region · Spark 벡터 파이프라인 · blue-green 배포 · gRPC 도입까지 — 4개 원문 종합.
Uber Eats의 billion-scale 시맨틱 검색 정리. QWEN 백본 two-tower + Matryoshka 임베딩으로 -50% 저장, int7 양자화로 -50% latency, boolean pre-filter로 99% 후보 제거. ANN보다 사전 필터가 더 큰 영향이었다는 교훈.
arXiv 2604.25917 정리. agent 간 통신을 텍스트가 아니라 latent vector로 — 9개 벤치마크에서 토큰 75% 절감, 속도 2.4x, 정확도 +8.3%. RecursiveLink와 inner-outer 학습 루프까지.
Anthropic 엔지니어링 글 정리. Lead–Subagent 아키텍처, 토큰 15x 경제학, LLM judge 평가, 프로덕션의 heisenbug · rainbow 배포까지 — 멀티 에이전트를 실제로 운영한 사람들의 교훈.
Anthropic 리서치 글 정리. 워크플로우 5패턴과 에이전트 루프, Augmented LLM 빌딩블록, ACI 설계까지 — 그림과 Python 코드로 다시 풀어쓴다.