NVIDIA представила специализированный чип GB300 для быстрого инференса языковых моделей.
NVIDIA представила GB300 — специализированный чип для инференса крупных языковых моделей. 3-кратный прирост производительности по сравнению с H100.
GB300 разработан с учётом требований современных LLM: увеличенная пропускная способность памяти и оптимизированный KV-кэш.
Первые партии чипов уже поставляются гиперскейлерам.