Яндекс Метрика
Компьютерное зрение, Мультимодальная модель, Языковая модель

SenseChat-Vision V4

SenseTime
Self-driving carВизуальные ответы на вопросыFace recognitionГенерация текстаImage captioning

SenseChat-Vision V4 — это мощная мультимодальная ИИ-модель от SenseTime на 30 млрд параметров, которая обошла GPT-4 в тестах на понимание визуального контента. Она идеально подходит для беспилотных систем и распознавания лиц, обеспечивая глубокий анализ изображений и текста.

Multimodal AI represents a pivotal phase in the evolution of large AI models. SenseChat-Vision V4, the large multimodal model ("LMM") powered by 30 billion parameters and world-leading image and text comprehension abilities, tops the comprehensive score of MME Benchmark (2199.5 vs GPT-4's 1926.57), an authoritative test for LMMs. SenseChat-Vision V4 enables a wider array of industrial upgrades through practical applications, such as intelligent driving, smart cabin, and the power industry.

Что такое SenseChat-Vision V4?+
Кто разработал SenseChat-Vision V4?+
Какие задачи решает SenseChat-Vision V4?+