4月10日,商汤科技举办2025本事疏浚日行径,重磅推出全新升级的“日日新SenseNova V6”(以下简称:日日新V6)大模子体系,通过多模态长念念维链磨砺、全局挂念、强化学习的本事突破,酿成当先的多模态推理才能,并突破本钱鸿沟。
「日日新 V6」模子才能显赫擢升,在长念念维链、推理、数理、全局挂念方面领有显赫上风,多模态推理才能国内第一,对标OpenAI o1,数据分析才能大幅当先GPT-4o;同期,高遵循与低本钱完整皆集:多模态磨砺举座后果对皆话语磨砺罢了业内最低、推理本钱均罢了业界最低;全新的轻量级全模态交互模子SenseNova V6 Omni带来了国内最强的多模态交互才能;涵盖国内首个守旧10分钟中长视频深度领略的大模子,对标Gemini 2.5 Turbo达到同类型最强。
商汤科技董事长兼首席实行官徐立暗示:“AI之说念,在于庶民之日用。商汤日日新V6将进步多模态鸿沟,开释推理与智能的无尽可能。”
四肢领有超6000亿参数的MoE原生多模态通用大模子,「日日新 V6」罢了了多项本事突破,凭借单一模子就不错完成文本、多模态等万般任务:
长念念维链:卓著 200B 高质地多模态长念念维链数据,最长 64K 念念维链;
数理才能:数据分析才能大幅当先 GPT-4o;
推理才能:多模态深度推理国内第一,对标 OpenAI o1;
全局挂念:率先在国内突破长视频通晓,守旧10分钟的视频通晓及深度推理。
在巨擘的推理才能及多模态才能评测中,「日日新 V6」在多个维度赢得SOTA:
基于卓著200B高质地多模态长念念维链数据,商汤通过多智能体相助进行长念念维链合成和考证,「日日新 V6」酿成了隆起的多模态推理才能,不错守旧合成最长 64K 的多模态长念念维链,守旧模子永劫刻念念考才能。
针对的确环境存在的复杂问题,「日日新 V6」弘远的搀杂图文通晓推理才能,或者匡助用户管理万般问题。
在复杂繁琐的文档处理场景中,「日日新 V6」相同或者以多模态强推理才能管理用户勤快,快来商汤办公小浣熊体验:https://xiaohuanxiong.com/office
以保障理赔场景为例,「日日新 V6」可说明营业医疗保障理赔材料,判断提供材料是相宜理赔条目,查验是否存在乱开药、乱查验、材料缺失或者材料对不皆等问题。
成绩于多模态强化学习的突破,商汤构建了面向多种图文任务的搀杂增强学习框架,基于不同难度分级和多奖励模子的强化学习磨砺。
国内首个!视频通晓冲破10分钟限制,超长本色罢了秒级推理拆解凭借“全局挂念”才能,「日日新 V6」冲破了传统模子仅守旧短视频的限制,可守旧10分钟级视频全帧带领略。
基于弘远的通晓才能,「日日新 V6」还不错对视频的精彩本色进行智能裁剪输出,匡助用户保留迥殊一刹。
商汤自研本事可将视觉信息(画面)、听觉信息(语音、音效)、话语信息(字幕、白话)、时刻轴逻辑进行对皆,酿成多模态长入时序表征。在此基础上通过细粒度级联信息压缩和本色敏锐的动态过滤,罢了长视频的高比例压缩,10分钟视频不错压缩到 16K tokens,仍然保留要道语义。
委果像东说念主一样交互,「SenseNova V6 Omni」发布即罢了多行业落地作陪日日新SenseNova V6的发布,商汤日日新及时交互会通大模子升级至「SenseNova V6 Omni」,在变装上演、翻译点读、文旅导游、教师绘本、数学教师等场景下进行了深度优化。
以翻译点读场景为例,「SenseNova V6 Omni」让用户通过手指就能罢了精确位置的空间交互,并精确通晓局部信息与全局信息的干系,带来更相宜东说念主类天然直不雅的指读交互体验。
「SenseNova V6 Omni」领有更像东说念主的感知和抒发才能、热枕通晓才能,并已在具身智能等限制罢了多行业、多场景落地,成为国内首个营业化的全模态及时交互模子。
One More Thing:满血版“扣问”全量上线,现已通达内测整合日日新SenseNova V6一齐才能,商汤扣问也迎来全面升级,并推出全新扣问APP。用户通过一个进口,即可体验笔墨、图像、视频等多种模态流式交互体验。
扣问APP已开动内测凯发·k8国际app娱乐,现在「日日新 V6」的才能可在扣问Web端体验:www.chat.sensetime.com。