打造网上国际投资促进平台 致力于中国投资促进事业
您现在的位置:首页 > 开发区新闻 > 文字新闻
加速生成式AI产业落地
发布时间:2024-04-25    来源:浦东时报

  4月23日,商汤科技SenseTime在其临港智能算力中心举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级日日新SenseNova 5.0(简称:日日新5.0)大模型体系,其综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。

  日日新5.0性能超越GPT-4 Turbo

  自去年4月首次发布,商汤日日新SenseNova大模型体系已正式推出五个大版本迭代。商汤科技董事长兼CEO徐立表示,基于超过10TB tokens训练、覆盖大量合成数据,日日新5.0采用混合专家架构,推理时上下文窗口可以有效到200K左右。

  “妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”面对这一趣味推理问题,日日新5.0快速给出了正确答案。

  徐立介绍,商汤日日新SenseNova大模型体系本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。

  此外,本次日日新5.0另一大核心指标就是多模态能力,商汤多模态大模型的图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单取得领先成绩。

  率先完成“云端边”全栈布局

  交流会上,商汤科技还在业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

  今年是端侧大模型应用的元年,为了满足移动终端用户对大模型技术的应用需求,商汤推出日日新端侧大模型。此外,商汤还推出端云协同解决方案,可以通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过80%,从而显著降低推理成本。

  对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,降低企业应用大模型的门槛。

  商汤科技“文生视频”已在路上

  本次活动现场,商汤还邀请到金山办公、海通证券、小米、阅文集团、华为等生态伙伴,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

  此外,商汤还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。

  在本次技术交流日最后环节,徐立还带来了3段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。

  据介绍,商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。

  通过商汤打造的智能算力中心,可以不断赋能于大模型的训练。据悉,目前,日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得了创新。

上一条:朱芝松走访集成电路设计领域领军企业
下一条:吴金城会见西门子能源高管
与我们联系
  • 联系电话:+86-0512-53660867
  • 传  真:+86-0512-53660867
  • 邮  箱:info@investchn.com
Copyright © 2015-2024 InvestCHN.com All Rights Reserved. 版权所有:投促中国 沪ICP备2023002757号