星环科技Sophon 3.2发布,通过“六易三仓两中心”实现新一代AI平民化

原创
2023/10/31 16:48
阅读数 19
动图封面
 

 

针对目前各行业用户在落地广泛业务需求分析、处理多重数据模态对接、跟进高度定制场景问题解决、运营多源多框架AI模型等方面的问题,星环科技自主研发的一站式智能分析工具平台Sophon在近日的向星力•未来数据技术峰会上推出了3.2版本。

3.2版本的Sophon通过以数据和模型为中心,提供“六易三仓两中心”的功能服务,让用户能够基于自身需求构建紧密贴合其业务场景的新一代AI应用。

六易——实现新一代AI平民化

 

 

Sophon 3.2从数据接入获取、模型构建训练、模型运维管理、模型发布迭代等AI应用全生命周期的相关流程出发,考虑用户可能遇到的问题后,从样本管理、场景开发、模型获得、模型管理、效果迭代及系统运维六大方面降低用户使用的门槛,实现新一代AI平民化。

 

Sophon智能分析工具 v3.2架构图

  • 样本“易”管理:提供样本仓库,实现对数据的精细化管理,输出高质量多模训练数据集。借助自动化、智能化的手段处理原始多模态数据,支持用于训练和评估面向CV/OCR/NLP和大语言模型的数据标注和审核;
  • 场景“易”开发:提供Vlab、Discover、AutoCV多个模块,通过可视化、编程式、流程式的建模服务,以及内置的开源建模框架、自研的Sophon ZenGraph图计算框架、Sophon TS 时间序列计算库及基础机器学习算法库,让建模场景易搭建;
  • 模型“易”获得:提供模型仓库,支持将NLP、OCR、CV、基础机器学习等多框架多源模型进行统一纳管,并在模型上线前提供静态评估,让高性能的模型服务易被挖掘;
  • 模型“易”管理:提供MLOps及XAI模块,支持将高性能模型进行统一可视化部署、统一全方位监控、统一多维度评估;提供一键部署以及可视化的服务推理搭建部署的模式,并从模型调用情况、模型使用资源情况、模型数据偏移情况等方面提供全方位监控,同时从模型预测性能、模型可解释、模型输入输出偏移等方面提供多维度的评估,让模型易管理,全面掌握模型服务运行状态;
  • 效果“易”迭代:提供MLOps模块,当模型产生缺陷,或已不符合模型设计目标时,支持通过可视化页面配置模型迭代的Pipeline流程,实现持续训练(CT)、持续集成(CI)、持续部署(CD)的效果,以保证模型性能持续满足服务要求;
  • 系统“易”运维:支持无需侵入式代码改造的分布式机器学习计算框架Ray、基于GPU池化的GPU分组管理服务、基于Spark on K8s的资源统一调度等,让GPU资源易用、分布式能力易用、系统运维易用。

 

三仓——实现多模态数据管理

 

 

Sophon 3.2基于“三仓一平台”的框架,围绕数据开发全流程,以数据流视角分别建设“样本仓、模型仓和场景仓”,实现全流程、多模态数据的统一纳管。样本仓库:新版本Sophon提供的样本仓功能模块,可实现对数据的精细化管理,输出高质量多模数据,驱动高质量模型的迭代。

样本仓库

 

Sophon样本仓库

样本仓库支持数据接入、智能标签和数据洞察。样本仓库支持文本、视频、图像、时间序列等多模态的数据统一接入和管理;智能标签方面,平台预置2种前沿风格迁移算法、20+多模态数据预处理算法、10+标注类型以及20+灵活的数据增强方式,支持数据准备、生成、标注及扩增等一系列过程;在快速完成原始数据的实体、关系、文本类型、图片设备状态、图片异物状况等要素提取的同时,并建立智能化标签及相关索引,便于精细化查找对应样本数据;此外,针对非机构化数据,结合预置分析模型,自动输出分析报告,帮助用户更清晰的洞察数据质量。

模型仓库

新版本Sophon提供的模型仓库功能模块,作为模型开发与模型应用的中间环节,统一纳管多源模型,让模型管理和应用人员能快速找到最适合业务场景的模型,实现组装与评估输出高质量模型服务。

 

Sophon模型仓库

模型仓库支持对模型的纳管、组装和评估。模型纳管功能支持NLP、结构化二维表、图像、OCR等模型以镜像或文件的镜像一键上架到模型仓库进行统一纳管;模型组装功能支持用户将两个或以上的单任务模型,自由组合形成更贴近需求的多模态模型方案;模型评估功能支持用户在模型部署上线前,在模型仓库种进行冒烟测试,并生成模型测试评估报告,并横向对比多份评估报告,保证输出部署上线高质量的模型服务。

场景仓库

内置场景涵盖营销、风控、KBQA、图谱风险探查、图像检索、内容安全检测等广泛需求,并提供覆盖场景建模分析全流程的平台和工具,让用户通过低代码方式快速构建贴合其业务应用的建模场景。

 

Sophon场景仓库

场景模板内置基于模型和业务的积累,平台预置了面向不同行业领域的应用模板,开箱即用。同时场景模板开放了业务规则的配置能力,实施人员可基于模板在大规模部署落地时,仅修改配置即可。此外,平台提供拉拽的交互方式辅助用户将模型和业务逻辑串联,形成标准场景模板,业务流程支持不同模态的业务流组合分析,场景包可以在平台进行积累,版本管理和迁移。

两中心——实现数据及模型资产的价值挖掘

 

 

Sophon 3.2秉持以数据为中心和以模型为中心的理念,帮助用户将零散的数据和模型进行有效管理,并通过数据资产管理及模型资产管理等手段,实现数据和模型资产的价值迸发。

企业可以通过确定某一使用场景,来倒推需要使用的模型或模型组,从而确定需要收集和训练的数据种类及数据集。面向数据流通场景,星环科技也支持数据安全分类分级、联合分析、数据授权、运营、交付、评估等流通环节的场景。通过数据环、模型环、场景环及流通环建设,企业可以有效降低模型、场景及应用的开发成本,并有效激发团队协作潜能,充分释放数据潜在价值,显著提升应用创新能力。

 

Sophon 人工智能应用建设方法论

为更好地激发AI模型资产价值,Sophon 3.2发布的MLOps模型运营模块,提供大模型的开发/运维工具链,可帮助企业用户快速开发构建领域大模型应用。同时,使用Sophon MLOps进行指令开发和模型微调、对齐,我们开发出了大数据分析大模型SoLar求索,让业务人员在不需要学习和掌握数据库编程语言的前提下自由地按需查询数据。

 

LLM平台阶段性演进图

 

大数据分析大模型SoLar求索的NLP2SQL功能

通过“11项全能”,帮助用户快速构建智能化AI应用

 

 

某制造业客户通过Sophon的AI技术以及视频、图像、时序等多模态数据的联合分析技术,对其生产的钢管材进行缺陷检测识别,支持夹渣、未焊透、未熔合、气孔、裂纹5类基本缺陷类型的识别,并支持新增和识别随着日常的生产不断涌现的新缺陷。

 

工业质检领域钢材缺陷检测流程及效果图

某德国汽车品牌基于Sophon的多模态数据分析能力,盘活了监管机构、来源网站、法规条款(PDF等)等多模态的存量数据,并且通过文本分析、词法分析、纠错和统一转换等文本理解和意图识别模型,实现了数据知识沉淀,以及行业法规条款的自动语义检索和问答,帮助内部员工快速触达监管条款细节,提升效率。

 

法规问答领域法律条款知识问答流程及效果图

Sophon 3.2通过提供六易三仓两中心能力,加之MLOps模型运管模块、AutoCV视觉模型生产应用模块等AI能力支撑,能够保障企业数据到智能应用的落地,实现AI能力平民化、AI价值最大化。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部