星环科技推出知识平台TKH,全面统筹算力、语料、模型与应用
2024-06-03 09:15:06


"大模型技术已快速融入企业生产经营的方方面面,在企业生产效率提升、业务职能提效和行业应用场景创新中无处不在,不但重构产业,打造企业的核心竞争力,而且成为企业的基础设施和核心能力,助力企业打造新质生产力。"在2024向星力·未来数据技术峰会上,星环科技创始人、CEO孙元浩表示,企业据此推出知识平台TKH,全面统筹算力、语料、模型与应用,构建可信赖的AI大模型。
从Data Infra到AI Infra,为企业打造自己的AI基础设施
人工智能大模型正在催生新一轮技术创新与产业变革,也将为金融、制造、交通、政务等众多行业企业数字化转型和高质量发展带来新的动能。
不过,当前市场以通用基础大模型为主,通识能力强,但缺少行业专业知识。将大模型融入千行百业,让企业的AI应用从早期直接调用通用大模型,发展到建立自己的AI基础设施,打造行业或特定领域、任务的专用大模型,助力生产力革新和产业升级,已经成为目前企业关注的核心。
星环科技创始人、CEO孙元浩宣布,星环科技的定位从Data Infra进一步延伸到AI Infra,为企业客户打造AI基础设施,打造从语料处理、模型训练、知识库建设等的一整套的工具链,帮助企业快速建立行业大模型,快速使用AIGC。

从需求上看,目前,通用大模型数量快速增加,并不断升级迭代、提质增效,但是却不能适应企业AI应用的需求。而另一方面,企业对行业大模型需求增加,迫切需要降低使用门槛,更加普惠地使用大模型、生成式AI技术,以解决企业内部人才、算力、数据等不足的挑战。将AGI限制在一个特定领域或者一个行业或者特定任务,不断提升模型准确度,成为一条切实可行的发展途径。
在技术上,生成式AI出现后,深度学习出现了一个重大变化,从以前的可能几千万、上亿的样本数量的大样本机器学习,演变成现在小样本机器学习,让行业大模型应用范围变得更很广,让模型能够思考、学习,能够理解自然语言,能够完成更多的工作。
针对企业的AI Infra建设,星环科技通过自主研发,可以向用户提供一站式企业级大模型生产及应用全流程开发工具链,让大模型快速落地。星环科技拥有从语料到模型再到应用的完整的 AI Infra工具集,覆盖语料开发和管理、大模型训练与持续提升、多模态知识工程、多模知识存储与服务、原生AI应用构建编排和应用服务等重要阶段,提供提示词工程、检索增强、智能体构建等大模型应用快速构建和提升、模型推理优化、模型安全和持续提升技术。
据悉,星环科技AI Infra工具支持异构算力、语料、知识、大模型应用的统一管理,为数据和语料资产的集约化提供了一站式平台,且具备企业级的组织空间管理能力。
推星环知识平台TKH,为企业高效构建AI Infra
IDC中国副总裁钟振山判断认为,未来生成式人工智能的TOP级应用场景将发生在6大领域,分别是艺术设计、数字员工、代码生成、知识管理、市场营销、客户服务。

在知识领域,星环科技整合大数据、人工智能等技术,推出知识平台Transwarp Knowledge Hub(TKH),为企业提供一个全面、高效、智能的数据处理和知识管理解决方案,可以实现企业内部所有资料知识化的目标,并且可以统管企业Al Infra算力、语料、模型和应用,助力企业打造安全可控AI Infra,帮助企业快速使用AIGC。
记者了解到,星环的知识平台TKH包括知识存储与服务、语料开发与知识构建、大模型基础服务等几个重要部分。比如,在存储方面,星环知识平台TKH提供企业级多模态知识存储与服务,助力企业打造新一代一站式多模型数字底座。基于Transwarp Data Hub for LLM知识管理平台的多模型统一技术架构,支持关系型数据、向量数据、全文检索、图数据、时序数据等的统一存储管理,满足各类场景下多模态数据的统一存储管理与服务,大幅简化知识库的知识存储与服务层架构,降低开发与运维成本。
决定行业大模型质量最关键的因素就是语料,语料的质量决定了模型的质量,同时也是解决行业大模型"幻觉"、"可信可控"等核心落地难点的重要手段。星环科技发布了一站式多场景语料平台Transwarp Corpous Sudio(TCS),覆盖了语料获取、清洗、加工、治理、应用和管理的全生命周期,具有多种灵活的采集和构建方式,能分布式的高效处理海量语料。
企业用户利用TKH提供的星环图谱构建工具Transwarp Knowledge Studio for LLM,可以将企业内部数据、个人经验数据和公开信息数据转化为知识,让数据平台更加智能化,同时可以将AIPC端和云端资源联动,确保数据安全性。个人经验数据的知识转化和不断的模型微调让知识库建设更具个性化,真正实现个性化、专家级大模型应用。
星环还推出了大模型基础服务Infinity和LLMOps,让大模型快速落地。基于无涯大模型底座,星环科技微调了三款垂类大模型,包括问答大模型、数据分析(代码生成)大模型和多模态大模型,以应对内容生成、数据分析图片及音视频理解及检索等多样的使用场景。
一问便知,大模型无涯·问知发布
基于无涯大模型,星环知识平台TKH打造了无涯·问知、无涯·问数、无涯·金融、无涯·工程等AI原生应用,可广泛应用于金融、能源、制造、工程等多个领域,通过精准的数据分析和知识管理,满足企业不同类型的知识应用需求,提升企业业务效率和竞争力。
本次峰会上,星环科技最新发布了无涯·问知Infinity Intelligence。这是一款基于星环科技大模型底座,结合个人知识库、企业知识库、法律法规、财经等多种知识源的企业级垂直领域问答产品。无涯·问知充分利用了星环科技自研大模型底座的自动化知识工程特性,使其在处理和分析数据方面具有显著的优势,允许用户上传文档、表格、图片等多源数据,并支持与外部数据源的对接,使用户能够构建属于自己的专属领域大模型。这一创新功能极大地扩展了模型的应用范围和深度,用户可基于自身私域知识库进行更为个性化和深入的数据分析。
无涯·问知AIPC版本同步发布,让知识即刻呈现,让答案值得信赖。无涯·问知AIPC版在实际应用中展现出了五大显著特性,提供了本地化的向量库;支持多种格式、不限长度的文件资料入库,满足了用户多样化的需求;支持影、音、图、文等多模态数据和资料的"知识化"处理,以及相应的"语义化"查询和应用能;自研的RAG模块,实现精准问答;具备出色的数据分析能力,能够对数量化的数据进行精准的分析和研判。
星环无涯·问知正式发布了公有云服务,首批邀请用户已经可以在线测试。另外,无涯·问数是基于星环数据分析大模型,并结合数据分析主体、指标、标签设计、数据开发和治理,形成了从自然语言转数据查询语言,并返回数据表或数据图表的完整流程。在应用场景上,无涯·问数提供分析仪表盘和智能问数能力,让决策者/管理者以自然语言提问快速自助获取目标数据;预定义指标计算口径,依托数据分析大模型理解用户的分析意图,让数据分析人员实现对话即分析;通过页面配置的方式快速完成数据准备,让数据开发人员,快速整合多种数据。