12月18日,数据飞轮2.0在2024冬季火山引擎FORCE原能源大会上慎重升级发布。
陆续客岁4月火山引擎发布的数据飞轮“以数据消耗促钞票诞生,以数据消耗助业务发展”的内核,升级后的数据飞轮2.0模式更聚焦把AI算作数智化中枢竞争力,数据坐褥、治理、诓骗等款式全主意交融AI智商,让企业更通俗、更低门槛地消耗数据,诞生钞票,达成价值。
其中,聚焦企业里面职工看数、用数场景,数据飞轮2.0模式下的「Data Fabric驱动下的ChatBI智能体惩办决议」将在智能数据洞悉DataWind原有的当然言语问答基础上合手续深钻,在重构数据坐褥链路的基础上,打造更贴合企业里面各业务数据诓骗民俗的智能体,匡助职工能更高效的得到数据、和会数据、使用数据。
定制业务专属智能体 识别企业里面用数互异
在企业里面的实际使命中,不同行务对数据的需求并不一致。
如兼并份客户数据,销售部门可能保重客户数、成交金额,营销部门则更保重客户属性、东谈主群画像、开首渠谈,此外居品部门还将保重客户量级、居品/作事昌盛度等,数据维度、口径零碎各样。
当年,尽管企业里面职工身份和需求不尽相似,但波及到数据查询,每每齐是在兼并个底层数据库中达成——即便通过当然言语交互的款式裁汰了平素职工的数据查询门槛,但鉴于无法构建针对某一特定东谈主群或团队的常用型数据查询、分析链路,每一次查询齐需要重新将所零散据“跑通”一遍,因此在时效性上弗成餍足职工越来越高的条件。
「ChatBI智能体」将更聚焦企业里面多业务个性化数据查询、分析需求,达成业务专属「智能体」打造。
在企业里面,兼并个职工时常领有多个数据集的查询、分析权限,在不同需求环境的操作下,数据口径有可能出现不一致情况,在追念和疏通数据口径的经过中,容易给上游数据坐褥部门带来相比大真的认注解老本压力。
针对这一问题,智能体不错通过愈加聚焦职工地点的业务及用数特色加以惩办。一方面,通过在智能体中指定官方数据集,先保证职工进行数据消耗的口径一致性,提前幸免跨数据集查询导致的口径“割裂”;另一方面,智能体还复旧建树保举问题和Prompt(领导),概况为职工提供围绕数据查询和分析的针对性作事,餍足职工用数需求。
此外,「ChatBI智能体」还概况采集业务团队的使用场景,关闭无效字段、精湛语义模子,并提供“语义模子建树”,匡助业务团队概况依据实际使用需求,自界说输入大模子字段,达成确凿贴合业务需要的大模子智商部署、提魁岸模子学习成果。
值得一提的是,「ChatBI智能体」还能在使用经过中合手续深钻业务、洞悉业务特征,达成相似业务数据集的规整,抑遏优化明确适用场景,并可复旧对业务常用词、同义词进行网罗和珍摄,在让大模子诓骗愈加贴合业务需求的基础上,把“东谈主”能从基础性使命上摆脱出来,在更中枢的“事”上发达更大价值。
数据坐褥达成NoETL 全主意裁汰数据老本
当业务概况通过「ChatBI智能体」更马上更高频地进行数据消耗后,新的挑战也在产生:
浩繁重迭的数据诞生、难以妥洽的数据口径,以及抑遏攀升的珍摄老本。
为了概况匡助企业快速搪塞这些艰难,全主意裁汰数据老本,数据飞轮2.0模式下的「Data Fabric」弥漫重构了数据坐褥链路,通过逻辑模子取代传统物理模子,让数据坐褥关系变得愈加无邪。
平凡来讲,不错把「Data Fabric」和会为一种架构和时代框架,它能将企业中散布、一身的数据资源,集成到一个妥洽、无邪和智能的数据治理平台中。
这个经过的重心在于达成物理层和逻辑层的诀别,让方针开拓经过更专注于业务逻辑自己,不错拆解为三个方面:
率先,数据不再以固定的物理表款式存在,而是通过逻辑模子界说表之间的干系关系;
其次,系统概况基于界说的基数关系(一双多、多对多等)自动匹协作适的Join模样;
终末,基础方针和派生方针构建了圆善的方针体系,复旧无邪的数据分析。
基于这三方面的智商,「Data Fabric」得以确凿达成NoETL(No Extract, Transform, Load),并可采集业求实际的数据消耗情况抑遏优化包括引擎采用、归天视图在内的物理层达成;同期,简化方针开拓、普及元数据质地、优化查询性能、裁汰存储老本并大幅度省俭开拓运维东谈主力,助力企业从“数据丰富”转向“数据驱动”。
在数据飞轮2.0模式引申的「Data Fabric驱动下的ChatBI智能体惩办决议」中,ChatBI智能体概况和Data Fabric一谈匡助企业建立圆善的智能数据作事体系:
Data Fabric通过语义层和数据模子的整合,重构了数据坐褥关系,在显赫裁汰数据存储和计较老本的基础上,让数据作事变得愈加敏捷;而ChatBI智能体则能更贴合业务个性化需求,通过交互和会、数据造访、分析推理和截至生成四大模块,极大普及业务职工的数据坐褥力,让数据消耗变得愈加约略胜利。
数据炫耀,这套决议在字节越过里面也曾隐敝超越200个分析场景,每天处理超越10万次分析苦求,对等分析时分裁汰了 80%;同期,数据开拓和运维老本也大幅下落。
现在,为了让数据飞轮2.0所袒露的AI智商与决议能更快的在企业中落地,火山引擎也推出了数据飞轮2.0加快斟酌,一方面针对数据诓骗类的AI功能提供了3个月免费试用,让更多企业不错无老土产货去拥抱AI蜕变带来的普惠数据消耗;另一方面,他们也为思要进一步探索Data+AI场景的企业提供了3个月周期的模样制一站式作陪,涵盖企业大模子数据诓骗决议盘算、企业 Data+AI 智商教授、业务陪跑等多个方面,确保企业见效构建并高效启动数据飞轮 2.0。