新闻资讯

九游会体育-九游会欧洲杯-九玩游戏中心官网九游会体育火山引擎多模态数据湖惩处有策动涵盖传统的结构化数据-九游会体育-九游会欧洲杯-九玩游戏中心官网

发布日期:2025-01-05 03:05    点击次数:118

九游会体育-九游会欧洲杯-九玩游戏中心官网九游会体育火山引擎多模态数据湖惩处有策动涵盖传统的结构化数据-九游会体育-九游会欧洲杯-九玩游戏中心官网

九游会体育-九游会欧洲杯-九玩游戏中心官网九游会体育

12月18日,数据飞轮2.0在2024冬季火山引擎FORCE原能源大会上负责升级发布。

延续旧年4月火山引擎发布的数据飞轮“以数据忽地促财富配置,以数据忽地助业务发展”的内核,升级后,数据飞轮2.0方式更聚焦把AI手脚数智化中枢竞争力,通过AI时间促进更普惠的企业数据忽地。

围绕数据飞轮2.0方式的升级,火山引擎数智平台VeDI同步发布了多模态数据湖惩处有策动。

跟着大模子的发展和应用,文本的界限被拓宽,图像、视频、语音各样模态浮现,并给数据陆续、检索、贪图带来宏大挑战。火山引擎多模态数据湖惩处有策动则可驱散海量结构化、半结构化及非结构化数据的调和邃密化陆续,全概念兼容各样数据阵势,为LLM预考试、执续考试和微调全程各个阵势提供更好的数据支执。

    

火山引擎多模态数据湖惩处有策动架构图

从数据源来看,火山引擎多模态数据湖惩处有策动涵盖传统的结构化数据,如企业日常运营产生的表格、日记工作以及各样数据库;也包含半结构化数据,如在互联网交互中常见的 JSON、XML、CSV 阵势数据以及通过 API 接口得回的数据;更有非结构化数据,如海量的文本良友、丰富各样的图片、各样音频片断以及视频文献等。这些数据源通过全域数据集成 DataSail 进行无缝整合,冲破数据孤岛,晋升利用后果。

在统共这个词架构底层,数据湖绽开存储 TOS 以其坚韧的兼容性,支执 Paimon、Iceberg、Hudi 等多种数据湖阵势,不管是文本、图片、音频、视频仍是向量数据,齐能驱散高效存储与陆续。

在数据湖陆续方面,LAS具备元数据、数据集陆续、数据权限陆续等才能,并具备近贪图与近存储加快特点,保险数据湖应用启动。同期依托数据贪图和存储的 E-MapReduc、流式贪图 Flink 和 擅长OLAP处理的ByteHouse 等多元贪图引擎,企业不错把柄本人需求进行汲取,幽闲不同场景下复杂的数据处理条目。在表层数据开辟阶段,大数据研发治理DataLeap提供始创的找数助手、开辟助手、运维助手等智能化才能,裁减企业数据财富检索和数据开辟的使用门槛。

最终,海量数据经由多模态数据湖的集成、存储、贪图和分析,输出给 Data Agent、生意智能、LakeHouse、常识库等下流应用场景,工作于企业科学决策。

现在,火山引擎多模态数据惩处有策动已正常应用在泛互联网、汽车等行业,并取得实效。

以某聚焦于智能网联汽车的科创公司为例,领先该公司使用自建开源大数据平台支执车联网数据集结、加工及分析,但存在及时离线数据割裂、数据膨大、系统厚实性低等问题。

通过引入火山引擎多模态数据湖惩处有策动,该公司将火山引擎E-MapReduce手脚数据湖 OLAP 引擎,构建兼具离线、及时的湖仓一体架构,并哄骗其存算分手架构应酬高膨大增量数据,在确保贪图性能 SLA 厚实的同期,告捷将珍惜老本降为零;还进一步借助全域数据集成DataSail 驱散OLAP、OLTP 两种不同负载条目的任务分手,保险了工作的可用性。最终在数据处理实效性晋升为秒级的基础上,资源老本还裁减了30%。

数据已成为AI算法模子发展和演进的“燃料”。而火山引擎数据飞轮2.0及多模态数据湖等系列惩处有策动的发布,必将匡助企业晋升数据利用后果,创造业务改变与发展的一个又一个“燃点”。