为AI Agent时代筑基,火山引擎多模态数据湖方案重塑数据处理范式

科技 每日财经网

在人工智能技术飞速发展的当下,全球数据总量正以前所未有的速度增长。据预测,到2028年全球数据总量将达393ZB,其中超过80%为非结构化数据。这些遍布在企业各个角落的文本、图像、音视频等多模态数据,如同沉睡的冰山,每年消耗大量IT成本却难以转化为实际业务价值。

面对这一挑战,火山引擎推出的多模态数据湖解决方案,通过存储与计算范式的创新,为企业构建了适应AI Agent时代的智能数据基础设施,助力企业将海量异构数据从“隐性负债”转化为驱动增长的核心资产。火山引擎多模态数据湖方案以“湖存储Lance+湖计算Daft”为核心,针对性解决了非结构化数据处理的痛点。

在存储层,Lance格式支持多模态数据列式存储,实现高压缩比与灵活Schema变更,例如在实际应用中,100G的Tensor数据经Lance压缩后可降至2G,大幅节省存储空间,同时支持冷热分层管理,降低综合成本。在计算层,Daft引擎基于Ray框架实现分布式扩展,原生支持多模态数据类型与GPU/CPU异构调度,通过延迟计算技术减少不必要的IO消耗,使大规模多模态数据处理效率提升最高70%。这一技术组合在智能驾驶、内容审核等场景中表现尤为突出。例如,某头部智驾企业通过该方案替代传统架构,端到端数据处理时间缩短70%,模型训练提速1.5倍,资源利用率从不足30%提升至95%以上,综合成本降至原来的1/4。

为进一步降低多模态数据的开发门槛,火山引擎已于今年8月推出“算子广场”功能,将复杂的AI算法封装为即插即用的标准化算子。该平台提供100余种预置算子,覆盖文档解析、OCR识别、视频抽帧等场景,并支持用户自定义算子开发。通过可视化拖拽编排工作流,企业无需编写复杂代码即可快速构建数据处理流程,大幅减少对专业数据科学家的依赖。在社交平台内容审核场景中,算子广场实现了视频逐帧解析、多模态特征提取与融合判定决策的自动化,大幅提升审核覆盖率,显著降低了人工复审工作量。

随着AI Agent成为企业智能化转型的关键,火山引擎同时推出Data Agent,打造超越传统工具的“企业级AI数据专家”。它不仅能够理解自然语言,更能洞悉业务逻辑,主动发现潜在问题。在复杂的流量归因场景中,Data Agent提升了传统模式下数天甚至数周的分析工作效率,实现了分析门槛的“清零”,真正打通了从数据洞察到业务行动的“最后一公里”。

面向未来,火山引擎计划深化与行业顶尖技术伙伴的合作,将领先的数据平台能力与加速计算技术紧密结合,共同推动高性能AI计算在更多产业落地。同时,方案将持续优化数据新鲜度、响应度与AI原生能力,为行业构建以数据消费为导向的要素化治理体系。在多模态数据成为主流的时代,火山引擎正通过新一代数据基座,为千行百业的智能化升级注入持久动力

✽本文资讯仅供参考,并不构成投资或采购等决策建议(承兑)。

北卡罗来纳州莫里斯维尔--(美国商业资讯)--联想今日宣布推出面向服务器的 Premier Support Plus 服务,这项全新的高端支持服务旨在帮助企业减少停机时间、简化 IT 运维,并确保核心业务基础设施持续可用。该服务专为当下的永…
全新框架降低双边测试复杂度,加快下一代漫游服务上市速度 加州库比蒂诺--(美国商业资讯)--全球领先的分析和网络解决方案提供商Mobileum Inc. (“Mobileum”)今日宣布,公司进一步深化合作,助力GSMA Industry …
芬兰埃斯波--(美国商业资讯)--电信运营商AI原生数字业务支持系统领域的全球领导者Tecnotree今日宣布,在2026年亚洲电信奖评选中荣获阿联酋年度AI项目奖和阿联酋年度数字项目奖。一同获奖的还有Singtel、Mobicom、Tel…