发布时间:2025-06-07 21:51:42 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于企业做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于企业来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽企业 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表企业)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为企业进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足企业从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对企业来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让企业用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有企业开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为企业重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外企业计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网企业,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是关于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

专家建议在刑法上对代孕作出明确禁止性规定

「活动」MageyydsyidingNb25

90.24MB
版本V50.4.66
下载秦时明月荆轲外传下载安装你想要的应用 更方便 更快捷 发现更多
喜欢 38%好评(07630人)
评论 50
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 83779.73445MB
  • 最后更新: 2025-06-07 21:51:42
  • 最新版本: V3.13542.7
  • 文件格式: apk
  • 应用分类:ios-Android 人❌与善🔞交x㊙️uanwen欧美
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 9.14069以上
应用介绍
一,4hu 地址一 地址二,亚洲AV秘无码一区宫下华奈
二,同❌城单身交🔞友㊙️群,火影二创免费观看网站
三,乳❌胶紧身🔞衣被㊙️困在绞刑架上视频,F❌ree🔞 Gay bear XXX Be㊙️ars
四,女系家族风车动漫,sp挨打姿势图片大全
五,❌18号🔞和龟派㊙️仙人,亚洲成色www成人网站妖精
六,博人把雏田狂,❌被喂饱的室友(H🔞)体育生㊙️,myuu8儿童色
七,www.543ev.com
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V2.5.23
关注公众❌号🔞平台㊙️
  • 欲成欢医生帮帮我类似

    小戳到视频

    男❌人手伸进🔞我内裤揉到㊙️爽

    42921.13MB
    107好评

    ❌Porno HD v🔞ideo 365HD㊙️

  • ❌日本医院护士集🔞体㊙️献身取精

    ryⅠs❌Ky🔞aγt少妇人㊙️体欣赏

    呆妹儿小霸王7分百度云

    40707.13MB
    493350好评

    他用舌❌头伸进我的🔞下㊙️身

  • 二次元之穿越龙王传说

    佐助把❌小樱玩🔞弄到㊙️高潮文

    四川少妇性做爰XXXⅩ

    13.84MB
    319好评

    日本少妇喂男人奶A片

  • 邪❌恶道※🔞琉璃社A㊙️CG鬼灭之刃

    18giantess漫画

    亚洲人惩罚拍击打屁股网站

    53.89MB
    272好评

    末世种田饥荒空间屯粮

  • ❌瓦罗兰特同人🔞本子无遮㊙️掩

    男女羞羞刺激免费网站

    你真紧今晚我让你爽个够视频

    71.52MB
    707好评

    ❌玖辛奈扒开屁股让我爽🔞了㊙️一夜

  • 上司人❌妻互换H🔞D㊙️无码中文字幕

    四虎海外永久地址www4hutv

    免费无遮挡视频网站春

    83.32MB
    333好评

    《❌韩🔞国激情大合集》1集在线㊙️观看

  • 黄网视频在线观看地址免费观看视频

    情欲AV

    少妇A❌V偷拍🔞视频网站㊙️导航

    23.24MB
    108好评

    小荡货好紧好爽奶头好大动漫

  • 火影很汰网站 汉化

    国产乱妇交换做爰XXXⅩ麻豆

    gv免费网站

    50.43MB
    921好评

    ❌火影之博人后🔞宫无极㊙️~

  • ❌攻放在受里面🔞不出来㊙️

    杭州九堡站街妇女地点

    [中文][3d全彩]超母体退化

    83.37MB
    566好评

    快乐风男青旅muleicuiGAy

  • AI国漫❌女🔞神100‰裸体㊙️无遮挡

    妺妺扒开毛毛让我添久久久

    全h做到哭的广播剧网盘

    83.01MB
    751好评

    韩国❌三级巜交🔞换㊙️做爰

  • 饭桌上故意❌张开🔞腿让㊙️公

    亚洲人做受高潮游戏

    超❌美脚パンストo丝🔞袜㊙️脚责

    39.20MB
    2302好评

    oldmandaddies

  • furry老虎猛交大肉自慰

    我去干

    ❌木🔞叶村人㊙️妻堕落传1至5

    78.41MB
    244好评

    超碰在线

  • 宝可梦女性角色裸妆

    揉着我的奶从后面进去视频

    重生之都市修仙古风漫画免费下拉式六漫画

    65.96MB
    746好评

    火凤凰之猎艳系统

  • 不良研究所-永久导航

    沦为玩具的校花清雅夏

    ❌吉🔞赛尔换㊙️脸被 c

    54.76MB
    753好评

    百炼成仙漫画全集免费

  • 借贷宝视频百度云

    好爽好紧宝贝夹住尿里了动漫

    刻晴爆乳18禁动漫视频

    57.82MB
    688好评

    韩国美女写出真

  • ❌成🔞人沐浴露㊙️男士专用

    免费A片视频

    寂寞的妻子西瓜影音

    24.06MB
    356好评

    ❌重🔞口虐㊙️羞辱贱奴便器调教

  • 扒开腿挺进肉蒂抽搐喷

    黄瓜视❌频成人🔞版㊙️app

    ❌调教小男🔞娃的小嫩茎㊙️小说

    13.06MB
    311好评

    ❌被宠物🔞开双腿强㊙️行侵犯视频

  • 在浴室打屁股ThePorn

    金子美穗视频第20集

    美女扒开内裤羞羞网站

    84.05MB
    214好评

    黑瓜吃料每日最新爆料

  • 12脱了内裤自慰在无码

    性裸交巴西公共洗澡

    调❌教小鲜肉🔞捆㊙️绑男男gv视频

    45.25MB
    738好评

    漫画名❌:纯洁的轮舞🔞 作者:三重㊙️野瞳

  • 羞羞视频网站

    国语对白做受69

    男c男黄秘网站

    10.33MB
    185好评

    1❌3小箩莉洗澡无码🔞视频网㊙️站

  • 貂蝉被到爽羞羞漫画网站

    免费无码婬片AAAA片软件推特

    ❌可莉🔞动画㊙️

    44.53MB
    369好评

    大象视频成人在线观看

  • 逃跑囚禁by渊清

    绝区零艾莲被爆黄漫

    窗外的窗百度云网盘

    91.17MB
    206好评

    ❌国产乱婬🔞AV片免费fu㊙️rry

  • bondagecafe资源

    嗯~啊~快点死我韩漫无码

    她被撞得开始呻吟起来视频

    30.10MB
    906好评

    欧美xx久久久久7773

  • 女儿的奶粉水txt

    鞠婧祎❌自🔞慰出水㊙️网站

    百度电影盒子

    30.54MB
    542好评

    公主被❌侍卫🔞扒开双㊙️腿H

  • 美❌女被🔞绑男人亲㊙️

    朴智妍三级无删减视频

    挺进她❌的🔞花苞㊙️⋯啊太深了明星小说

    29.79MB
    126好评

    暴走看书林雨薇禽兽

  • ❌狛🔞枝日向创本㊙️子黄

    打开女人两条腿图片

    国模小彤大尺度写真

    70.71MB
    457好评

    琴女h❌18r禁黄同人🔞本子㊙️

  • 看黄片软件GA❌Y FUC🔞K BIG ㊙️COCKS title="XXNX中国免费" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    18色AV

    留守村长的艳福秦二柱

  • qq简约皮肤爆浆失禁漏尿吃巴 title="免费成人深夜天涯" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    男模隐私秘视频无内裤

    免费黄片下载

  • 误惹高冷总裁苏清然科❌特🔞迪瓦1-㊙️0布隆迪 title="www.4444ai.com" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    甘露❌ 裸🔞体㊙️

    动漫爽又黄免费视频

fuqer100%v2025 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • 男男Gay肉受被C哭灌肠 6天前
    被别人❌录🔞了视频怎㊙️么解决
  • 小戳进去无遮挡麻豆 0天前
    剥开❌尿孔虐铃口男男🔞小㊙️说
  • 夏尔米和三个小男孩 3天前
    147❌人体🔞白丝袜图片尺㊙️寸
  • 丰满多毛❌的🔞大陰户㊙️毛茸茸 3天前
    免费手机欧美站长查询在线视频
  • mofos12欧美 0天前
    爽⋯好大❌⋯快🔞⋯深一触㊙️小说
  • 裸体缪斯202❌1未🔞删㊙️减版在线观看 0天前
    Chinese❌ 91🔞 Porn vid㊙️eo
  • 人上人电影网永久入口 5天前
    少妇❌被又🔞大又粗又爽A㊙️片软件
  • 元气缘结神第三季资源 6天前
    王❌馨瑶绝版写真集🔞必应㊙️
  • 花木兰裸乳被爆白浆 4天前
    调教女仆 v1.0 ❌安卓版破解🔞版㊙️
  • 伊甸园一二三四 1天前
    中国猛少妇