• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

hudi系列-changelog的读写

武飞扬头像
矛始
帮助1

1. chanelog模式

在以hudi的MOR表作为flink cdc的源时,出现了一些并非预期的效果。hudi自身支持ChangelogModes#FULL & ChangelogModes#UPSERT 两种模式,从它们支持的RowKind来看,还以为数据写入与读取时 RowKind是一致的,其实不然;另外,如果读写分别使用了不同的模式,那又会产生什么后果,我们应该怎么使用它。

  • 当changelog.enable=true时,为FULL模式,包含的RowKind有:INSERT , UPDATE_BEFORE , UPDATE_AFTER , DELETE
  • 当changelog.enable=false时,为UPSERT模式,包含的RowKind有:INSERT , UPDATE_AFTER , DELETE

2. FULL模式

2.1 写数据

在该模式下,sink端会完整接收上流所有RowKind类型的数据,在hudi内部通过往行记录中增加元数据字段_hoodie_operation,并将该字段的值设置为RowKind的名称( I,-U, U,-D),通过查看生成的rt表和ro表结构,多了一列。

org.

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhghafeb
系列文章
更多 icon
同类精品
更多 icon
继续加载