Artwork

Nội dung được cung cấp bởi Aiven. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Aiven hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.
Player FM - Ứng dụng Podcast
Chuyển sang chế độ ngoại tuyến với ứng dụng Player FM !

Hot and cold data with Apache Kafka, Tiered Storage, and Iceberg

48:58
 
Chia sẻ
 

Manage episode 429150924 series 3575842
Nội dung được cung cấp bởi Aiven. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Aiven hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

Utilizing the true potential of data streaming is key to business success.

In this Data (R)evolution episode, we're joined by Josep Prat and Filip Yonov to dive into the transformative features of Apache Kafka and its evolving role in data architecture. They discuss the critical importance of collaboration and feedback in enhancing Kafka's capabilities, the future of "lake house" technology, exciting updates from the Open Source Program Office (OSPO), and the importance of Kafka's readiness to support evolving data formats—making it a backbone for modern data ecosystems.

Key Takeaways:

  1. Community collaboration and contribution are essential for the continuous improvement and testing of Apache Kafka's capabilities
  2. The evolution of Apache Kafka into a more versatile platform, combined with object storage and open table formats, can significantly enhance real-time data streaming, analytics, and the future of "lake house" technology
  3. Tiered storage in Kafka facilitates more efficient and cost-effective data management by decoupling storage from computing

Resources:

Timestamps:

[05:49] Kafka servers have theoretical storage limits

[09:29] Test storage proposal process for Apache Kafka

[17:38] LinkedIn conducted an experiment merging Xcode versions

[22:11] Data lake evolving into lake house architectures

[25:00] Broker pushes data to remote storage, plugin handles retrieval and format translation

[26:40] Kafka excels at high-speed, high-volume data

[32:18] Kafka data consumption evolving with new options

[40:19] Managing metadata for conversion on community level

[47:45] Kafka's potential as a widely used API

  continue reading

11 tập

Artwork
iconChia sẻ
 
Manage episode 429150924 series 3575842
Nội dung được cung cấp bởi Aiven. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Aiven hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

Utilizing the true potential of data streaming is key to business success.

In this Data (R)evolution episode, we're joined by Josep Prat and Filip Yonov to dive into the transformative features of Apache Kafka and its evolving role in data architecture. They discuss the critical importance of collaboration and feedback in enhancing Kafka's capabilities, the future of "lake house" technology, exciting updates from the Open Source Program Office (OSPO), and the importance of Kafka's readiness to support evolving data formats—making it a backbone for modern data ecosystems.

Key Takeaways:

  1. Community collaboration and contribution are essential for the continuous improvement and testing of Apache Kafka's capabilities
  2. The evolution of Apache Kafka into a more versatile platform, combined with object storage and open table formats, can significantly enhance real-time data streaming, analytics, and the future of "lake house" technology
  3. Tiered storage in Kafka facilitates more efficient and cost-effective data management by decoupling storage from computing

Resources:

Timestamps:

[05:49] Kafka servers have theoretical storage limits

[09:29] Test storage proposal process for Apache Kafka

[17:38] LinkedIn conducted an experiment merging Xcode versions

[22:11] Data lake evolving into lake house architectures

[25:00] Broker pushes data to remote storage, plugin handles retrieval and format translation

[26:40] Kafka excels at high-speed, high-volume data

[32:18] Kafka data consumption evolving with new options

[40:19] Managing metadata for conversion on community level

[47:45] Kafka's potential as a widely used API

  continue reading

11 tập

Tất cả các tập

×
 
Loading …

Chào mừng bạn đến với Player FM!

Player FM đang quét trang web để tìm các podcast chất lượng cao cho bạn thưởng thức ngay bây giờ. Đây là ứng dụng podcast tốt nhất và hoạt động trên Android, iPhone và web. Đăng ký để đồng bộ các theo dõi trên tất cả thiết bị.

 

Hướng dẫn sử dụng nhanh