Artwork

Nội dung được cung cấp bởi Nandi Ngubentombi. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Nandi Ngubentombi hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.
Player FM - Ứng dụng Podcast
Chuyển sang chế độ ngoại tuyến với ứng dụng Player FM !

Getting Data Mastering at Scale Right

31:45
 
Chia sẻ
 

Manage episode 375846758 series 3482550
Nội dung được cung cấp bởi Nandi Ngubentombi. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Nandi Ngubentombi hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

What’s required to master large numbers of data sources? First, avoid approaches that require writing rules. Then use machine learning and cloud computing to efficiently handle the workload. That advice comes from Mike Stonebraker, a database pioneer who helped create the INGRES relational database system, won the 2014 A.M. Turing Award, and has co-founded several data management startups, including Tamr. Mike talks about common data mastering mistakes, why traditional tools aren’t right for the task, and shares examples of companies that have successful mastered data at scale.

  continue reading

35 tập

Artwork
iconChia sẻ
 
Manage episode 375846758 series 3482550
Nội dung được cung cấp bởi Nandi Ngubentombi. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Nandi Ngubentombi hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

What’s required to master large numbers of data sources? First, avoid approaches that require writing rules. Then use machine learning and cloud computing to efficiently handle the workload. That advice comes from Mike Stonebraker, a database pioneer who helped create the INGRES relational database system, won the 2014 A.M. Turing Award, and has co-founded several data management startups, including Tamr. Mike talks about common data mastering mistakes, why traditional tools aren’t right for the task, and shares examples of companies that have successful mastered data at scale.

  continue reading

35 tập

Tất cả các tập

×
 
Loading …

Chào mừng bạn đến với Player FM!

Player FM đang quét trang web để tìm các podcast chất lượng cao cho bạn thưởng thức ngay bây giờ. Đây là ứng dụng podcast tốt nhất và hoạt động trên Android, iPhone và web. Đăng ký để đồng bộ các theo dõi trên tất cả thiết bị.

 

Hướng dẫn sử dụng nhanh