SDS 595: Data Engineering 101

Chia sẻ

Manage episode 335495244 series 2532807
Thông tin tác giả Super Data Science, Jon Krohn, Guests on Machine Learning, A.I., and Data-Career Success được phát hiện bởi Player FM và cộng đồng của chúng tôi - bản quyền thuộc sở hữu của nhà sản xuất (publisher), không thuộc về Player FM, và audio được phát trực tiếp từ máy chủ của họ. Bạn chỉ cần nhấn nút Theo dõi (Subscribe) để nhận thông tin cập nhật từ Player FM, hoặc dán URL feed vào các ứng dụng podcast khác.
Tune in as Joe Reis and Matt Housley, co-founders of Ternary Data and co-authors of the book “Fundamentals of Data Engineering” join Jon Krohn to discuss major undercurrents across the data engineering lifecycle, and their top tools and techniques. In this episode you will learn: • What is data engineering? [3:55] • Why Joe and Matt identify as “recovering data scientists” [6:12] • What kinds of people tend to become data scientists vs. data engineers [10:38]? • Key components of Joe and Matt’s book [26:31] • Major undercurrents across the data engineering lifecycle [28:26] • The most under-utilized tool in a data engineer's toolbox [34:39] • How there are tradeoffs in any data pipeline latency considerations, but faster is typically the default assumption [38:55] • Joe and Matt’s favorite data engineering tools and techniques [43:39] Additional materials:

617 tập