Artwork

Nội dung được cung cấp bởi Sequoia Capital. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Sequoia Capital hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.
Player FM - Ứng dụng Podcast
Chuyển sang chế độ ngoại tuyến với ứng dụng Player FM !

Meta’s Joe Spisak on Llama 3.1 405B and the Democratization of Frontier Models

42:07
 
Chia sẻ
 

Manage episode 431457150 series 3586723
Nội dung được cung cấp bởi Sequoia Capital. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Sequoia Capital hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

As head of Product Management for Generative AI at Meta, Joe Spisak leads the team behind Llama, which just released the new 3.1 405B model. We spoke with Joe just two days after the model’s release to ask what’s new, what it enables, and how Meta sees the role of open source in the AI ecosystem.

Joe shares that where Llama 3.1 405B really focused is on pushing scale (it was trained on 15 trillion tokens using 16,000 GPUs) and he’s excited about the zero-shot tool use it will enable, as well as its role in distillation and generating synthetic data to teach smaller models. He tells us why he thinks even frontier models will ultimately commoditize—and why that’s a good thing for the startup ecosystem.

Hosted by: Stephanie Zhan and Sonya Huang, Sequoia Capital

Mentioned in this episode:

Llama 3.1 405B paper

Open Source AI Is the Way Forward: Mark Zuckerberg essay released with Llama 3.1.

Mistral Large 2

The Bitter Lesson by Rich Sutton

00:00 Introduction

01:28 The Llama 3.1 405B launch

05:02 The open source license

07:01 What's in it for Meta?

10:19 Why not open source?

11:16 Will frontier models commoditize?

12:41 What about startups?

16:29 The Mistral team

19:36 Are all frontier strategies comparable?

22:38 Is model development becoming more like software development?

26:34 Agentic reasoning

29:09 What future levers will unlock reasoning?

31:20 Will coding and math lead to unlocks?

33:09 Small models

34:08 7X more data

37:36 Are we going to hit a wall?

39:49 Lightning round

  continue reading

19 tập

Artwork
iconChia sẻ
 
Manage episode 431457150 series 3586723
Nội dung được cung cấp bởi Sequoia Capital. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Sequoia Capital hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

As head of Product Management for Generative AI at Meta, Joe Spisak leads the team behind Llama, which just released the new 3.1 405B model. We spoke with Joe just two days after the model’s release to ask what’s new, what it enables, and how Meta sees the role of open source in the AI ecosystem.

Joe shares that where Llama 3.1 405B really focused is on pushing scale (it was trained on 15 trillion tokens using 16,000 GPUs) and he’s excited about the zero-shot tool use it will enable, as well as its role in distillation and generating synthetic data to teach smaller models. He tells us why he thinks even frontier models will ultimately commoditize—and why that’s a good thing for the startup ecosystem.

Hosted by: Stephanie Zhan and Sonya Huang, Sequoia Capital

Mentioned in this episode:

Llama 3.1 405B paper

Open Source AI Is the Way Forward: Mark Zuckerberg essay released with Llama 3.1.

Mistral Large 2

The Bitter Lesson by Rich Sutton

00:00 Introduction

01:28 The Llama 3.1 405B launch

05:02 The open source license

07:01 What's in it for Meta?

10:19 Why not open source?

11:16 Will frontier models commoditize?

12:41 What about startups?

16:29 The Mistral team

19:36 Are all frontier strategies comparable?

22:38 Is model development becoming more like software development?

26:34 Agentic reasoning

29:09 What future levers will unlock reasoning?

31:20 Will coding and math lead to unlocks?

33:09 Small models

34:08 7X more data

37:36 Are we going to hit a wall?

39:49 Lightning round

  continue reading

19 tập

Tất cả các tập

×
 
Loading …

Chào mừng bạn đến với Player FM!

Player FM đang quét trang web để tìm các podcast chất lượng cao cho bạn thưởng thức ngay bây giờ. Đây là ứng dụng podcast tốt nhất và hoạt động trên Android, iPhone và web. Đăng ký để đồng bộ các theo dõi trên tất cả thiết bị.

 

Hướng dẫn sử dụng nhanh