Artwork

Nội dung được cung cấp bởi Changelog Media. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Changelog Media hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.
Player FM - Ứng dụng Podcast
Chuyển sang chế độ ngoại tuyến với ứng dụng Player FM !

Collaboration & evaluation for LLM apps

46:16
 
Chia sẻ
 

Manage episode 397151761 series 2385063
Nội dung được cung cấp bởi Changelog Media. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Changelog Media hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

Small changes in prompts can create large changes in the output behavior of generative AI models. Add to that the confusion around proper evaluation of LLM applications, and you have a recipe for confusion and frustration. Raza and the Humanloop team have been diving into these problems, and, in this episode, Raza helps us understand how non-technical prompt engineers can productively collaborate with technical software engineers while building AI-driven apps.

Join the discussion

Changelog++ members save 4 minutes on this episode because they made the ads disappear. Join today!

Sponsors:

  • Read Write Own – Read, Write, Own: Building the Next Era of the Internet—a new book from entrepreneur and investor Chris Dixon—explores one possible solution to the internet’s authenticity problem: Blockchains. From AI that tracks its source material to generative programs that compensate—rather than cannibalize—creators. It’s a call to action for a more open, transparent, and democratic internet. One that opens the black box of AI, tracks the origins we see online, and much more. Order your copy of Read, Write, Own today at readwriteown.com
  • Changelog News – A podcast+newsletter combo that’s brief, entertaining & always on-point. Subscribe today.
  • Fly.ioThe home of Changelog.com — Deploy your apps and databases close to your users. In minutes you can run your Ruby, Go, Node, Deno, Python, or Elixir app (and databases!) all over the world. No ops required. Learn more at fly.io/changelog and check out the speedrun in their docs.

Featuring:

Show Notes:

Something missing or broken? PRs welcome!

  continue reading

Chương

1. Welcome to Practical AI (00:00:07)

2. Origin of Human Loop (00:00:43)

3. Types of designers (00:05:23)

4. Tech & non-tech worklfow (00:08:06)

5. What am i building? (00:11:47)

7. What can Human Loop do? (00:14:40)

8. In-production feedback (00:17:22)

9. Fine-tiuning jargon (00:18:32)

10. Fine-tuning trends (00:21:43)

11. Proliferation of open models (00:24:11)

12. Sponsor: Changelog News (00:26:49)

13. Different roles in the HL system / Collaborating in Human Loop (00:28:20)

14. Production framework (00:32:04)

15. Importance of evaluation (00:34:40)

16. Surprising usecases (00:38:14)

17. Exciting things that are happening (00:42:43)

18. Outro (00:45:27)

293 tập

Artwork
iconChia sẻ
 
Manage episode 397151761 series 2385063
Nội dung được cung cấp bởi Changelog Media. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Changelog Media hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

Small changes in prompts can create large changes in the output behavior of generative AI models. Add to that the confusion around proper evaluation of LLM applications, and you have a recipe for confusion and frustration. Raza and the Humanloop team have been diving into these problems, and, in this episode, Raza helps us understand how non-technical prompt engineers can productively collaborate with technical software engineers while building AI-driven apps.

Join the discussion

Changelog++ members save 4 minutes on this episode because they made the ads disappear. Join today!

Sponsors:

  • Read Write Own – Read, Write, Own: Building the Next Era of the Internet—a new book from entrepreneur and investor Chris Dixon—explores one possible solution to the internet’s authenticity problem: Blockchains. From AI that tracks its source material to generative programs that compensate—rather than cannibalize—creators. It’s a call to action for a more open, transparent, and democratic internet. One that opens the black box of AI, tracks the origins we see online, and much more. Order your copy of Read, Write, Own today at readwriteown.com
  • Changelog News – A podcast+newsletter combo that’s brief, entertaining & always on-point. Subscribe today.
  • Fly.ioThe home of Changelog.com — Deploy your apps and databases close to your users. In minutes you can run your Ruby, Go, Node, Deno, Python, or Elixir app (and databases!) all over the world. No ops required. Learn more at fly.io/changelog and check out the speedrun in their docs.

Featuring:

Show Notes:

Something missing or broken? PRs welcome!

  continue reading

Chương

1. Welcome to Practical AI (00:00:07)

2. Origin of Human Loop (00:00:43)

3. Types of designers (00:05:23)

4. Tech & non-tech worklfow (00:08:06)

5. What am i building? (00:11:47)

7. What can Human Loop do? (00:14:40)

8. In-production feedback (00:17:22)

9. Fine-tiuning jargon (00:18:32)

10. Fine-tuning trends (00:21:43)

11. Proliferation of open models (00:24:11)

12. Sponsor: Changelog News (00:26:49)

13. Different roles in the HL system / Collaborating in Human Loop (00:28:20)

14. Production framework (00:32:04)

15. Importance of evaluation (00:34:40)

16. Surprising usecases (00:38:14)

17. Exciting things that are happening (00:42:43)

18. Outro (00:45:27)

293 tập

Tất cả các tập

×
 
Loading …

Chào mừng bạn đến với Player FM!

Player FM đang quét trang web để tìm các podcast chất lượng cao cho bạn thưởng thức ngay bây giờ. Đây là ứng dụng podcast tốt nhất và hoạt động trên Android, iPhone và web. Đăng ký để đồng bộ các theo dõi trên tất cả thiết bị.

 

Hướng dẫn sử dụng nhanh