Artwork

Nội dung được cung cấp bởi Security Weekly Productions. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Security Weekly Productions hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.
Player FM - Ứng dụng Podcast
Chuyển sang chế độ ngoại tuyến với ứng dụng Player FM !

AI Red Teaming and AI Safety - Sounil Yu, Amanda Minnich - ESW #371

2:18:23
 
Chia sẻ
 

Manage episode 433339925 series 2591184
Nội dung được cung cấp bởi Security Weekly Productions. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Security Weekly Productions hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

In this interview we explore the new and sometimes strange world of redteaming AI. I have SO many questions, like what is AI safety?

We'll discuss her presence at Black Hat, where she delivered two days of training and participated on an AI safety panel.

We'll also discuss the process of pentesting an AI. Will pentesters just have giant cheatsheets or text files full of adversarial prompts? How can we automate this? Will an AI generate adversarial prompts you can use against another AI? And finally, what do we do with the results?

Resources:

We chat with Sounil Yu, co-founder of LLM access control startup, Knostic. We discuss both the experience of participating in Black Hat's startup competition, and what his company, Knostic, is all about. Knostic was one of four finalists for Black Hat's Startup Spotlight competition and was announced as the winner on August 6th.

References

, in the enterprise security news,

  1. AI is still getting a ton of funding!
  2. Netwrix acquires PingCastle
  3. Tenable looks for a buyer
  4. SentinelOne hires Alex Stamos as their new CISO
  5. Crowdstrike doesn’t appreciate satire when it’s at their expense
  6. Intel begins one of the biggest layoffs we’ve ever seen in tech
  7. Windows Downdate
  8. RAG poisoning
  9. GPT yourself
  10. The Xerox Hypothesis

All that and more, on this episode of Enterprise Security Weekly.

Visit https://www.securityweekly.com/esw for all the latest episodes!

Show Notes: https://securityweekly.com/esw-371

  continue reading

3046 tập

Artwork
iconChia sẻ
 
Manage episode 433339925 series 2591184
Nội dung được cung cấp bởi Security Weekly Productions. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Security Weekly Productions hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

In this interview we explore the new and sometimes strange world of redteaming AI. I have SO many questions, like what is AI safety?

We'll discuss her presence at Black Hat, where she delivered two days of training and participated on an AI safety panel.

We'll also discuss the process of pentesting an AI. Will pentesters just have giant cheatsheets or text files full of adversarial prompts? How can we automate this? Will an AI generate adversarial prompts you can use against another AI? And finally, what do we do with the results?

Resources:

We chat with Sounil Yu, co-founder of LLM access control startup, Knostic. We discuss both the experience of participating in Black Hat's startup competition, and what his company, Knostic, is all about. Knostic was one of four finalists for Black Hat's Startup Spotlight competition and was announced as the winner on August 6th.

References

, in the enterprise security news,

  1. AI is still getting a ton of funding!
  2. Netwrix acquires PingCastle
  3. Tenable looks for a buyer
  4. SentinelOne hires Alex Stamos as their new CISO
  5. Crowdstrike doesn’t appreciate satire when it’s at their expense
  6. Intel begins one of the biggest layoffs we’ve ever seen in tech
  7. Windows Downdate
  8. RAG poisoning
  9. GPT yourself
  10. The Xerox Hypothesis

All that and more, on this episode of Enterprise Security Weekly.

Visit https://www.securityweekly.com/esw for all the latest episodes!

Show Notes: https://securityweekly.com/esw-371

  continue reading

3046 tập

Semua episode

×
 
Loading …

Chào mừng bạn đến với Player FM!

Player FM đang quét trang web để tìm các podcast chất lượng cao cho bạn thưởng thức ngay bây giờ. Đây là ứng dụng podcast tốt nhất và hoạt động trên Android, iPhone và web. Đăng ký để đồng bộ các theo dõi trên tất cả thiết bị.

 

Hướng dẫn sử dụng nhanh