Artwork

Nội dung được cung cấp bởi Vincent Sider. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Vincent Sider hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.
Player FM - Ứng dụng Podcast
Chuyển sang chế độ ngoại tuyến với ứng dụng Player FM !

Orion on your nose, Llama in the Lab, openAI Advanced Voice on the Mic

3:48
 
Chia sẻ
 

Manage episode 442208790 series 3603820
Nội dung được cung cấp bởi Vincent Sider. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Vincent Sider hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

In this week's edition, we're diving into the latest multimodal AI breakthroughs, from voice-powered podcasting to vision-driven AI models. First, we explore the open-source Podcast Generator, which combines GPT-4 and ElevenLabs to turn articles into dynamic podcast episodes featuring your own voice. Then, we highlight cutting-edge advancements like Mistral AI’s Pixtral 12B and Meta’s Llama 3.2, both pushing the boundaries of how AI processes and integrates vision and text in real time. We’ll also cover the newest voice innovations from OpenAI and Meta, setting the stage for more natural and engaging AI interactions. Finally, we peek at Meta’s AR-powered Orion glasses and spotlight some AI-driven startup tools that are revolutionizing creative and operational workflows.

Catch you on the AI frontier,
Vincent
Chief AI Entertainment Officer, SimplyAI: Voice & Vision

  continue reading

9 tập

Artwork
iconChia sẻ
 
Manage episode 442208790 series 3603820
Nội dung được cung cấp bởi Vincent Sider. Tất cả nội dung podcast bao gồm các tập, đồ họa và mô tả podcast đều được Vincent Sider hoặc đối tác nền tảng podcast của họ tải lên và cung cấp trực tiếp. Nếu bạn cho rằng ai đó đang sử dụng tác phẩm có bản quyền của bạn mà không có sự cho phép của bạn, bạn có thể làm theo quy trình được nêu ở đây https://vi.player.fm/legal.

In this week's edition, we're diving into the latest multimodal AI breakthroughs, from voice-powered podcasting to vision-driven AI models. First, we explore the open-source Podcast Generator, which combines GPT-4 and ElevenLabs to turn articles into dynamic podcast episodes featuring your own voice. Then, we highlight cutting-edge advancements like Mistral AI’s Pixtral 12B and Meta’s Llama 3.2, both pushing the boundaries of how AI processes and integrates vision and text in real time. We’ll also cover the newest voice innovations from OpenAI and Meta, setting the stage for more natural and engaging AI interactions. Finally, we peek at Meta’s AR-powered Orion glasses and spotlight some AI-driven startup tools that are revolutionizing creative and operational workflows.

Catch you on the AI frontier,
Vincent
Chief AI Entertainment Officer, SimplyAI: Voice & Vision

  continue reading

9 tập

Tất cả các tập

×
 
Loading …

Chào mừng bạn đến với Player FM!

Player FM đang quét trang web để tìm các podcast chất lượng cao cho bạn thưởng thức ngay bây giờ. Đây là ứng dụng podcast tốt nhất và hoạt động trên Android, iPhone và web. Đăng ký để đồng bộ các theo dõi trên tất cả thiết bị.

 

Hướng dẫn sử dụng nhanh