Artwork

Conteúdo fornecido por Vincent Sider. Todo o conteúdo do podcast, incluindo episódios, gráficos e descrições de podcast, é carregado e fornecido diretamente por Vincent Sider ou por seu parceiro de plataforma de podcast. Se você acredita que alguém está usando seu trabalho protegido por direitos autorais sem sua permissão, siga o processo descrito aqui https://pt.player.fm/legal.
Player FM - Aplicativo de podcast
Fique off-line com o app Player FM !

Orion on your nose, Llama in the Lab, openAI Advanced Voice on the Mic

3:48
 
Compartilhar
 

Manage episode 442208790 series 3603820
Conteúdo fornecido por Vincent Sider. Todo o conteúdo do podcast, incluindo episódios, gráficos e descrições de podcast, é carregado e fornecido diretamente por Vincent Sider ou por seu parceiro de plataforma de podcast. Se você acredita que alguém está usando seu trabalho protegido por direitos autorais sem sua permissão, siga o processo descrito aqui https://pt.player.fm/legal.

In this week's edition, we're diving into the latest multimodal AI breakthroughs, from voice-powered podcasting to vision-driven AI models. First, we explore the open-source Podcast Generator, which combines GPT-4 and ElevenLabs to turn articles into dynamic podcast episodes featuring your own voice. Then, we highlight cutting-edge advancements like Mistral AI’s Pixtral 12B and Meta’s Llama 3.2, both pushing the boundaries of how AI processes and integrates vision and text in real time. We’ll also cover the newest voice innovations from OpenAI and Meta, setting the stage for more natural and engaging AI interactions. Finally, we peek at Meta’s AR-powered Orion glasses and spotlight some AI-driven startup tools that are revolutionizing creative and operational workflows.

Catch you on the AI frontier,
Vincent
Chief AI Entertainment Officer, SimplyAI: Voice & Vision

  continue reading

9 episódios

Artwork
iconCompartilhar
 
Manage episode 442208790 series 3603820
Conteúdo fornecido por Vincent Sider. Todo o conteúdo do podcast, incluindo episódios, gráficos e descrições de podcast, é carregado e fornecido diretamente por Vincent Sider ou por seu parceiro de plataforma de podcast. Se você acredita que alguém está usando seu trabalho protegido por direitos autorais sem sua permissão, siga o processo descrito aqui https://pt.player.fm/legal.

In this week's edition, we're diving into the latest multimodal AI breakthroughs, from voice-powered podcasting to vision-driven AI models. First, we explore the open-source Podcast Generator, which combines GPT-4 and ElevenLabs to turn articles into dynamic podcast episodes featuring your own voice. Then, we highlight cutting-edge advancements like Mistral AI’s Pixtral 12B and Meta’s Llama 3.2, both pushing the boundaries of how AI processes and integrates vision and text in real time. We’ll also cover the newest voice innovations from OpenAI and Meta, setting the stage for more natural and engaging AI interactions. Finally, we peek at Meta’s AR-powered Orion glasses and spotlight some AI-driven startup tools that are revolutionizing creative and operational workflows.

Catch you on the AI frontier,
Vincent
Chief AI Entertainment Officer, SimplyAI: Voice & Vision

  continue reading

9 episódios

Todos os episódios

×
 
Loading …

Bem vindo ao Player FM!

O Player FM procura na web por podcasts de alta qualidade para você curtir agora mesmo. É o melhor app de podcast e funciona no Android, iPhone e web. Inscreva-se para sincronizar as assinaturas entre os dispositivos.

 

Guia rápido de referências