Google Gemini agora pode levar seus arquivos de áudio

O Gemini do Google finalmente adicionou a capacidade de fazer upload e analisar arquivos de áudio. Esse novo recurso leva seus arquivos de áudio, incluindo formatos comuns como MP3, M4A e WAV, e pode transcrever, resumir e extrair detalhes importantes do conteúdo.

O recurso agora está disponível no Android, iOS e na Web. Você pode acessar o novo recurso através do menu Plus no aplicativo Mobile Gemini ou na opção de arquivos de upload na web. A partir daí, basta selecionar um arquivo de áudio no seu dispositivo. Ele analisará o que você colocar nele e tornará incrivelmente fácil encontrar detalhes em seu conteúdo, seja uma reunião gravada, uma entrevista, uma palestra ou até uma nota de voz pessoal.

Infelizmente, o novo serviço de transcrição vem com limites de uso em camadas, que serão diferentes para usuários livres e aqueles com uma assinatura paga. Para usuários na camada gratuita, o comprimento total do áudio que pode ser carregado e analisado é limitado em 10 minutos. Isso é incrivelmente generoso do Google e oferece mais tempo para arquivos de áudio do que qualquer outro serviço de transcrição gratuito que eu já vi.

O prazo não é a única restrição a ser observada. Você pode fazer upload de até 10 arquivos de qualquer formato suportado em um único prompt por padrão. Isso inclui pastas de código com até 5.000 arquivos, repositórios do GitHub e arquivos ZIP contendo até 10 arquivos compactados. A atualização de áudio não expande esse limite, mas conta para o limite de 10 arquivos do que você pode fazer o upload de uma só vez.

Se você vai usá -lo para transcrever, recomendo devolver o script a Gêmeos e perguntar se há algo lá que não esteja no arquivo de áudio. Isso é apenas para o caso da IA ​​estragar a qualquer momento, porque 10 minutos a três horas é muito tempo para qualquer IA, e eu pessoalmente não confiaria completamente em não confundir palavras ou alucinar.

JORGE AGUILAR / COMO GEEK | Gêmeos

Lembre -se de que, uma vez que um arquivo de áudio é carregado, Gemini pode fazer mais do que simplesmente convertê -lo em texto. Os usuários podem solicitar a IA a resumir os principais pontos, identificar diferentes alto -falantes ou até extrair itens ou cotações de ação específicas. Isso transforma um arquivo de áudio bruto em um documento estruturado, pesquisável e altamente útil.

Para usuários de energia e profissionais que precisam de recursos de transcrição mais extensos, o Google está oferecendo limites significativamente mais altos. Os assinantes do Google AI Pro ou Google AI Ultra podem fazer upload de até três horas de áudio. Este é um aumento enorme que torna o serviço ótimo para transcrever conteúdo de formato longo, como podcasts, entrevistas completas ou seminários. Eu posso imaginar qualquer pessoa que administre um negócio ou trabalhe na transcrição pode aproveitar o baixo custo mensal de US $ 20 do plano AI Pro.

Economizei muito tempo colocando links do YouTube em Gemini para encontrar um local que estou procurando em vídeos de uma hora. Gêmeos é ótima em prestar atenção ao que está acontecendo nos links de vídeo, então eu sei que essa atualização para o áudio provavelmente será realmente útil para os usuários.

n

n

n Google Geminin
n

n

PRODUCTIVITY

n

n

n
Price: Free

n

4.6

n

n Downloadn

n

"'}; window.arrayOfEmbedScripts["play_store_app"] = "null";

Fonte: Google, 9to5Google

Este artigo foi útil?
Gostei0Não Gostei0

Related posts

Pegue este NAS Ugreen de 4 baías com 15% de desconto agora

Notebooklm do Google acabou de obter mais recursos

Plex só teve uma violação de segurança