voicechat2 logo

voicechat2Infraestrutura de bate-papo de voz de código aberto que rivaliza com GPT-4o

Infraestrutura de bate-papo de voz de código aberto que rivaliza com GPT-4o. Infraestrutura de bate-papo de voz com IA que usa WebSockets. Pode atingir uma latência de voz para voz tão baixa quanto 300 ms (o que GPT-4o faz) sem um codec de voz unificado. Tudo é executado em uma única GPU de consumo de ponta.

voicechat2 screenshot
Mais sobre voicechat2

Bate-papo de voz com IA local

Uma solução de bate-papo de voz com IA rápida e totalmente local que usa WebSockets.

Recursos-chave

  • Interação de voz para voz de baixa latência (1 segundo em AMD RDNA3, 300 ms em NVIDIA 4090)
  • Processamento totalmente local - sem dependências na nuvem
  • Usa modelos de IA de última geração:
    • Whisper large-v2 para reconhecimento de fala
    • Llama 3 8B para modelagem de linguagem
    • Modelo VITS para conversão de texto em fala

Casos de uso

  • Assistente pessoal de IA
  • Prototipagem rápida de interfaces de voz
  • Pesquisa e desenvolvimento de IA conversacional
  • Sistemas de interação de voz offline

Instalação

Fornecidas instruções detalhadas de instalação para:

  • Pré-requisitos do sistema
  • Configuração do código
  • whisper.cpp
  • llama.cpp
  • TTS e StyleTTS2

Comparação

Breve visão geral de outros projetos de bate-papo de voz com IA de código aberto:

  • webrtc-ai-voice-chat
  • june
  • GlaDOS
  • local-talking-llm
  • BUD-E
  • LocalAIVoiceChat
  • rtvi-web-demo

Preços

Este é um projeto de código aberto disponível sob a licença Apache 2.0.

Para equipes

Ideal para equipes de pesquisa de IA e desenvolvedores que trabalham em interfaces conversacionais. A configuração totalmente local permite personalização e extensão.

Top 10 produtos da semana