voicechat2 logo

voicechat2GPT-4o ile yarışan açık kaynaklı sesli sohbet altyapısı

GPT-4o ile yarışan açık kaynaklı sesli sohbet altyapısı. WebSockets kullanan Yapay Zeka sesli sohbet altyapısı. Birleşik bir ses kodeksi olmadan 300 ms'ye (GPT-4o'nun yaptığı gibi) kadar düşük ses-sese gecikme sağlayabilir. Her şey tek bir üst düzey tüketici GPU'sunda çalışır.

voicechat2 screenshot
voicechat2 Hakkında Daha Fazla

Yerel Yapay Zeka Sesli Sohbet

WebSockets kullanan hızlı ve tamamen yerel bir Yapay Zeka sesli sohbet çözümü.

Temel Özellikler

  • Düşük gecikmeli ses-sese etkileşim (AMD RDNA3'te 1 saniye, NVIDIA 4090'da 300 ms)
  • Tamamen yerel işleme - bulut bağımlılığı yok
  • En son teknoloji Yapay Zeka modelleri kullanır:
    • Konuşma tanıma için Whisper large-v2
    • Dil modellemesi için Llama 3 8B
    • Metinden sese dönüştürme için VITS modeli

Kullanım Alanları

  • Kişisel Yapay Zeka asistanı
  • Ses arayüzlerinin hızlı prototiplemesi
  • Konuşma tabanlı Yapay Zeka araştırma ve geliştirme
  • Çevrimdışı ses etkileşim sistemleri

Kurulum

Şunlar için ayrıntılı kurulum talimatları sağlanmıştır:

  • Sistem ön koşulları
  • Kod kurulumu
  • whisper.cpp
  • llama.cpp
  • TTS ve StyleTTS2

Karşılaştırma

Diğer açık kaynaklı Yapay Zeka sesli sohbet projelerinin kısa bir genel görünümü:

  • webrtc-ai-voice-chat
  • june
  • GlaDOS
  • local-talking-llm
  • BUD-E
  • LocalAIVoiceChat
  • rtvi-web-demo

Fiyatlandırma

Bu, Apache 2.0 lisansı altında kullanılabilir bir açık kaynak projesidir.

Ekipler İçin

Konuşma arayüzleri üzerinde çalışan Yapay Zeka araştırma ekipleri ve geliştiriciler için idealdir. Tamamen yerel kurulum, özelleştirme ve genişletmeye olanak tanır.