voicechat2: GPT-4o'ya Rakip Açık Kaynaklı Sesli Sohbet

Yerel Yapay Zeka Sesli Sohbet

WebSockets kullanan hızlı ve tamamen yerel bir Yapay Zeka sesli sohbet çözümü.

Temel Özellikler

Düşük gecikmeli ses-sese etkileşim (AMD RDNA3'te 1 saniye, NVIDIA 4090'da 300 ms)
Tamamen yerel işleme - bulut bağımlılığı yok
En son teknoloji Yapay Zeka modelleri kullanır:
- Konuşma tanıma için Whisper large-v2
- Dil modellemesi için Llama 3 8B
- Metinden sese dönüştürme için VITS modeli

Kullanım Alanları

Kişisel Yapay Zeka asistanı
Ses arayüzlerinin hızlı prototiplemesi
Konuşma tabanlı Yapay Zeka araştırma ve geliştirme
Çevrimdışı ses etkileşim sistemleri

Kurulum

Şunlar için ayrıntılı kurulum talimatları sağlanmıştır:

Sistem ön koşulları
Kod kurulumu
whisper.cpp
llama.cpp
TTS ve StyleTTS2

Karşılaştırma

Diğer açık kaynaklı Yapay Zeka sesli sohbet projelerinin kısa bir genel görünümü:

webrtc-ai-voice-chat
june
GlaDOS
local-talking-llm
BUD-E
LocalAIVoiceChat
rtvi-web-demo

Fiyatlandırma

Bu, Apache 2.0 lisansı altında kullanılabilir bir açık kaynak projesidir.

Ekipler İçin

Konuşma arayüzleri üzerinde çalışan Yapay Zeka araştırma ekipleri ve geliştiriciler için idealdir. Tamamen yerel kurulum, özelleştirme ve genişletmeye olanak tanır.

voicechat2 Alternatifleri