Speech Recognition and Audio Chatbot Using Python

Meet Pocket TTS: Real-Time Voice AI That Runs on a Laptop

Pocket TTS is an open-source text-to-speech model that runs on CPUs, clones voices from 5 seconds of audio, and keeps voice ...

IEEE

Integrating Optical Characteristic Recognition with Conversational AI: A Multimodal Chatbot Featuring Speech and Poster Generation

Abstract: Artificial Intelligence (AI) has progressed so far in human computer interaction that it is much more natural and interesting. Optical Character Recognition (OCR) conjointly with ...

IEEE

mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition

Abstract: Audio-Visual Speech Recognition (AVSR) combines lip-based video with audio and can improve performance in noise, but most methods are trained only on English data. One limitation is the lack ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Meet Pocket TTS: Real-Time Voice AI That Runs on a Laptop

Integrating Optical Characteristic Recognition with Conversational AI: A Multimodal Chatbot Featuring Speech and Poster Generation

mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition

Trending now