←
Whisper
실시간 음성 인식 구현하기
High class 약 40분MCP 연동
마이크 입력을 실시간으로 캡처해 Whisper로 전사하는 실시간 음성 인식 앱을 구현합니다.
Whisper 열기
github.com/openai/whisper
STEP 1 / 3…
1
STEP 1. 마이크 스트리밍 설정
openai.com/research/whisper
Whisperby OpenAI
음성을 텍스트로 변환
98개 언어 지원, 높은 정확도의 음성 인식 AI
오디오 파일을 드래그하거나 클릭MP3, MP4, WAV, M4A 지원 (최대 25MB)
한국어
English
日本語
中文
pyaudio 설치 → 마이크 스트림 열기 → 청크 캡처 → 버퍼 저장
pyaudio 또는 sounddevice 라이브러리로 마이크 오디오를 실시간 버퍼에 캡처합니다. 3~5초 단위로 청크를 나눠 처리합니다.
pyaudio 설치 시 portaudio 의존성이 필요합니다(Mac: brew install portaudio).
이 단계를 완료했나요?