실시간 음성 인식 구현하기

High class 약 40분MCP 연동

마이크 입력을 실시간으로 캡처해 Whisper로 전사하는 실시간 음성 인식 앱을 구현합니다.

Whisper 열기

github.com/openai/whisper

STEP 1 / 3…

STEP 1. 마이크 스트리밍 설정

openai.com/research/whisper

Whisperby OpenAI

음성을 텍스트로 변환

98개 언어 지원, 높은 정확도의 음성 인식 AI

오디오 파일을 드래그하거나 클릭MP3, MP4, WAV, M4A 지원 (최대 25MB)

한국어

English

日本語

中文

pyaudio 설치 → 마이크 스트림 열기 → 청크 캡처 → 버퍼 저장

pyaudio 또는 sounddevice 라이브러리로 마이크 오디오를 실시간 버퍼에 캡처합니다. 3~5초 단위로 청크를 나눠 처리합니다.

pyaudio 설치 시 portaudio 의존성이 필요합니다(Mac: brew install portaudio).

이 단계를 완료했나요?