Categories: 'IT 인터넷'

업무 자동화 음성 텍스트로 변환하기 with n8n & STT

업무 자동화 음성 텍스트로 변환하기 with n8n & STT   음성 파일을 자동으로 텍스트로 변환하는 STT(Speech-to-Text) 기능은 다양한 업무 자동화에 활용될 수 있습니다. 특히 n8n과 Google Drive를 연동하면, 파일 업로드 시 자동으로 음성을 텍스트로 변환하는 강력한 자동화 시스템을 구성할 수 있습니다. 본문에서는 STT 구현 방법과 함께, 이를 n8n으로 자동화하는 실제 워크플로우 구성 방법까지 안내드립니다.

업무 자동화 음성 텍스트로 변환하기 with n8n & STT  

업무 자동화 음성 텍스트로 변환하기 with n8n & STT

STT(Speech-to-Text)란 무엇인가요?

STT는 음성을 인식하여 텍스트로 변환하는 기술로, 음성 회의 기록, 고객 서비스 녹취 분석, 뉴스 스크립트 자동화 등 다양한 영역에서 활용됩니다. TTS(Text-to-Speech)의 반대 개념이며, AI 음성 인식 기술의 핵심 요소입니다.

STT 구현 방법 3가지

1. Google Cloud Speech-to-Text API

Google의 STT API는 고정밀 음성 인식 서비스를 제공합니다.

  • Google Cloud 프로젝트 생성 후, Speech-to-Text API 활성화
  • 서비스 계정 키(JSON) 발급 및 인증 설정
  • 다음과 같은 Python 코드로 음성 텍스트 변환
import os
from google.cloud import speech

os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "your_key.json"

def transcribe(audio_file):
    client = speech.SpeechClient()
    with open(audio_file, "rb") as f:
        content = f.read()

    audio = speech.RecognitionAudio(content=content)
    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=16000,
        language_code="ko-KR"
    )

    response = client.recognize(config=config, audio=audio)
    for result in response.results:
        print(result.alternatives[0].transcript)

2. SpeechRecognition 라이브러리

Python 기반 오픈소스 라이브러리로, Google Web Speech API 등을 사용할 수 있습니다.

  • 라이브러리 설치: pip install SpeechRecognition pydub
  • mp3 → wav 변환 후 인식 진행
from pydub import AudioSegment
import speech_recognition as sr

def convert_audio(input_file, output_file):
    AudioSegment.from_file(input_file).export(output_file, format="wav")

def recognize_speech(audio_file):
    r = sr.Recognizer()
    with sr.AudioFile(audio_file) as source:
        audio = r.record(source)
    print(r.recognize_google(audio, language="ko-KR"))

3. OpenAI Whisper 모델

Whisper는 다양한 언어를 지원하는 고성능 STT 모델로, 오픈소스로 제공됩니다.

  • 설치: pip install git+https://github.com/openai/whisper.git
  • 간단한 코드로 텍스트 변환
import whisper

model = whisper.load_model("base")
result = model.transcribe("sample_audio.mp3")
print(result["text"])

n8n으로 STT 자동화 워크플로우 만들기

n8n으로 STT 자동화 워크플로우 만들기

Google Drive에 음성 파일이 업로드되면, 자동으로 이를 감지하고 STT 변환 후 텍스트 결과를 저장하는 n8n 워크플로우 구성 방법입니다.

n8n을 아직 설치안하셨다면 해당 내용을 먼저 참고해보세요!

2024.12.15 – [제품추천/소프트웨어] – n8n 시놀로지 로컬 설치 쉽게 하는 방법

n8n 시놀로지 로컬 설치 쉽게 하는 방법

n8n 시놀로지 로컬 설치 쉽게 하는 방법 ㅣ n8n(n-eight-n으로 발음)은 전 세계의 모든 API 앱을 서로 연결하여 코드 한 줄 없이 데이터를 공유하고 조작할 수 있도록 도와줍니다. 사용하기 쉽고 사용

aboda.kr

 

1. Google Drive 트리거 설정

  • Google Drive Trigger 노드를 추가
  • 인증 설정 및 대상 폴더 지정
  • 파일 생성 이벤트 발생 시 워크플로우 실행

2. 파일 다운로드

  • HTTP Request 노드를 추가하여, Google Drive 트리거에서 받은 URL로 파일 다운로드

3. Execute Command로 Python 스크립트 실행

Python 코드를 n8n의 Execute Command 노드로 실행합니다. 아래 예시는 Google Cloud API를 활용한 변환 스크립트입니다.

import os
import requests
from google.cloud import speech

os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "your_key.json"

def download_file(url, local_path):
    with requests.get(url, stream=True) as r:
        r.raise_for_status()
        with open(local_path, 'wb') as f:
            for chunk in r.iter_content(8192):
                f.write(chunk)

def transcribe(audio_file):
    client = speech.SpeechClient()
    with open(audio_file, "rb") as f:
        content = f.read()
    audio = speech.RecognitionAudio(content=content)
    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=16000,
        language_code="ko-KR"
    )
    response = client.recognize(config=config, audio=audio)
    return "\n".join([r.alternatives[0].transcript for r in response.results])

url = "URL_FROM_N8N"
file_path = "audio.wav"
download_file(url, file_path)
print(transcribe(file_path))

4. 결과 저장 및 처리

  • Set 노드 또는 Google Sheets 노드를 활용해 변환된 텍스트 저장
  • Slack, 이메일, 노션 등으로 알림 전송도 가능

활용 예시

  • 회의 녹음 파일 자동 기록화
  • 전화 상담 녹취 분석 자동화
  • 교육 강의 자동 요약 및 저장

마무리

n8n과 STT 기능을 결합하면 음성 기반 데이터를 자동으로 분석하고 저장하는 자동화 시스템을 간단하게 구축할 수 있습니다. 코드 지식이 많지 않더라도, 위 워크플로우를 따라 하시면 누구나 구현할 수 있습니다.

관련 글
n8n자동화, 음성텍스트변환, STT자동화, 구글STTAPI, openaiWhisper, 음성인식워크플로우, GoogleDrive트리거, 자동음성기록, n8nExecuteCommand, STT스크립트

2025.06.20 – [부동산/자동화 프로젝트] – n8n Slack으로 자동 메시지 보내기 완전 쉬워요 (1/1)

n8n Slack으로 자동 메시지 보내기 완전 쉬워요 (1/1)

n8n Slack으로 자동 메시지 보내기 완전 쉬워요 , n8n을 활용한 자동화 워크플로우 시간입니다. 이번에는 Slack 채널로 알림 메시지를 자동 전송하는 방법을 소개드립니다. 환율 정보, 에러 발생 알림

aboda.kr

urjent

Share
Published by
urjent

Recent Posts

아이유 선결제 요청 논란, 잠실 시위대 SNS 댓글 폭주와 시민 간 의견 갈림

아이유의 SNS에 잠실 시위 참가자들의 커피와 빵 선결제 요청이 폭주하고 있습니다. 6월 6일 현재 인스타그램…

3시간 ago

난닝구 사망 소식, 1세대 게임 BJ 향년 46세의 비보와 팬들의 추모 현장

1세대 게임 BJ 난닝구(본명 한태식)가 향년 46세로 6월 5일 사망했다는 비보가 게임 커뮤니티를 강타했다. 동료…

8시간 ago

손흥민, MLS 올스타 퍼스트 11 선정! 메시와 함께 뛰는 역사적 순간

손흥민이 2003년 홍명보 이후 23년 만에 MLS 올스타 퍼스트 11에 선정되며 축구계를 뜨겁게 달구고 있다.…

8시간 ago

호르무즈 유조선 발포 사태, 미군 기지 타격과 이란 보복으로 중동 긴장 최고조

2026년 6월 6일 이란 혁명수비대가 호르무즈 해협을 무허가 통과하려던 상업용 유조선 4척을 향해 발포했습니다. 미국…

9시간 ago

송파 시의원 비례대표 결과 역전…민주 80석과 국힘 38석 확정

서울 송파구 잠실7동 투표함 미개표로 서울시의회 비례대표 의석이 민주당에서 국민의힘으로 1석 전환됐습니다. 6월 3일 치러진…

17시간 ago

박경혜 프로필부터 영화 ‘로비’ 연기까지! 배우 박경혜의 모든 것

배우 박경혜는 1993년생으로 2011년 영화 '애드벌룬'으로 배우 데뷔한 후 다양한 작품에 출연하며 꾸준한 활동을 이어가고…

23시간 ago