음성 화자 분류 시작하기

2025. 2. 28. 11:13·AI/(PJT)음성 화자 분류
반응형

<사전 학습 및 환경 세팅>

 

0. 아나콘다 세팅, Cuda cuDNN, Pytorch

 

1. 음성 관련 개념 학습

소리, 파동의 구성

Feature 엔지니어링을 위한 도메인 학습.

 

2. 음성 데이터 전처리

샘플링

양자화

FT

특징 추출

- MFCC

- Mel Spectrogram

- Zero-Crossing Rate

- Chroma Features

 

3. 모델

Random Forest, XGBoost, LightGBM

 

4. 화자 분류 전용 모델

- Pyannote

- Simple-Diarizer

- Diart

 

5. 평가 방식

- 정확도 (Accuracy)
- 정밀도 (Precision)
- 재현율 (Recall)
- F1-score

- AB Test

 

--------------------------------------------------------------------------

<개발>

 

5. Train, Valid Dataset 만들기

 

6. 품질 평가 진행

 

7. 고도화 방안 수립

- 소음 저항성 향상

- 모델 경량화

- 화자 분류 전용 모델 사용과 비교

- 추가적인 개발

(학습 -> 개발 -> 반영 -> 평가) 수행

 

 

반응형
저작자표시 비영리 변경금지 (새창열림)

'AI > (PJT)음성 화자 분류' 카테고리의 다른 글

COPS-KMeans (Constrained Over-Partitioning Spectral K-Means)  (0) 2025.03.20
MFCC (Mel-Frequency Cepstral Coefficients)  (1) 2025.03.20
신호 대 잡음비(SNR, Signal-to-Noise Ratio)  (0) 2025.03.20
'AI/(PJT)음성 화자 분류' 카테고리의 다른 글
  • COPS-KMeans (Constrained Over-Partitioning Spectral K-Means)
  • MFCC (Mel-Frequency Cepstral Coefficients)
  • 신호 대 잡음비(SNR, Signal-to-Noise Ratio)
코코도롱
코코도롱
    반응형
  • 코코도롱
    도롱이의 전자공학소
    코코도롱
  • 전체
    오늘
    어제
    • 분류 전체보기 (55) N
      • AI (11)
        • 데이터 전처리 (4)
        • 머신러닝 (2)
        • 딥러닝 (0)
        • (PJT)음성 화자 분류 (4)
      • SW (38) N
        • C++ (9)
        • 면접을 위한 CS 전공지식 노트 (24)
        • Django+Vue.js (0)
        • 이런저런 개발이야기 (1)
        • 갑자기 C코테를 봐야할때 (2)
        • RPI5 프로젝트 (1)
        • 트러블슈팅 (1) N
      • ESG (2)
        • 내가 쓰는 Assay (1)
        • 뉴스 스크랩 (1)
      • 반도체 (4)
        • 반도체 (3)
        • 슬기로운 학부생활 (1)
        • 회로 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    CS지식
    보고서 수식
    정리본
    반도체 물성
    페이징 기법
    word 수식
    메시지큐
    MySQL
    반도체 소자 공학
    반도체 공학
    운영체제
    면접을 위한 cs전공지식 노트
    데이터전처리 #데이터분석 #딥러닝 #머신러닝 #Pandas #Numpy #Python
    공백포함입력받기
    전공 지식
    os구조
    데이터분석 #데이터전처리 #결측치 #머신러닝 #딥러닝 #Pandas #DataFrame
    ios7계층
    LAN
    데이터분석 #머신러닝 #딥러닝 #데이터사이언스 #알고리즘 #데이터전처리
    입출력관리
    면접을 위한 CS 전공지식 노트
    홉바이홉
    c언어 입출력
    홉바이홉통신
    c io
    CRISP #CRISP-DM #데이터마이닝 #데이터분석 #데이터 #머신러닝 #딥러닝 #데이터전처리
    요약본
    파일입출력 #DataFrame불러오기
    ESG
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코코도롱
음성 화자 분류 시작하기
상단으로

티스토리툴바