-
[TIL] audio detecting, 푸리에변환, 사운드 파라미터, 주파수 도메인 공부Programming/Etc. 2023. 7. 26. 12:35
소리의 기본 원리
소리의 진폭, 주기, 주파수, 파형 (볼륨, 음정, 음색의 결정 원리) (tistory.com)
진폭 → amplitude = volume
주파수 → 높낮이 = pitch
빠를수록 고음
샘플레이트
오디오 데이터 추출 및 변환: ADC, 샘플링, 샘플레이트, 채널 (tistory.com)
아날로그 신호를 디지털 신호로 변환해야 하는데
연속한 신호를 작은 단위로 쪼개어서 변환해준다
ex)44100Hz = 1초에 44100 개로 쪼갬
오디오 파형과 푸리에 변환
오디오 파형 분석(FFT: 고속 푸리에 변환): Time Domain Data to Frequency Data (tistory.com)
실제의 소리는 사인파, 스퀘어파 같이 단일한 파형이 아니라
여러가지 파형이 섞여진 형태이다.
(단일 파형은 전자적으로 만들어내는 소리, 자연계에는 존재하지 않음)
신기했던 것 :
진폭이 가장 큰 소리를 Fundamental Tone,
그것보다 작으면 Over Tone(=배음) 이라고 하는데
어떤 소리의 음정은 진폭이 가장 큰 소리의 주파수로 결정된다.
그러나
만일 모든 파형의 진폭 크기가 비슷하면
음정을 파악하기 어렵다. (ex 북소리, 백색소음, 노이즈)
노이즈 캔슬링의 원리
반대 진폭값을 가진 파형을 생성해서
노이즈 파형과 합성하면 진폭이 상쇄되는 원리
→ 노이즈의 주파수와 진폭 계산을 위해서 노이즈를 측정해야 함.
푸리에 변환
오디오 파형 분석(FFT: 고속 푸리에 변환): Time Domain Data to Frequency Data (tistory.com)
= 소리의 파형을 여러 개의 기본 파형으로 변환하는 알고리즘
어떤 합성 파형을 기본 파형으로 분해.
함수식이 sin, cos 항으로 나온다.
분해되어 나온 각 파형으로 정의 된 그래프가 주파수 도메인.
블로그에 첨부해주신 움짤이 이해하는 데 정말정말 도움이 되었다!!
시간 도메인은 항상 보던 포맷이라 직관적인 이해가 잘 되었는데
주파수 도메인은 이해가 잘 안 되었다.
가로축이 파형이라고 생각하면 이해가 쉬웠다.
💬
작곡을 하다보니 이런 사운드 파라미터에 대해서 직관적인 이해가 되었고
사운드 공부를 해보니 작곡에 대해 더 원리적으로 이해할 수 있을 것 같다.
비전만 하다가 사운드 공부는 처음 해보는데 신호처리라는게 비주얼하지 않아서 좀 어려웠다.
+ 추가
제목을 sound ▶ audio로 바꿨다.
sound의 의미는 좀 더 아날로그 적인 소리 그 자체를 의미한다. 음파의 파동이나 진동으로 만들어지는 것.
audio는 이것을 디지털 형태로 저장된 것이다.
그래서 "sound detection" 보다는 "audio detection"이 더 명확한 의미이다.
역시...개발자 필수 역량은 영어이다..........
키워드를 무엇으로 서치하느냐에 따라 찾을 수 있는 정보의 양 또한 달라진다.
'Programming > Etc.' 카테고리의 다른 글
티스토리에 수식 추가하는 방법(간단버전) (0) 2023.11.29 [PuTTY] 윈도우에서 리눅스로 ssh 접속하는 프로그램 (0) 2023.06.28 개발자 멘토링 내용 정리 (0) 2023.05.18 인공지능 개발을 일정기간 중단하자는 제안? (0) 2023.03.31 프롬프트 엔지니어 (0) 2023.03.17