1. YOLOv7
기존에 v5 라지 모델을 파인 튜닝해 사용했는데,
기대했던 속도나 정확도에는 못미쳐서 새롭게 파인튜닝을 다시 진행하고 있다.
이전에 진행할때 깨달은 바를 이용해, 기존 데이터를 그대로 이용하되,
전처리나 형식들을 일괄적으로 적용해 36만장을 이용해 Train-Val을 진행 중이다. (validation 20%)
1 에폭에 1시간 정도 소요되는데 이전보다는 학습 속도나 성능은 지표상 괜찮아 보인다.
실시간에 가까운 수준으로 적용할 예정이므로, 정확도도 중요하지만 인퍼런스 타임이 더 빠르게 동작하고
검출률도 향상되면 목표는 달성했다고 볼 수 있을꺼 같다.
2. 음악 감정 분류
가사나 BPM 등을 이용해 음악의 감정을 분류하는 레퍼런스는 존재하는데,
오디오 자체만 가지고 감정을 분류하는 레퍼런스는 거의 없는거 같다.
데이터를 수집하고 음원만 가지고 감정을 분류하는 모델을 생성해야 할 꺼 같은데,
어떤 데이터를 어떻게 수집해야할지 모르겠다..
3. Stable Diffusion
Hugging Face를 이용해 Stable Diffusion을 테스트 해봤다.
인퍼런스 타임이 5초 내외로 생각했던거보다는 상당히 빠른 편인데,
결과물의 화풍?이 일괄적이지 못해서 해당 문제를 해결해야 한다.
일단 Hugging Face에서 주장하듯이, 어플리케이션에 빠르게 모델을 적용할 수 있다는 장점은 확실히
좋은거 같다.
4. 진수법
엑셀의 열에서는, Z 다음에 AA로 넘어가는데,
이를 아스키 코드만을 이용해 int->char
, char->int
변환을 적용해볼려고 했었다.
근데 아스키 코드로는 일반화하기 어려운 상황에 도달했는데, 26진법을 이용해 일반화에 성공했다.
이와 관련해서는 따로 정리를 할 예정이다.
Comments powered by Disqus.