요새 로컬 모델 돌리는 맛이 참 좋다. 지금 내 최애 로컬 모델은 단연 0528 Qwen3 8b다. 맥북 M2 Max에서도 충분한 속도로 돌아가고 내가 자주 질문하는 내용에 대해 뻘대답하는 케이스가 거의 없다.
음성인식은 요새 엔비디아 파라킷이 성능이 제일 좋다지만 솔직히 2년 전에 나온 위스퍼 모델로도 내 후진 영어 독일어 한국어 발음 다 잘 인식하고 아이폰에 임베딩해도 성능 잘 나오는 small Q5 잘 쓰고 있어서 더 조사하지 않고 있다.
음성합성은 얼마 전에 나온 Chatterbox가 최고다. 그전까지는 좀 비싼 OpenAI mini TTS 쓰고 있었는데 채터박스 써보고 바로 버렸다. 아직 영어만 되는 게 좀 아쉽지만 이 정도 품질이면 그냥 내가 영어로 들어도 된다. 엔비디아 L4 장비에서 10초짜리 음성 만드는데 제로샷 클로닝해도 4초라 스트리밍에 문제없고, 맥북에서 하면 16초쯤 걸려서 살짝 부담인 상태. 근데 어제 구글 클라우드에 엔비디아 L4 지원 들어갔고 Scale to zero도 있으니 이런 건 GCP에서 돌릴까 한다. 많이 써봐야 한 달에 $10 나오겠지.
물론 개발업무에는 로컬 모델 절대 안 쓴다. Claude Code에 Opus 4로 돈 플렉스 하면 된다. 내 입맛대로 설계 코딩 리팩토링까지 거의 완벽하게 해줘서 더 이상 바라는 게 없다. 이제 전직이 필요해보이니 각잡고 AI/ML 엔지니어로 다시 태어나야겠다. 아 조금 더 빨리 들어갈걸 너무 우려먹었네 🥹
Continue Reading
Discover more thoughts and insights
블라인드하며 인천공항 가는 길
아내님 픽업 차 인천공항 가면서 끄적이는 글 요며칠 계속 누워서 블라인드 한다. 카카오는 어제 평가결과 나와서 글이 아주 많은데 나랑 입장 비슷한 사람이 안 보여서 글은 안 쓴다. 잘못된 기대를 왜 이리 많이
xhoto 커플과 수원에서 작살 맛있는 곱창을 먹다
연중행사 빈도로 만나 식사를 함께 하는 xhoto 군 오늘은 xhoto 커플을 만나러 수원에 갔다. 2주전 갑준이 만나러 수원에 간 경험이 있어 자신감 만땅 차서 "거기 갈려면 양재역 환승주차장에서 버스타면
쉽게 몰입할 수 없는 이유
한창 무언가에 몰두해있을 때는 그것 말고는 아무것도 보이지 않는다. 그것에 대한 열정이 과거에 속한 기억들을 모두 일시적으로 제거했고 미래에 대한 걱정조차 둔감하게 만들었기 때문이다. 500개의 버그 중에 고작