2025년 8월 22일 금요일

발 달린 가구 대통합

평면도에서 자리를 차지하는 가구를 4개에서 2개로 줄이려고 작업중이다.

 

우선 튼튼한 선반을 들여서 벽 한 면을 바닥부터 천장까지 다 쓸 수 있게 수납 공간을 만들고 컴퓨터 관련 장비들을 몰아넣고 모니터 위로 책도 밀어넣었다.

거실장 tv장 에어컨장 거실수납장 티비장식장 티비대 오픈장 거실책장 우드인테리어 - 한솔홈 

모양은 다르지만 이 구도랑 비슷하겠다.

 

이것만 해도 장점은 뚜렷하다. 책장이 따로 있을 때는 어쩐지 눈길을 많이 타지 않아서 먼지만 쌓여가는 쓸쓸한 공간이었는데 지금은 어쨌든 가장 오래 시야가 닿는 방향이 책도 같이 있다보니 책에 시야가 더 간다.

스피커도 기존에는 선을 최대한 길게 써서 공간 전체의 좌우에 두었는데 이번에 저 사진과 비슷하게 모니터 좌우로 배치를 바꿨고 스피커가 허용하는 입력단자를 총동원해서 3개 장치의 입력을 한 번에 틀어둘 수 있게 정리했다. AUX선에서 잡음이 실릴까 걱정했는데 아예 없진 않지만 평소에 인지하지 못할 정도여서 다행히도 문제없이 일단락 지었다. 

그리고 모니터 앞쪽으로는 원래 책상으로 쓰던 테이블에서 상판만 뜯어내서 아래 위 모두 접을 수 있게 경첩을 달았다. 평면도 상의 공간 차지를 가급적 줄이려던 거라 이 단계가 필수였다. 원래 계획하던 공정은 다 적용했지만 편의성이 좀 아쉬운 부분들이 있어서 나중에 쿨타임 차면 다시 손댈 것 같다. 

 

한편으로는 잡동사니 수납장을 새로 정립해야 한다. 그동안은 이런저런 자잘한 물건들이 쌓이면 무턱대고 버리지는 못하고 박스에 차곡차곡 모아두곤 했는데 1x년째 그러고 있다보니 그런 박스들도 꽤 모여버렸다. 종종 버릴 건 버린다지만 수납 자체도 다시 생각해볼 때가 되었다.

책장이 있던, 눈에 덜 띄고 발길도 덜 가는 공간으로 수납장을 밀어넣고 거기에 이것저것 소코반을 해야 한다.

 

전에 쓰던 책장은 나무 합판을 간단하게 조립한 물건인데 이번에 다 해체해버렸다. 원래는 이사 자주 다닐 때 매번 책을 책장에서 꺼내고 묶고 풀고 다시 넣는 과정을 하지 않으려고 큰 책장 대신 작은 책장을 여러 개 올려서 썼는데 이젠 종이책 자체를 버리면 버렸지 더 늘릴 생각은 없으니 나무 조립식 책장도 버릴 때가 되었다.

풀어낸 합판들은 원래 계획으로는 수납장에 덧대서 나무 느낌을 내볼까 하는 생각도 있었는데 그러기엔 손도 더 가고 나무색과 벽색이 잘 맞을지도 의문이라 버리는 쪽으로 기울고 있다.

2025년 8월 12일 화요일

영상 분석을 AI가 이렇게 잘 해주면

영상 분석이 필요한 개인 프로젝트를 구상한지 오래 되었다. 완결된 뭔가가 나온 적은 없지만 그동안 꾸준히, 자전거로 치자면 뒷바퀴 바퀴살은 무슨 재질로 몇 개나 붙여야 주행에 좋을지, 체인은 어느 정도 팽팽해야 하는지, 핸들은 평평해야 할지 구부려야 할지, 혹시 앞바구니를 당장은 아니지만 나중에는 붙이고 싶은데 미래를 위해 프레임 모양을 어떻게 만들어야 할지 부분부분 구상과 기술 검토는 해왔다.

 

영상 분석에서 초반에 문제가 됐던 건 결국 그 정확도였다. 흥미로 하는 개인 프로젝트고 다뤄야할 영상이 폭발적으로 늘지는 않기 때문에 속도는 크게 중요하지 않았다. 초기에는 TensorFlow에 있는 이미지 분류 같은 걸 돌려서 거기서 나온 텍스트 더미로 그 다음 단계를 어떻게 해야 하나 궁리하는 정도였다. 텍스트 결과물이 만족스럽거나 하진 않았지만 어쨌든 일단 다음 진행단계를 밟아야 유의미한 진척이 생기기 때문에 한 눈 질끈 감고 정확도가 낮으면 나중에 다시 돌아보자고 생각했었다.

그리고 얼마 전 드디어 (나로서는) 놀라운 결과물을 내주는 도구를 찾았다. AI 모델을 로컬에서 실행해주는 ollama에 qwen25vl:7b 모델을 붙여서 일련의 이미지를 먹이면 내가 얻고자 했던 이미지의 특성들을 착착 뽑아준다. 이 비전 모델을 실행하려면 갖춰야될 GPU 메모리 크기가 약간 장벽이지만 원하는 결과물이 나오는 이상 그 정도는 문제가 안 된다.

ollama를 처음 접했을 때 느꼈던 가능성, AI 관련 각종 기술과 용어들을 따라가지 못해서 어쩌지 하는 막막함이 ollama 같은 걸 그냥 블랙박스로 두고 그동안 쭉 해왔던 것처럼 API로 호출해서 잘 활용해주면 업무 현장에 여전히 내 역할이 있겠구나 하는 납득으로 바뀐 그 느낌이 이번에도 비슷하게 온다. 이거라면 예전에 텍스트까지만 수작업으로 직접 구현하고 이미지는 적당한 검사 서비스 제공자를 못 찾아서 결국 포기했던 성인물 검사도 상당한 수준으로 만들어낼 수 있을 것 같다.

 

물론 모든 난관이 한방에 해소된 건 아니다. 영상 분석의 앞뒤로 이어져야 할 프레임 추출 등의 작업들을 위해 MCP를 활용하려고 찾아봤는데 비전 모델이 MCP 연동까지 지원하지 않기도 하고, 요즘 추세가 여러 모델을 혼합해서 쓴다고도 하고, 아예 A2A라고 기능 단위의 에이전트들끼리 통신하는 게 필요하다고도 한다. 아주 단순화해서 이해하자면 사람이 수동으로 하는 걸 MCP라는 이름으로 모델에서 넘기고 필요하면 IPC 같은 게 되게 한다는 거다. 그럴듯하게 들리긴 하는데 아직 필수라고 느껴지진 않아서 일단 수동으로 때워야 할 부분 같다.

또 ollama는 임베딩 기능을 텍스트에만 지원해서 영상으로 다른 비슷한 영상을 찾게 하는 건 다른 구현을 통해야 할 것 같다. ollama 같이 모델 돌려주는 역할을 하는 다른 동네에서는 된다는 얘기가 보이니 찾아보면 해결은 될 것 같다.