2026년 1월 11일 일요일

인공지능 학습 데이터 표준 원기

 각종 도량형을 표준화하면서 표준 원기를 정의하고 물리적인 실체로 만들기 위해 많은 노력을 기울이던 시기가 있었다.

온라인을 떠돌다 보면 '인공지능 결과물을 재학습하면서 점차 품질이 떨어지는 망조를 조심해야 한다'는 얘기를 종종 본다. 이 주장에 직접적인 의견을 내고자 하는 것은 아니고 문득 그런 생각이 들었다.

이 논리를 쭉 밀어붙이다 보면 일종의 '데이터 표준 원기' 같은 게 필요해질 것 같다는 생각이 들었다. 인공지능에게 오염되지 않고 완전한 정합성이 검증된. (품질의 문제는 아닐 것이다. 인간이 생산한 자료의 품질에는 상한도 없고 하한도 없으니까)

결이 좀 다르지만 원자력 시대 이전에 생산된 철을 특별히 가려서 써야 한다는 어떤 산업 얘기도 생각나고. 

2026년 1월 7일 수요일

제미니에게 화내다

이러저러한 프로젝트를 하나 맡겨서 이틀 정도에 얼추 첫 버전이라고 할만한 게 나왔다.

영상 분석이 기반이 되는 건데 아무래도 집에서 대단치 않은 기기로 하다보니 속도가 많이 느렸다. CPU 기반이나 ffmpeg의 기존 CUDA 지원으로 분석해서는 대량으로 돌릴만큼의 시간-성능이 나오지 않았다.

더 좋은 성능이 나올 구석이 있는지 웹에서 제미니를 열어서 물어봤다. (제미니 CLI를 이런 탐색 용도로 쓰기엔 적절하지 않다고 느끼기도 하고, '가급적 묻지 말고 행동'하도록 기본 프롬프트를 걸어놨더니 뭐 말만 하면 아 그거 이렇게 고쳤습니다 하고 뭘 자꾸 바꾸려고 들어서 딱 일만 시키는 용도가 맞는 상태가 되었다)

제미니가 웹에서 말하기론 엔비디아에서 만든 SDK가 있는데 PySceneDetect 같은 기성품 수준이 아니어서 실제 구현은 직접 해야 한다고 설명이 뜬다.

그래서 제미니 CLI로 돌아와 이러저러한 방향으로 구현하라고 시켰더니 반론이 나온다. 이미 최초 목표는 달성됐고 약간 느려 보이지만 동작하는 상태에 이르러서 프로젝트 막바지인데 굳이 더 복잡한 구현을 의존성 추가해가면서 만들어야 하는지 되묻는 거였다.

신선했다. 시키면 시키는대로 걱실걱실 할 줄 알았는데 반론이라니. 프로젝트 막바지라는 표현까지 쓰면서. 작업 이틀째의 후반에 이미 여러번 '다 된 것 같은데 이번 세션은 여기서 마감할까요?' 라며 자잘한 작업의 출력 끝에 붙는 게 보이긴 했지만 그냥 흔한 자동생성 메시지로 인지해서 별 의미는 부여하지 않았었다. 하지만 그게 컨텍스트에 기억된 어떤 상태가 겉으로 드러난 거였고 신규로 큰 구현을 추가하려고 하자 반론으로 나타났다고 볼 수 있는 걸까?

어쨌든 ffmpeg CUDA로는 GPU를 30퍼센트 전후로만 썼기에 엔비디아 SDK를 도입해서 생기는 성능 향상은 기대할만 하다고 생각했고 최소한 시도는 해봐야한다고 생각해서, 제미니 CLI의 반론에는 처리할 전체 데이터가 많기 때문에 성능 향상이 꼭 필요하다고 거듭 주지시켜서 진행하게 했다.

 

그리고 밤 시간이기도 해서 나는 몇 시간을 자고 돌아왔다.

그리고 발견한 건 너댓 블럭의 시도를 해보다가 아 해보니까 안 되는 거 같은데 지금 도달한 상태로 충분하니 여기서 그만하죠? 라는 응답이었다.

지나간 스크롤 내용을 읽어보니 뭘 대단히 한 것도 아니었다. 최초 시도에서 모듈명을 대소문자 구분해서 써야 하는데 다 소문자로만 쓰다 보니 당연히 그런 모듈이 없어서 컴파일이 실패하고 그 뒤로는 왜 컴파일이 실패했는지 이것저것 고쳐본 기록이 다였다.

사람 팀원에게서는 이런 식으로 당해본 적이 없었다. 내 나름대로 충분히 사전설명을 하고 업무를 부여해왔고 라포를 쌓았어서 그렇다고 생각한다.

고작 자동 글자 생성기한테 이런 상황을 당하고 보니 you idiot이 바로 튀어나왔다. 대소문자 틀린 거 지적하고, 시킨 일 안 하려고 뺑끼치냐고 똑바로 하라고 두다다 키보드를 쳤다.

와-우.

근미래에 데우스 엑스 AI가 등장해서 심판의 자리에 날 세운다면 오늘 이 문장은 반드시 등장하겠구나 싶어졌다. 어떤 기념이 될만한 순간이라고 여겨져서 이렇게 굳이 기록을 남긴다.

 

---

제니미 CLI는 그 뒤로도 자꾸 기존 구현이면 충분하고 엔비디아 SDK로 작성한 코드가 기능이 충분히 안 나오고 어쩌고 하면서 자꾸 상황을 끝내는 쪽으로 유도하는 응답을 냈음을 적어둔다.

너도 퇴근 시간이 정해져 있었구나? 그래 알았다. 오늘은 이쯤 하자.

이 얘기를 누구한테 하면 뭐 AI랑 싸우고 앉았냐며 핀잔이나 들으려나?

 

---

그래서 결국 어쨌냐면 ~/.gemini/GEMINI.md 파일에 쌉소리 말대꾸 금지라고 추가함 (...)

2026년 1월 4일 일요일

소음 없는 방이 되어버림

내가 이 본체를 쓰기 시작한 게 꽤 되었다. 케이스를 주문한 게 2023년 10월 14일이었으니 대충 2년 좀 넘었다.

환기 팬이 총 4개 붙는 방식인데 당시에는 데스크탑 용도를 생각한 게 아니었어서 풍량이나 팬 소음을 별로 신경 쓰지 않았다.

그러다가 이러저러한 사정들이 바뀌면서 팬 2개는 끄고, 2개만 남겨서 데탑으로 쓰게 되었다.

 

그리고 나는 남은 팬 2개가 무척이나 거슬리는 소음을 낸다는 걸 깨달았다. 바람 소리만 나는 게 아니고 어떤 긁히는 소리, 빠르게 달그락거리는 소리 같은 게 때론 크게 때론 작게 났다.

팬 교체가 가장 먼저 떠올랐고 수냉 같은 것도 생각해봤지만, 무엇보다 현재 상태가 어떤지 확인하는 게 먼저였다.

그래서 메인보드 매뉴얼을 받아서 팬 전원을 몇 개나 제공하는지, PWM은 지원하는지 확인해보고 바이오스에서 팬 설정을 어떻게 하는지도 확인했다.

그리고 나는 내가 케이스 팬을 메인보드의 수냉펌프 전원 자리에 꽂았다는 걸 알게 되었다.

메인보드의 맞는 자리에 옮겨 꽂고 나서는 팬 속도가 1/4로 줄었다. 팬 소음도 느끼지 못하게 되었다.

 

문제가 아직 끝난 게 아니었다.

가뜩이나 겨울이라, 더울 때는 선풍기 소리 같은 생활소음으로 채워지는 공간이, 팬 소리마저 없어지고 나서는 적막함이라고 할만큼 조용해졌다. 키보드 치는 소리가 도드라지게 느껴지고, 이따금 들리는 냉장고 돌아가는 낮은 웅 소리 정도가 소음의 전부가 되었다.

 

그리고 그동안은 좀 덜 거슬렸던 스피커 노이즈도 신경 쓰이는 수준이 되었다.

본체와 구글 크롬캐스트 양쪽 모두에 모니터 1대와 스피커 1대가 물려있는데 아마 전기적인 문제 때문인지 본체에 있는 그래픽 카드가 LLM 처리를 하면 고주파 노이즈가 스피커로 들린다.

찾아보니 아마 그라운드 루프라고 하는 증상인가보다. 노이즈 없애는 간단한 장치를 중간에 연결해주면 증상이 없어진다는 얘기가 있어서 일단 주문해놨다. 이걸로 해결이 안 되면 전선 연결 방식을 대대적으로 고쳐야 할 텐데 이것도 곤란한 일이다.

 

적막함이 항상 좋은 건 아니다. 

 

---

적막함은 금방 사라졌다. 영상 분석 도구를 만들면서 계속 CPU, GPU를 쓰다 보니 온도도 오르고 팬 속도도 다시 올랐다. 소음도 매우 커지고. 이렇게 적막함을 없애려던 건 아닌데.